Claude Code 中的模型、使用方式和限制

本指南說明您使用的模型、使用方式的計量方式，以及如何在長時間會話中保持在上下文和使用限制內。

使用方式如何計量

您的登入方式決定了使用方式的計量方式。Claude Code 的其他所有功能行為方式都相同，無論如何登入。

您登入方式為…	您獲得	「用完」的樣子
Claude Enterprise 座位（透過 `/login`）	您組織方案中包含的使用量池，在滾動時間窗口上重設。	「已達到限制，將在時間重設」訊息。
API 金鑰（Console、Bedrock、Vertex 或 Microsoft Foundry）	按使用量付費，按權杖計費至該雲端或 Console 帳戶。	無硬性停止；帳戶按其使用量計費。

如果您使用 Enterprise 座位登入，通常在達到限制之前不需要考慮權杖。如果您使用 API 金鑰，/cost 命令會顯示目前會話的執行支出。

選擇模型

隨時執行 /model 以查看您帳戶可用的模型，並在它們之間切換。作為粗略指南：

Sonnet 是預設值，也是大多數編碼工作的正確選擇。它速度快、功能強大且具有成本效益。
Opus 為更難的問題（例如大型跨領域重構、困難的除錯或架構決策）提供更深入的推理。它會使用更多的配額，因此在需要時切換到它，而不是預設保持開啟。
Haiku 是最快且最便宜的選項，非常適合快速查詢、簡單編輯或大量指令碼執行。

您可以在會話中途更改模型，而不會遺失對話。常見的模式是使用 Opus 進行規劃，使用 Sonnet 執行。

注意：確切的模型名稱、版本和可用性會隨時間變化。/model 命令始終是您帳戶的真實來源。

實際消耗權杖的內容

每一輪都會向模型發送三件事：

到目前為止的對話 — 此會話中的每條先前訊息。
專案上下文 — 您的 CLAUDE.md 和 Claude 已讀取的任何檔案。
您的新提示。

其中，第一項增長最快。Claude 已讀取二十個檔案並產生十五個差異的長除錯會話在每個後續訊息上都會攜帶所有這些。這是成本和上下文限制的來源。

管理上下文視窗

上下文視窗是模型一次可以考慮的最大文字量。Claude Code 顯示其滿度的即時指示器。當它填滿時，Claude 無法清楚地看到對話的最舊部分，品質會下降。

兩個命令可以控制它：

/clear 清除對話並重新開始。您的 CLAUDE.md 和專案檔案保持可用；只有聊天記錄被移除。每當您切換任務時使用此命令，因為它是品質和成本的最有效槓桿。
/compact 將到目前為止的對話總結為簡短摘要，釋放空間同時保留基本上下文。當您在任務中途並需要繼續時使用此命令。Claude Code 在接近限制時也會自動壓縮，因此您很少會遇到硬牆。

經驗法則：開始新任務時使用 /clear，繼續長時間任務時使用 /compact。

五個習慣可以最大化您的使用量

幾乎每個「我在午餐時間前用完了限制」的報告都可以追溯到以下五個之一。

1. 在任務之間清除

每條先前的訊息都會在每一輪重新發送，因此經歷過三個不相關問題的會話在每條新訊息上都會為所有三個付費。

實際上：您剛剛完成了登入重定向的除錯，現在想要編寫資料庫遷移。先執行 /clear。簡單測試：如果您的下一個提示在全新終端中完全有意義，請在發送前清除。您的 CLAUDE.md 和專案檔案保持不變；只有聊天記錄消失。

一個警告：/clear 無法復原。如果您可能仍然需要歷史記錄中的內容，請先複製出來或改為執行 /compact，它會保留摘要而不是清除所有內容。

2. 將模型與工作相匹配

Opus 每輪的成本是 Sonnet 的數倍，Sonnet 的成本是 Haiku 的數倍。在日常工作上花費 Opus 是耗盡每日限制的最快方式。

合理的預設值：大多數編碼使用 Sonnet（功能、測試、已知錯誤、重構）；當您真正卡住或變更範圍很廣時使用 Opus（困難的除錯、跨領域重構、架構決策）；快速機械工作使用 Haiku（重新命名、日誌行、正規表達式說明、樣板）。

3. 指向檔案而不是貼上它們

您貼上的任何內容都會在上下文中完整保留，用於會話的其餘部分。按路徑參考檔案可讓 Claude 有選擇地讀取並專注於您關心的部分。

實際上：不要貼上 auth.ts，而是寫「查看 src/auth.ts 中的 validateToken 函式」— 提及路徑可讓 Claude 開啟並有選擇地讀取。（請注意，@ 前綴會將整個檔案及其 CLAUDE.md 樹注入上下文中，因此當您嘗試節省權杖時使用裸路徑。）對於日誌和堆疊追蹤，在貼上前修剪為相關的 20 或 30 行。對於任何大型內容（鎖定檔案、建置日誌、資料轉儲），將其放在磁碟上並參考路徑。

4. 保持 CLAUDE.md 精簡

此檔案會在每一輪前面加上。提示快取意味著第一輪之後的輪次按更便宜的快取讀取速率計費，因此美元成本低於原始行數建議的成本，但它仍然在每條訊息上佔用上下文視窗空間。

規則：兩次罷工，保持緊湊。只有在您必須在同一件事上更正 Claude 第二次時才新增註記（第一次問題通常是一次性的）。將檔案保持在大約 200 行以下；如果需要新增內容且沒有空間，舊內容必須移出。

何時更新它：在您必須在同一件事上更正 Claude 兩次的會話之後。那時修復是新鮮的，只需一分鐘就能寫下來。每隔幾週，閱讀整個檔案並刪除任何不再為真或您無法記住其目的的內容。過時的註記比遺漏的註記更糟，因為它們會主動誤導 Claude。

5. 在進行大型變更前要求計畫

計畫花費幾百個權杖。一個錯誤的 400 行差異，您復原並重新產生，花費數千個，兩次，加上解釋出錯的輪次。實際上：對於涉及兩個或三個以上檔案的任何內容，切換到計畫模式或只是詢問：「在變更任何內容之前，列出您將觸及的檔案以及您在每個檔案中將執行的操作。」閱讀清單，用純英文更正它（「跳過 legacy/，暫時不要觸及測試」），然後讓它執行。

專業提示：使用 Opus 進行規劃，使用 Sonnet 執行。Opus 的最高價值用途是編寫計畫本身，其中更深入的推理確實有回報。一旦存在良好的計畫，執行大多是機械性的，Sonnet 以成本的一小部分處理它。此模式內建為 /model opusplan，它在規劃時使用 Opus，在執行時使用 Sonnet。切換模型不會清除對話，因此 Sonnet 仍然可以看到 Opus 產生的所有內容。

達到限制時該怎麼辦

Enterprise 座位使用者：訊息會告訴您視窗何時重設。同時，您可以使用 /model 切換到更輕的模型，或者，如果您的組織允許，暫時回退到 API 金鑰。
API 金鑰使用者：沒有使用量上限，但如果支出是一個問題，請檢查 /cost 和您的 Console 或雲端提供者儀表板。意外高數字幾乎總是可以追溯到從未清除過的非常長的會話。
上下文視窗已滿（這與使用限制不同）：執行 /compact 以繼續，或如果不再需要較舊的歷史記錄，執行 /clear。

快速參考

命令	它的作用
`/model`	查看並切換可用的模型。
`/cost`	顯示此會話的權杖和美元使用量（API 計費）。
`/clear`	開始新的對話（專案記憶保留）。
`/compact`	總結歷史記錄以釋放上下文。
`/context`	檢查目前載入上下文中的內容。