跳至主要內容

Claude Code 中的模型、使用情況和限制

今日已更新

本指南說明您正在使用的模型、使用情況如何計量,以及如何在上下文和使用限制內保持長時間會話。


使用情況如何計量

您的登入方式決定了使用情況的計量方式。無論如何,Claude Code 的其他所有行為都是相同的。

您登入方式為…

您獲得

「用完」的樣子

Claude Enterprise 席位(透過 /login

您組織方案中包含的使用量池,在滾動時間窗口上重設。

「已達到限制,將在 時間 重設」訊息。

API 金鑰(Console、Bedrock 或 Vertex)

按使用量付費,按代幣計費至該雲端或 Console 帳戶。

無硬性停止;帳戶按其使用量計費。

如果您使用 Enterprise 席位登入,通常在達到限制之前無需考慮代幣。如果您使用 API 金鑰,/cost 命令會顯示目前會話的執行支出。


選擇模型

隨時執行 /model 以查看您帳戶可用的模型,並在它們之間切換。作為粗略指南:

  • Sonnet 是預設值,也是大多數編碼工作的正確選擇。它速度快、功能強大且具有成本效益。

  • Opus 為更難的問題(例如大型跨領域重構、困難的除錯或架構決策)提供更深入的推理。它會消耗更多的配額,因此在需要時切換到它,而不是預設保持開啟。

  • Haiku 是最快且最便宜的選項,非常適合快速查詢、簡單編輯或大量指令碼執行。

您可以在會話中途更改模型,而不會遺失對話。常見的模式是使用 Opus 進行規劃,使用 Sonnet 執行。

注意:確切的模型名稱、版本和可用性會隨時間變化。/model 命令始終是您帳戶的真實來源。


實際消耗代幣的內容

每個回合向模型發送三項內容:

  1. 到目前為止的對話 — 此會話中的每條先前訊息。

  2. 專案上下文 — 您的 CLAUDE.md 和 Claude 已讀取的任何檔案。

  3. 您的新提示。

其中,第一項增長最快。一個長除錯會話,其中 Claude 已讀取二十個檔案並產生十五個差異,在每個後續訊息上都會帶著所有這些。這是成本和上下文限制的來源。


管理上下文視窗

上下文視窗是模型一次可以考慮的最大文字量。Claude Code 顯示其滿度的即時指示器。當它填滿時,Claude 無法清楚地看到對話的最舊部分,品質會下降。

兩個命令可以控制它:

  • /clear 清除對話並重新開始。您的 CLAUDE.md 和專案檔案保持可用;只有聊天記錄被移除。每當您切換任務時使用此命令,因為它是品質和成本的最有效槓桿。

  • /compact 將到目前為止的對話總結為簡短摘要,釋放空間同時保留基本上下文。當您在執行任務中途並需要繼續時使用此命令。Claude Code 在您接近限制時也會自動壓縮,因此您很少會遇到硬牆。

經驗法則:開始新任務時使用 /clear,繼續長時間任務時使用 /compact


五個習慣可以最大化您的使用量

幾乎每個「我在午餐時間前用完了限制」的報告都可以追溯到以下五個之一。

1. 在任務之間清除

每條先前的訊息都會在每個回合上重新發送,因此一個經歷過三個不相關問題的會話在每條新訊息上都會為所有三個付費。實際上:您剛剛完成了除錯登入重定向,現在想要編寫資料庫遷移。先執行 /clear。一個簡單的測試:如果您的下一個提示在全新終端中完全有意義,請在發送前清除。您的 CLAUDE.md 和專案檔案保持不變;只有聊天記錄消失。一個警告:/clear 無法撤銷。如果您可能仍然需要歷史記錄中的內容,請先複製出來或改為執行 /compact,它會保留摘要而不是清除所有內容。

2. 將模型與工作相匹配

Opus 每個回合的成本是 Sonnet 的數倍,Sonnet 的成本是 Haiku 的數倍。在日常工作上花費 Opus 是耗盡每日限制的最快方式。合理的預設值:大多數編碼使用 Sonnet(功能、測試、已知錯誤、重構);當您真正卡住或變更範圍很廣時使用 Opus(困難的除錯、跨領域重構、架構決策);快速機械工作使用 Haiku(重新命名、日誌行、正規表達式說明、樣板)。

3. 指向檔案而不是貼上它們

您貼上的任何內容都會在上下文中完整保留,用於會話的其餘部分。按路徑參考檔案可讓 Claude 有選擇地讀取並專注於您關心的部分。實際上:不要貼上 auth.ts,而是寫「查看 @src/auth.ts 中的 validateToken 函數」。對於日誌和堆疊追蹤,在貼上前修剪為相關的 20 或 30 行。對於任何大型內容(lockfiles、建置日誌、資料轉儲),將其放在磁碟上並參考路徑。

4. 保持 CLAUDE.md 精簡

此檔案會在每個回合前置,因此其成本會乘以您發送的訊息數。一個 300 行的 CLAUDE.md 在 40 個回合的會話中是 12,000 行輸入,您在執行任何工作之前已經為其付費。規則:兩次罷工,一個螢幕。只有在您必須第二次糾正 Claude 同一件事時才添加註記(第一次問題通常是一次性的)。永遠不要讓檔案超過大約 80 到 100 行的單一螢幕;如果有新內容需要進入且沒有空間,舊內容必須出去。何時更新:在您必須在同一件事上糾正 Claude 兩次的會話之後。那時修復是新鮮的,只需一分鐘就能寫下來。每隔幾週,閱讀整個檔案並刪除任何不再為真或您無法記住其目的的內容。陳舊的註記比遺漏的註記更糟,因為它們會主動誤導 Claude。

5. 在大型變更前要求計畫

計畫成本幾百個代幣。一個錯誤的 400 行差異,您撤銷並重新生成,成本數千,兩次,加上解釋出了什麼問題的回合。實際上:對於涉及兩個或三個以上檔案的任何內容,切換到計畫模式或只是問:「在更改任何內容之前,列出您將觸及的檔案以及您在每個檔案中將執行的操作。」閱讀列表,用純英文糾正它(「跳過 legacy/,暫時不要觸及測試」),然後讓它執行。

專業提示:使用 Opus 進行規劃,使用 Sonnet 執行。Opus 的最高價值用途是編寫計畫本身,其中更深入的推理確實有回報。一旦存在良好的計畫,執行大多是機械性的,Sonnet 以成本的一小部分處理它。工作流程:/model opus,要求計畫,審查並糾正它,然後 /model sonnet 和「執行上面的計畫」。切換模型不會清除對話,因此 Sonnet 仍然可以看到 Opus 產生的所有內容。


達到限制時該怎麼辦

  • Enterprise 席位使用者:訊息會告訴您視窗何時重設。同時,您可以使用 /model 切換到更輕的模型,或者,如果您的組織允許,暫時回退到 API 金鑰。

  • API 金鑰使用者:沒有使用量上限,但如果支出是一個問題,請檢查 /cost 和您的 Console 或雲端提供商儀表板。意外高數字幾乎總是可以追溯到從未清除過的非常長的會話。

  • 上下文視窗已滿(這與使用限制不同):執行 /compact 以繼續,或如果不再需要較舊的歷史記錄,執行 /clear


快速參考

命令

它的作用

/model

查看並切換可用的模型。

/cost

顯示此會話的代幣和美元使用情況(API 計費)。

/clear

開始新的對話(專案記憶保留)。

/compact

總結歷史記錄以釋放上下文。

/context

檢查目前載入到上下文中的內容。

是否回答了您的問題?