Claude Sonnet 4.5 包含新的 AI 安全等級 3 (ASL-3) 保護措施,旨在防止與化學、生物、放射性和核 (CBRN) 武器相關的濫用。這些安全措施使用憲法分類器來監控輸入和輸出,以阻止一類狹義的有害內容。
為什麼我的 API 請求被阻止?
Sonnet 4.5 的安全過濾器專注於防止協助完成與 CBRN 武器相關的任務。如果您的請求被阻止,過濾器檢測到與這些特定威脅相關的內容模式。
這些過濾器仍在不斷改進中。與任何自動化系統一樣,誤報可能會發生——這意味著合法請求有時可能被錯誤地標記。我們正在積極改進這些分類器的精確度,以最大限度地減少干擾,同時保持安全性。
您可以採取的措施
如果您的 API 請求被阻止,以下是您可以採取的步驟:
避免觸發誤報的模式
分類器對某些可能類似於越獄嘗試或混淆技術的模式很敏感:
避免類似密碼的內容:Base64 編碼字符串、git 提交哈希、十六進制序列和其他編碼數據可能會觸發過濾器。如果您需要包含此類內容,請考慮它對您的使用案例是否必要。
簡化系統指令:過度冗長或複雜的系統提示,包含複雜的條件邏輯,可能類似於混淆行為的嘗試。保持系統指令清晰明了。
謹慎處理生物相關內容:如果您的應用程序不特別需要生物或化學信息,請考慮重新表述請求,以在可能的情況下避免這些主題。
切換到 Sonnet 4
在您的 API 調用中使用 Sonnet 4 而不是 Sonnet 4.5。Sonnet 4 使用不同的安全措施,可能能夠成功處理您的請求。
實施回退邏輯
在您的應用程序中構建錯誤處理,可以:
檢測請求何時被安全過濾器阻止。
自動重試以 Sonnet 4 作為回退。
記錄事件供您審查,以識別誤報中的模式。
提供反饋
如果您認為您的請求被錯誤地阻止,請聯繫我們的 API 支持團隊。您的反饋幫助我們提高過濾器準確性,並為合法使用案例減少誤報。
為什麼要使用新過濾器?
隨著 AI 模型變得更加強大,它們需要更強的保護措施來防止潛在的濫用。Sonnet 4.5 的 ASL-3 部署措施是 Anthropic 負責任擴展政策的一部分,該政策確保日益強大的模型具有適當的保護措施。
這些過濾器專門設計用於防止可能造成災難性風險的延長的端到端 CBRN 工作流程。它們不旨在阻止一般科學討論、教育內容或常見的可用信息。
針對研究人員和雙用途應用
如果您正在為科學研究或雙用途技術領域構建應用程序,並且出於合法目的需要訪問權限,我們已為經過審查的用戶建立了訪問控制系統。聯繫我們的 API 支持團隊以了解有關豁免的更多信息。