跳至主要內容

理解 Sonnet 4.5 的安全過濾器

本週已更新

Claude Sonnet 4.5 包含人工智能安全等級 3 (ASL-3) 保護措施,旨在防止與化學、生物、放射性和核 (CBRN) 武器相關的濫用。這些安全措施包括稱為分類器的過濾器,可檢測潛在危險的輸入和輸出。

為什麼我的訊息被封鎖?

Sonnet 4.5 的安全過濾器旨在防止協助 CBRN(化學、生物、放射性和核)武器相關任務。如果您收到錯誤訊息,表示過濾器偵測到與這些特定威脅相關的內容。

這些過濾器仍在改進中,有時可能會無意中標記正常內容。與任何自動化系統一樣,誤判可能會發生——這意味著合法查詢有時可能會被錯誤地標記。我們正在積極改進這些分類器的精確度,以最大限度地減少干擾,同時保持安全。

您可以做什麼

如果您認為您的訊息因合法使用而被封鎖,您有幾個選項:

避免觸發誤判的模式

分類器對某些可能類似於越獄嘗試或混淆技術的模式很敏感:

  • 避免類似密碼的內容:Base64 編碼字符串、git 提交雜湊、十六進制序列和其他編碼數據可能會觸發過濾器。如果您需要包含此類內容,請包含周圍的內容以說明其使用方式和原因。

  • 簡化指令:包含複雜條件邏輯的過長或複雜系統提示可能類似於混淆行為的嘗試。保持提示清晰明瞭

  • 謹慎處理生物相關內容:如果您的應用程式不特別需要生物或化學信息,請考慮重新表述請求,以在可能的情況下避免這些主題。

其他選項

  • 繼續使用 Claude Sonnet 4:您可以在對話的其餘部分切換到 Claude Sonnet 4,它使用不同的安全措施,可能能夠幫助您的請求。

  • 發送反饋:您可以讓我們知道,您的反饋幫助我們改進過濾器的準確性。

  • 編輯您的訊息:您可以嘗試重新表述您的問題或提供有關您合法使用案例的其他背景信息。

為什麼要使用過濾器?

隨著人工智能模型變得更加強大,它們需要更強的保護措施來防止潛在濫用。Sonnet 4.5 的 ASL-3 部署措施是 Anthropic 負責任擴展政策的一部分,該政策確保日益強大的模型具有適當的保護措施。

這些過濾器專門設計用於防止可能造成災難性風險的延長、端到端 CBRN 工作流程。它們旨在阻止一般科學討論、教育內容或常見信息。

針對研究人員和雙用途應用

如果您從事科學研究並需要出於合法目的進行訪問,我們已為經過驗證的用戶建立了訪問控制系統。請聯繫我們的支持團隊以了解更多信息。

是否回答了您的問題?