更新 6月12日: Claude Fable 5 へのアクセスを一時停止しました。詳細はこちら。
この記事では、リクエストがブロックされる理由、会話が別の Claude モデルに切り替わるときに何が起こるか、および自動切り替えを管理する方法について説明します。
一部のリクエストがブロックされる理由
Claude Fable 5 の機能は、これまでに一般公開したすべてのモデルの機能をはるかに上回っています。ほぼすべてのテスト済みの AI 機能ベンチマークで最先端であり、ソフトウェアエンジニアリング、知識作業、ビジョン、その他多くの分野で優れたパフォーマンスを発揮しています。
このような高度な機能を持つモデルをリリースするには、リスクが伴います。強力なセーフガードがなければ、Claude Fable 5 のサイバーセキュリティと生物学などの分野での高度な機能は、ユーザーが大規模なサイバー攻撃や生物兵器を作成するために悪用される可能性があり、壊滅的な被害をもたらす可能性があります。これらの機能が、以前に Mythos クラスのモデル (Mythos Preview など) を少数の選別・審査済みパートナーにのみリリースした理由です。
これらのリスクを認識し、一般ユーザーが Fable 5 の大部分の機能にアクセスできるようにするために、当社は利用規約および許容使用ポリシーに沿って、特定の分野でのレスポンスをブロックするセーフガードを備えたモデルをリリースしました。
Fable 5 のこれらのセーフガードによってブロックされたほとんどのユーザークエリは、代わりに次に高度な Claude Opus 4.8 モデルからレスポンスを受け取ります。当社は、これらのセーフガードをより識別力を高め、ターゲティングリスクに直接関連するモデルの使用を正確にブロックし、今日よりも誤検知を減らすために取り組んでいます。
どのリクエストがブロックされるか
Claude Fable 5 は、すべてのユーザーリクエストに対して自動安全チェックを実行します。これらのチェックは、4 つの分野でリクエストをブロックすることを目的としています。
エクスプロイト、マルウェア、攻撃ツールの構築など、攻撃的なサイバーセキュリティ技術
ラボ方法や分子メカニズムなどの生物学および生命科学クエリ
モデルの要約された思考の抽出
分散トレーニングインフラストラクチャ、ML アクセラレータ設計、特定の非標準チップ用のカーネル開発など、限定的なフロンティア LLM 開発タスク
これらのブロッキングセーフガードは意図的に広範です。これらは、認可されたセキュリティテストや良性の生物学研究を含む、これらの分野での正当な作業をブロックする可能性があり、バイオテック事業文書、医療画像診断、臨床および診断医療質問、または生物学の基本的な教育コンテンツなど、これらのトピックにのみ触れる通常の安全な会話もブロックする可能性があります。
チェックはまた、最新のメッセージだけでなく、モデルが読むすべてのもの (メモリ、コネクタからのコンテンツ、ウェブ検索結果、ファイルなど) を確認するため、入力していないコンテンツによってブロックがトリガーされる可能性があります。
ブロック後に何が起こるか
デフォルトでは、自動モデル切り替えは Claude、Claude Cowork、Claude Code、Claude Design、および Claude for Microsoft 365 で有効になっています。モデルを自動的に切り替える場合、Claude は、ブロックされた Claude Fable 5 リクエストを同じ会話で Claude Opus 4.8 で再実行します。モデルが切り替わったことを説明する通知が表示され、レスポンスは回答したモデルでラベル付けされます。Opus は強力なセーフガードを備えた高度に有能なモデルであり、Fable 5 でブロックされたほとんどの正当なリクエスト (ほとんどの生物学の質問を含む) に対して、Opus は有用な回答を提供するはずです。
切り替え後、モデルピッカーは会話の残りの部分で Opus に留まります。モデルピッカーからいつでも Claude Fable 5 に戻すことができます。
注: 自動モデル切り替えが発生した後に Claude Fable 5 に戻す場合、元のリクエストがまだ会話の一部であるため、同じ Fable 5 セーフガードが会話を再度ブロックする可能性があることに注意してください。再試行する前に前のメッセージを編集することがしばしば役立ちます。
リクエストが Opus でもブロックされた場合
Opus には独自のセーフティシステムがあります。リクエストが Opus でもブロックされた場合は、メッセージを編集して再試行できます。サイバーの場合、ユースケースが正当な防御目的を持っており、これらのセーフガードの影響を受けている場合は、Opus の Cyber Verification Program (CVP) に申請できます。リアルタイムサイバーセーフガードと Cyber Verification Program の詳細をご覧ください。
自動モデル切り替えを管理する
自動切り替えは、Claude Fable 5 を初めて選択するときにデフォルトで有効になります。デフォルトで有効なままで、いつでもオフにできます。
設定 > 機能 (または Claude Code の Config > MODEL & OUTPUT) に移動します。
メッセージがフラグされたときにモデルを切り替える をオフにします。
自動モデル切り替えをオフにすると、ブロックされたリクエストはモデルを切り替えるのではなく、会話を一時停止します。その後、以下のことができます。
メッセージを編集して Claude Fable 5 で再試行する
同じメッセージを手動で Opus に送信する
使用量と請求
ブロックされたリクエストは、ブロックが発生するタイミングに応じて異なる方法で請求されます。
入力でブロック: Claude Fable 5 が出力を生成する前にリクエストがブロックされた場合、会話は直ちに Opus に切り替わります。Opus レートでのみ請求され、Opus レスポンスは使用量制限または消費量にカウントされます。
ストリーム中にブロック: リクエストがストリーム中にブロックされた場合、入力とブロック前にストリームされたトークンは Claude Fable 5 レートで請求されます。残りのレスポンスは Opus レートで請求されます。
フィードバックを送信する
ブロックされたリクエストがセキュリティまたは生物学のトピックに関連していないように見える場合、または正当な作業がこれらの分野で継続的にブロックされている場合は、お知らせください。「フィードバックを送信」を使用して報告してください。誤ってブロックされたリクエストの報告は、これらのセーフガードを絞り込み、改善するのに役立ちます。
更新をお待ちください
今後、デュアルユース サイバー防御および生物学研究の割り当てを開く方法を検討する予定です。安全システムが成熟するにつれて、悪用に対する強力な保護を維持しながら、正当な生物学および防御的なサイバーセキュリティ作業をサポートすることを目指しています。
適格性と申請方法を含むプログラムの詳細については、利用可能になったときに共有します。このヘルプセンターで更新を確認するか、ここで通知にサインアップしてください。
自動モデル切り替えが適用される場所
自動モデル切り替えは、Claude Fable 5 を使用できるすべての場所で同じように機能します。
ウェブ上の Claude
Claude モバイル
Claude デスクトップ
Claude Cowork
Claude Code
Claude Design
Claude for Microsoft 365
Claude for Teams
Slack の Claude
重要: Claude API を使用している場合、モデル切り替えは異なる方法で機能します。自動切り替えは自動ではなく、API ユーザーは API で切り替えをオプトインして構成する必要があります。詳細については、開発者ドキュメントを参照してください。
Claude Fable 5 の詳細については、当社のブログをご覧ください。Claude Fable 5 と Claude Mythos 5。
