この記事では、リクエストがブロックされる理由、会話が別の Claude モデルに切り替わるときに何が起こるか、および自動切り替えを管理する方法について説明します。
一部のリクエストがブロックされる理由
Claude Fable 5 の機能は、これまでに一般公開されたすべてのモデルの機能をはるかに上回っています。ほぼすべてのテスト済み AI 機能ベンチマークで最先端であり、ソフトウェア エンジニアリング、知識作業、ビジョン、その他多くの分野で優れたパフォーマンスを発揮しています。
このような高度な機能を持つモデルをリリースするには、リスクが伴います。強力なセーフガードがなければ、Claude Fable 5 のサイバーセキュリティと生物学などの分野での高度な機能は、ユーザーが大規模なサイバー攻撃や生物兵器を作成するために悪用される可能性があり、壊滅的な被害をもたらす可能性があります。これらの機能が、Mythos クラスのモデル(Claude Fable 5 など)を少数の選別・審査済みパートナーにのみリリースしてきた理由です。
これらのリスクを認識して、一般ユーザーが Fable 5 の大部分の機能にアクセスできるようにするために、サイバーセキュリティと生物学を含む特定の分野での応答をブロックするセーフガードを備えてモデルをリリースしました。
これらのトピックに関するほとんどのユーザー クエリは、代わりに次に高度な Claude モデルである Claude Opus 4.8 からの応答を受け取ります。これらのセーフガードをより識別力のあるものにするために取り組んでおり、最終的には壊滅的なリスクに直接関連するモデルの使用のみを正確にブロックし、今日よりも誤検知を減らすことを目指しています。
どのリクエストがブロックされるか
Claude Fable 5 は、すべてのユーザー リクエストに対して自動安全チェックを実行します。これらのチェックは、3 つの分野でリクエストをブロックすることを目的としています。
エクスプロイト、マルウェア、攻撃ツールの構築など、攻撃的なサイバーセキュリティ技術
ラボ方法や分子メカニズムなどの生物学および生命科学クエリ
モデルの 要約された思考 の抽出
これらのセーフガードは意図的に広範です。これらの分野での正当な作業(認可されたセキュリティ テストと無害な生物学研究を含む)、およびこれらのトピックにのみ触れる通常の安全な会話(バイオテック ビジネス ドキュメント、医療画像処理と診断、臨床および診断医療の質問、または生物学の基本的な教育コンテンツなど)をブロックする可能性があります。
チェックは、最新のメッセージだけでなく、モデルが読むすべてのもの(メモリ、コネクタからのコンテンツ、Web 検索結果、ファイルを含む)を確認するため、入力していないコンテンツによってブロックがトリガーされる可能性があります。
ブロック後に何が起こるか
デフォルトでは、自動モデル切り替えは Claude、Claude Cowork、Claude Code、Claude Design、および Claude for Microsoft 365 で有効になっています。この場合、Claude はブロックされた Claude Fable 5 リクエストを同じ会話で Claude Opus 4.8 で再実行します。モデルが切り替わったことを説明する通知が表示され、応答には回答したモデルのラベルが付けられます。Opus は強力な機能を備えた高度なモデルであり、独自の強力なセーフガードを備えており、Fable 5 でブロックされたほとんどの正当なリクエスト(ほとんどの生物学の質問を含む)に対して、Opus は有用な回答を提供できるはずです。
切り替え後、モデル ピッカーは会話の残りの部分で Opus に留まります。モデル ピッカーからいつでも Claude Fable 5 に戻すことができます。
注: 何も変更せずに戻した場合、元のリクエストがまだ会話の一部であるため、同じセーフガードが会話を再度ブロックする可能性があります。再試行する前にメッセージを編集することが役に立つことがよくあります。
リクエストが Opus でもブロックされた場合
Opus には独自のセーフティ システムがあります。リクエストが Opus でもブロックされた場合は、メッセージを編集して再試行できます。サイバーセキュリティの場合、ユースケースが正当な防御目的を持っており、これらのセーフガードの影響を受けている場合は、Opus の Cyber Verification Program(CVP)に申請できます。リアルタイム サイバー セーフガードと Cyber Verification Program の詳細をご覧ください。
自動モデル切り替えを管理する
自動切り替えは、Claude Fable 5 を初めて選択するときにデフォルトで有効になります。デフォルトで有効なままで、いつでもオフにできます。
設定 > 機能(または Claude Code の Config > MODEL & OUTPUT)に移動します。
メッセージがフラグされたときにモデルを切り替える をオフにします。
自動モデル切り替えをオフにすると、ブロックされたリクエストはモデルを切り替える代わりに会話を一時停止します。その後、以下のことができます。
メッセージを編集して Claude Fable 5 で再試行します
同じメッセージを手動で Opus に送信します
使用量と請求
ブロックされたリクエストは、ブロックが発生するタイミングに応じて異なる方法で請求されます。
入力でブロック: Claude Fable 5 が出力を生成する前にリクエストがブロックされた場合、会話は直ちに Opus に切り替わります。Opus レートでのみ請求され、Opus 応答は使用量制限または消費量にカウントされます。
ストリーム中にブロック: リクエストがストリーム中にブロックされた場合、入力とブロック前にストリームされたトークンは Claude Fable 5 レートで請求されます。残りの応答は Opus レートで請求されます。
フィードバックを送信する
ブロックされたリクエストがセキュリティまたは生物学のトピックに関連していないように見える場合、または正当な作業がこれらの分野で継続的にブロックされている場合は、お知らせください。「フィードバックを送信」を使用して報告してください。不正にブロックされたリクエストの報告は、これらのセーフガードを絞り込み、改善するのに役立ちます。
更新をお待ちください
今後、デュアルユース サイバー防御および生物学研究の割り当てを開く方法を検討する予定です。安全システムが成熟するにつれて、正当な生物学および防御的なサイバーセキュリティ作業をサポートしながら、悪用に対する強力な保護を維持することを目指しています。
プログラムの詳細(適格性と申請方法を含む)が利用可能になったら、詳細を共有します。このヘルプ センターで更新を確認するか、ここで通知にサインアップしてください。
自動モデル切り替えが適用される場所
自動モデル切り替えは、Claude Fable 5 を使用できるすべての場所で同じように機能します。
Web 上の Claude
Claude Mobile
Claude Desktop
Claude Cowork
Claude Code
Claude Design
Claude for Microsoft 365
Claude for Teams
Slack の Claude
重要: Claude API を使用している場合、モデル切り替えは異なる方法で機能します。自動切り替えは自動ではなく、API ユーザーは API で切り替えをオプトインして構成する必要があります。詳細については、開発者ドキュメントを参照してください。
Claude Fable 5 の詳細については、ブログをご覧ください。Claude Fable 5 と Claude Mythos 5。
