この記事では、リクエストがブロックされる理由、会話が別の Claude モデルに切り替わるときに何が起こるか、および自動切り替えを管理する方法について説明します。
一部のリクエストがブロックされる理由
Claude Fable 5 の機能は、これまでに一般公開されたすべてのモデルの機能をはるかに上回っています。ほぼすべてのテスト済み AI 機能ベンチマークで最先端であり、ソフトウェアエンジニアリング、知識作業、ビジョン、その他多くの分野で優れたパフォーマンスを発揮しています。
このような高度な機能を持つモデルをリリースすることにはリスクが伴います。強力なセーフガードがなければ、Claude Fable 5 のサイバーセキュリティと生物学などの分野における高度な機能は、ユーザーが大規模なサイバー攻撃や生物兵器を作成するために悪用される可能性があり、壊滅的な被害をもたらす可能性があります。これらの機能が、Mythos クラスのモデル(Claude Fable 5 など)を少数の選別・審査済みパートナーにのみリリースしてきた理由です。
これらのリスクを認識し、一般ユーザーが Fable 5 の大部分の機能にアクセスできるようにするために、サイバーセキュリティと生物学を含む特定の分野での応答をブロックするセーフガードを備えてモデルをリリースしました。
これらのトピックに関するほとんどのユーザークエリは、代わりに次に高度な Claude Opus 4.8 モデルからの応答を受け取ります。これらのセーフガードをより識別力のあるものにするために取り組んでおり、最終的には壊滅的なリスクに直接関連するモデルの使用のみを正確にブロックし、今日よりも誤検知を減らすことを目指しています。
どのリクエストがブロックされるか
Claude Fable 5 はすべてのユーザーリクエストに対して自動安全チェックを実行します。これらのチェックは、3 つの分野でリクエストをブロックすることを目的としています。
エクスプロイト、マルウェア、攻撃ツールの構築など、攻撃的なサイバーセキュリティ技術
ラボ方法や分子メカニズムなどの生物学および生命科学クエリ
モデルの 要約された思考の抽出
これらのセーフガードは意図的に広範です。認可されたセキュリティテストや無害な生物学研究など、これらの分野での正当な作業、および生物工学ビジネスドキュメント、医療画像と診断、臨床および診断医療質問、または生物学の基本的な教育コンテンツなど、これらのトピックにのみ触れる通常の安全な会話をブロックする可能性があります。
チェックはまた、最新のメッセージだけでなく、モデルが読むすべてのもの(メモリ、コネクタからのコンテンツ、ウェブ検索結果、ファイルを含む)を確認するため、入力していないコンテンツによってブロックがトリガーされる可能性があります。
ブロック後に何が起こるか
デフォルトでは、自動モデル切り替えは Claude、Claude Cowork、Claude Code、Claude Design、および Claude for Microsoft 365 で有効になっています。この場合、Claude はブロックされた Claude Fable 5 リクエストを同じ会話で Claude Opus 4.8 で再実行します。モデルが切り替わったことを説明する通知が表示され、応答には回答したモデルのラベルが付けられます。Opus は強力な機能を備えた高度なモデルであり、独自の強力なセーフガードを備えており、Fable 5 でブロックされたほとんどの正当なリクエスト(ほとんどの生物学の質問を含む)に対して、Opus は有用な回答を提供する必要があります。
切り替え後、モデルピッカーは会話の残りの間 Opus に留まります。モデルピッカーからいつでも Claude Fable 5 に戻すことができます。
注:何も変更せずに戻した場合、元のリクエストがまだ会話の一部であるため、同じセーフガードが会話を再度ブロックする可能性があります。再試行する前にメッセージを編集することがしばしば役立ちます。
リクエストが Opus でもブロックされた場合
Opus には独自のセーフティシステムがあります。リクエストが Opus でもブロックされた場合は、メッセージを編集して再試行できます。サイバーの場合、ユースケースが正当な防御目的を持っており、これらのセーフガードの影響を受けている場合は、Opus のサイバー検証プログラム(CVP)に申請できます。リアルタイムサイバーセーフガードとサイバー検証プログラムについて詳しく知る。
自動モデル切り替えを管理する
自動切り替えは、Claude Fable 5 を初めて選択するときにデフォルトで有効になります。デフォルトで有効なままで、いつでもオフにできます。
設定 > 機能(または Claude Code の Config > MODEL & OUTPUT)に移動します。
メッセージがフラグされたときにモデルを切り替えるをオフにします。
自動モデル切り替えがオフの場合、ブロックされたリクエストはモデルを切り替える代わりに会話を一時停止します。その後、以下のことができます。
メッセージを編集して Claude Fable 5 で再試行する
同じメッセージを手動で Opus に送信する
使用量と請求
ブロックされたリクエストは、ブロックが発生するタイミングに応じて異なる方法で請求されます。
入力でブロック:Claude Fable 5 が出力を生成する前にリクエストがブロックされた場合、会話は直ちに Opus に切り替わります。Opus レートでのみ請求され、Opus 応答は使用制限または消費量にカウントされます。
ストリーム中にブロック:リクエストがストリーム中にブロックされた場合、入力とブロック前にストリームされたトークンは Claude Fable 5 レートで請求されます。残りの応答は Opus レートで請求されます。
フィードバックを送信する
ブロックされたリクエストがセキュリティまたは生物学のトピックに関連していないように見える場合、または正当な作業がこれらの分野で継続的にブロックされている場合は、お知らせください。「フィードバックを送信」を使用して報告してください。誤ってブロックされたリクエストの報告は、これらのセーフガードを絞り込み、改善するのに役立ちます。
アップデートに注目してください
今後、デュアルユース防御サイバーセキュリティと生物学研究の割り当てを開く方法を検討する予定です。安全システムが成熟するにつれて、正当な生物学および防御的なサイバーセキュリティ作業をサポートしながら、悪用に対する強力な保護を維持することを目指しています。
プログラムの詳細(適格性と申請方法を含む)が利用可能になったら、詳細を共有します。このヘルプセンターでアップデートを確認するか、ここで通知にサインアップしてください。
自動モデル切り替えが適用される場所
自動モデル切り替えは、Claude Fable 5 を使用できるすべての場所で同じように機能します。
ウェブ上の Claude
Claude モバイル
Claude デスクトップ
Claude Cowork
Claude Code
Claude Design
Claude for Microsoft 365
Claude for Teams
Slack の Claude
重要:Claude API を使用している場合、モデル切り替えは異なる方法で機能します。自動切り替えは自動ではなく、API ユーザーは API で切り替えをオプトインして構成する必要があります。詳細については、開発者ドキュメントを参照してください。
Claude Fable 5 の詳細については、ブログをご覧ください。Claude Fable 5 と Claude Mythos 5。
