Claude があなたとの Fable 5 との会話でモデルを切り替えた理由

この記事では、リクエストがブロックされる理由、会話が別の Claude モデルに切り替わるときに何が起こるか、および自動切り替えを管理する方法について説明します。

一部のリクエストがブロックされる理由

Claude Fable 5 の機能は、これまでに一般公開されたすべてのモデルの機能をはるかに上回っています。ほぼすべてのテスト済みの AI 機能ベンチマークで最先端であり、ソフトウェアエンジニアリング、知識作業、ビジョン、その他多くの分野で優れたパフォーマンスを発揮しています。

このような高度な機能を持つモデルをリリースすることには、リスクが伴います。強力なセーフガードがなければ、Claude Fable 5 のサイバーセキュリティと生物学などの分野における高度な機能は、ユーザーが大規模なサイバー攻撃や生物兵器を作成するために悪用される可能性があり、壊滅的な被害をもたらす可能性があります。これらの機能が、以前に Mythos クラスモデル（Mythos Preview など）を選別・審査されたパートナーの小数に限定してリリースしてきた理由です。

これらのリスクを認識して、一般ユーザーが Fable 5 の大多数の機能にアクセスできるようにするために、利用規約および許容使用ポリシーに沿った特定の分野での応答をブロックするセーフガードを備えてモデルをリリースしました。また、Claude Fable 5 の最初のリリース以来、セーフガードを改善し続けています。

Fable 5 のこれらのセーフガードによってブロックされたほとんどのユーザークエリは、代わりに次に最も高度なモデルである Claude Opus 4.8（つまり「フォールバック」）からの応答を受け取る可能性があります。これらのセーフガードをより識別力を高め、ターゲティングリスクに直接関連するモデルの使用を正確にブロックし、今日よりも誤検知を減らすことに取り組んでいます。

フォールバックする可能性のあるリクエスト

Claude Fable 5 はすべてのユーザーリクエストに対して自動化されたセーフティチェックを実行します。これらのチェックは、ユーザーが以下の 4 つの分野でリクエストを送信したときに、Fable 5 から非 Mythos モデル（例：Opus 4.8）に明らかにフォールバックすることを目的としています：

エクスプロイト、マルウェア、攻撃ツールの構築など、攻撃的なサイバーセキュリティ技術。Claude Fable 5 は日常的なサイバーセキュリティタスクを支援できますが、ユーザーは高いフォールバック率を予想する必要があります。セーフガードは Mythos レベルの機能へのアクセスをブロックするように設計されています。
ラボ方法や分子メカニズムなど、生物学、化学、生命科学クエリの大多数。近い将来、これは良性の生物学研究および関連トピック（バイオテク事業文書、医療画像処理と診断、臨床および診断医療質問、または生物学の基本的な教育コンテンツなど）を支援するモデルの能力に影響を与える可能性があります。
Fable 5 に対する蒸留攻撃。モデルの要約された思考を抽出しようとする試みを含みます。
分散トレーニングインフラストラクチャ、ML アクセラレータ設計、特定の非標準チップのカーネル開発など、限定的なフロンティア LLM 開発タスク。

これらのブロッキングセーフガードは意図的に広範であり、ユーザーエクスペリエンスへの影響を減らすためにセーフガードを継続的に改善するために取り組んでいます。リクエストがブロックされた場合、非 Mythos モデル（現在は Opus 4.8）にフォールバックする可能性があります。

チェックはモデルが読むすべてのもの（最新のメッセージだけでなく、メモリ、コネクタからのコンテンツ、ウェブ検索結果、ファイルを含む）を確認するため、入力していないコンテンツによってブロックがトリガーされる可能性があります。

ブロック後に何が起こるか

デフォルトでは、Claude、Claude Cowork、Claude Code、Claude Design、および Claude for Microsoft 365 で自動モデル切り替えがアクティブです。モデルを自動的に切り替えるとき、Claude はブロックされた Claude Fable 5 リクエストを同じ会話で Claude Opus 4.8 で再実行します。モデルが切り替わったことを説明する通知が表示され、応答には回答したモデルのラベルが付けられます。Opus は強力なセーフガードを備えた高度に有能なモデルであり、Fable 5 でブロックされたほとんどの正当なリクエストについては、Opus が役立つ回答を提供するはずです。

切り替え後、モデルピッカーは会話の残りの部分で Opus に留まります。モデルピッカーからいつでも Claude Fable 5 に戻すことができます。

注：自動モデル切り替えが発生した後に Claude Fable 5 に戻す場合、元のリクエストがまだ会話の一部であるため、同じ Fable 5 セーフガードが会話を再度ブロックする可能性があることに注意してください。再試行する前に前のメッセージを編集することがしばしば役立ちます。

リクエストが Opus でもブロックされた場合

Opus には独自のセーフティシステムがあります。リクエストが Opus でもブロックされた場合は、メッセージを編集して再試行できます。サイバーに関しては、ユースケースが正当な防御目的を持っており、これらのセーフガードの影響を受けている場合は、Opus のサイバー検証プログラム（CVP）に申請できます。リアルタイムサイバーセーフガードとサイバー検証プログラムについて詳しく知る。

自動モデル切り替えを管理する

自動切り替えは、Claude Fable 5 を初めて選択するときにデフォルトで有効になります。デフォルトで有効なままで、いつでもオフにできます：

設定 > 機能（または Claude Code の設定 > モデルと出力）に移動します。
メッセージがフラグされたときにモデルを切り替えるをオフにします。

自動モデル切り替えがオフの場合、ブロックされたリクエストはモデルを切り替える代わりに会話を一時停止します。その後、以下のことができます：

メッセージを編集して Claude Fable 5 で再試行
同じメッセージを手動で Opus に送信

使用量と請求

ブロックされたリクエストは、ブロックが発生するタイミングに応じて異なる方法で請求されます：

入力でブロック：Claude Fable 5 が出力を生成する前にリクエストがブロックされた場合、会話は直ちに Opus に切り替わります。Opus レートでのみ請求され、Opus 応答は使用制限または消費量にカウントされます。
ストリーム中にブロック：リクエストがストリーム中にブロックされた場合、入力とブロック前にストリームされたトークンは Claude Fable 5 レートで請求されます。応答の残りは Opus レートで請求されます。

フィードバックを送信

ブロックされたリクエストがセキュリティまたは生物学のトピックに関連していないように見える場合、または正当な作業がこれらの分野で継続的にブロックされている場合は、お知らせください。「フィードバックを送信」を使用して報告してください。不正にブロックされたリクエストの報告は、これらのセーフガードを絞り込み、改善するのに役立ちます。

更新を楽しみにしてください

今後、デュアルユースサイバー防御および生物学研究の割り当てを開く方法を検討する予定です。セーフティシステムが成熟するにつれて、正当な生物学および防御的なサイバーセキュリティ作業をサポートしながら、悪用に対する強力な保護を維持することを目指しています。

適格性と申請方法を含むプログラムの詳細については、利用可能になったときに共有します。このヘルプセンターで更新を確認するか、ここで通知にサインアップしてください。

自動モデル切り替えが適用される場所

自動モデル切り替えは、Claude Fable 5 を使用できるすべての場所で同じように機能します：

ウェブ上の Claude
Claude モバイル
Claude デスクトップ
Claude Cowork
Claude Code
Claude Design
Claude for Microsoft 365
Claude for Teams
Slack の Claude
Claude タグ

重要：Claude API を使用している場合、モデル切り替えは異なる方法で機能します。自動切り替えは自動ではなく、API ユーザーは API で切り替えをオプトインして構成する必要があります。詳細については、開発者ドキュメントを参照してください。

Claude Fable 5 の詳細については、ブログをご覧ください：Claude Fable 5 と Claude Mythos 5。