音声入力を使用すると、Office エージェントを使用する際に、テキストを入力する代わりに、プロンプトを音声で話すことができます。チャット入力のマイクアイコンをクリックして話すと、話した内容がコンポーザーにリアルタイムで表示されます。
音声入力は、Claude に直接サインインする組織で利用できます。ゲートウェイ、Vertex AI、Bedrock などのサードパーティ認証で Office エージェントが構成されている場合は利用できません。詳細については、以下を参照してください。
仕組み
マイクをクリックすると、Office エージェントはオーディオを Anthropic の文字起こしサービスにストリーミングします。これは Claude アプリの音声入力を支える同じインフラストラクチャです。文字起こしされたテキストはコンポーザーにリアルタイムで表示されます。マイクをもう一度クリックして停止するか、Enter キーを押して停止と送信を同時に行います。
デバイス上で文字起こしは行われず、オーディオはサードパーティサービスに送信されません。オーディオは Anthropic のインフラストラクチャ上で完全に処理され、保持されません。コンポーザーに残るのは、結果のテキストのみです。
音声入力を使用する
チャット入力の右側のマイクアイコンをクリックします。プレースホルダーがリッスン中...に変わり、ボタンが青くなります。
プロンプトを話します。話した内容がコンポーザーにリアルタイムで表示されます。
マイクをもう一度クリックして停止するか、Enter キーを押して停止と送信を同時に行います。
別のマイクを選択するには、マイクアイコンにマウスを合わせて、表示される矢印をクリックします。
サードパーティ認証で音声入力が利用できない理由
サードパーティ環境では、Office エージェントはプロンプトを Anthropic に直接送信しません。音声オーディオは実質的にプロンプトであるため、音声入力は提供されていません。サードパーティ環境で音声入力が必要な場合は、代わりにオペレーティングシステムまたは Office アプリケーションに組み込まれている音声入力機能を使用してください。
