메인 콘텐츠로 건너뛰기

Claude가 Fable 5와의 대화에서 모델을 전환한 이유

이 문서는 요청이 차단될 수 있는 이유, 대화가 다른 Claude 모델로 전환될 때 어떤 일이 발생하는지, 그리고 자동 전환을 관리하는 방법을 설명합니다.

일부 요청이 차단되는 이유

Claude Fable 5의 기능은 이전에 일반에 공개한 모든 모델의 기능을 훨씬 능가합니다. AI 기능의 거의 모든 테스트된 벤치마크에서 최첨단이며, 소프트웨어 엔지니어링, 지식 작업, 비전 및 기타 많은 분야에서 뛰어난 성능을 보입니다.

이렇게 강력한 모델을 출시하는 것은 위험을 수반합니다. 강력한 보안 조치가 없으면 Claude Fable 5의 사이버보안 및 생물학 분야의 고급 기능이 사용자에 의해 악용되어 대규모 사이버 공격이나 생물무기를 만드는 데 사용될 수 있으며, 이는 재앙적인 피해를 초래할 수 있습니다. 이러한 기능이 우리가 이전에 Mythos급 모델(Claude Fable 5 포함)을 소수의 선별되고 검증된 파트너에게만 출시한 이유입니다.

이러한 위험을 인식하여 일반 사용자가 Fable 5의 대부분의 기능에 접근할 수 있도록 하기 위해, 우리는 사이버보안 및 생물학을 포함한 특정 분야에서 응답을 차단하는 보안 조치를 적용하여 모델을 출시했습니다.

이러한 주제에 대한 대부분의 사용자 쿼리는 대신 우리의 차선책 모델인 Claude Opus 4.8의 응답을 받게 됩니다. 우리는 이러한 보안 조치를 더욱 정교하게 만들기 위해 노력하고 있으며, 최종적으로는 재앙적 위험과 직접 관련된 모델 사용만 정확하게 차단하고 현재보다 거짓 양성이 적도록 하는 것을 목표로 하고 있습니다.

어떤 요청이 차단되는가

Claude Fable 5는 모든 사용자 요청에 대해 자동화된 안전 검사를 실행합니다. 이러한 검사는 세 가지 분야의 요청을 차단하기 위한 것입니다:

  • 익스플로잇, 악성코드 또는 공격 도구 구축과 같은 공격적인 사이버보안 기법

  • 실험실 방법 또는 분자 메커니즘과 같은 생물학 및 생명과학 쿼리

  • 모델의 요약된 사고 추출

이러한 보안 조치는 의도적으로 광범위합니다. 승인된 보안 테스트 및 무해한 생물학 연구를 포함한 이러한 분야의 정당한 작업, 그리고 이러한 주제에만 관련된 정상적이고 안전한 대화(예: 생명공학 비즈니스 문서, 의료 영상 및 진단, 임상 및 진단 의료 질문 또는 생물학의 기본 교육 콘텐츠)를 차단할 수 있습니다.

검사는 또한 모델이 읽는 모든 것을 검토합니다. 최신 메시지뿐만 아니라 메모리, 커넥터의 콘텐츠, 웹 검색 결과 및 파일을 포함하므로 입력하지 않은 콘텐츠로 인해 차단이 트리거될 수 있습니다.

차단 후 어떤 일이 발생하는가

기본적으로 자동 모델 전환은 Claude, Claude Cowork, Claude Code, Claude Design 및 Claude for Microsoft 365에서 활성화됩니다. 이 경우 Claude는 차단된 Claude Fable 5 요청을 같은 대화에서 Claude Opus 4.8에서 다시 실행합니다. 모델이 전환되었음을 설명하는 알림이 표시되고, 응답에는 답변한 모델의 레이블이 붙습니다. Opus는 자체 강력한 보안 조치를 갖춘 매우 능력 있는 모델이며, Fable 5에서 차단된 대부분의 정당한 요청(대부분의 생물학 질문 포함)에 대해 Opus는 도움이 되는 답변을 제공해야 합니다.

전환 후 모델 선택기는 대화의 나머지 부분에서 Opus에 유지됩니다. 모델 선택기에서 언제든지 Claude Fable 5로 다시 전환할 수 있습니다.

참고: 아무것도 변경하지 않고 다시 전환하면 원래 요청이 여전히 대화의 일부이기 때문에 동일한 보안 조치가 대화를 다시 차단할 수 있습니다. 다시 시도하기 전에 메시지를 편집하면 도움이 되는 경우가 많습니다.

요청이 Opus에서도 차단되는 경우

Opus는 자체 안전 시스템을 가지고 있습니다. 요청이 Opus에서도 차단되면 메시지를 편집하고 다시 시도할 수 있습니다. 사이버 분야의 경우, 사용 사례가 정당한 방어 목적을 가지고 있고 이러한 보안 조치의 영향을 받는 경우 Opus용 사이버 검증 프로그램(CVP)에 신청할 수 있습니다. 실시간 사이버 보안 조치 및 사이버 검증 프로그램에 대해 자세히 알아보세요.

자동 모델 전환 관리

자동 전환은 Claude Fable 5를 처음 선택할 때 기본적으로 활성화됩니다. 기본적으로 활성화된 상태로 유지되며 언제든지 끌 수 있습니다:

  1. 설정 > 기능(또는 Claude Code의 구성 > 모델 및 출력)으로 이동합니다.

  2. 메시지가 플래그되면 모델 전환을 끕니다.

자동 모델 전환이 꺼져 있으면 차단된 요청은 모델을 전환하는 대신 대화를 일시 중지합니다. 그러면 다음을 수행할 수 있습니다:

  • 메시지를 편집하고 Claude Fable 5에서 다시 시도

  • 같은 메시지를 수동으로 Opus에 전송

사용량 및 청구

차단된 요청은 차단이 발생하는 시기에 따라 다르게 청구됩니다:

  • 입력에서 차단됨: Claude Fable 5가 출력을 생성하기 전에 요청이 차단되면 대화가 즉시 Opus로 전환됩니다. Opus 요금으로만 청구되며 Opus 응답은 사용량 제한 또는 소비량에 포함됩니다.

  • 스트림 중 차단됨: 요청이 스트림 중에 차단되면 입력과 차단 전에 스트리밍된 토큰이 Claude Fable 5 요금으로 청구됩니다. 나머지 응답은 Opus 요금으로 청구됩니다.

피드백 제공

차단된 요청이 보안 또는 생물학 주제와 무관해 보이거나 이러한 분야의 정당한 작업이 계속 차단되는 경우 알려주세요. "피드백 보내기"를 사용하여 보고하세요. 잘못 차단된 요청에 대한 보고는 이러한 보안 조치를 좁히고 개선하는 데 도움이 됩니다.

업데이트를 기대하세요

앞으로 우리는 이중 용도 사이버 방어 및 생물학 연구를 위한 할당을 개방하는 방법을 고려할 계획입니다. 우리의 안전 시스템이 성숙해짐에 따라 우리는 정당한 생물학 및 방어적 사이버보안 작업을 지원하면서 오용에 대한 강력한 보호를 유지하는 것을 목표로 합니다.

프로그램에 대한 자격 및 신청 방법을 포함한 더 자세한 내용은 사용 가능해지면 공유하겠습니다. 이 도움말 센터에서 업데이트를 확인하거나 여기에서 알림에 등록하세요.

자동 모델 전환이 적용되는 위치

자동 모델 전환은 Claude Fable 5를 사용할 수 있는 모든 곳에서 동일한 방식으로 작동합니다:

  • 웹의 Claude

  • Claude 모바일

  • Claude 데스크톱

  • Claude Cowork

  • Claude Code

  • Claude Design

  • Claude for Microsoft 365

  • Claude for Teams

  • Slack의 Claude

중요: Claude API를 사용하는 경우 모델 전환이 다르게 작동합니다. 자동 전환은 자동이 아니며 API 고객은 API에서 전환을 선택하고 구성해야 합니다. 자세한 내용은 개발자 문서를 참조하세요.

Claude Fable 5에 대해 자세히 알아보려면 우리의 블로그를 읽으세요: Claude Fable 5 및 Claude Mythos 5.

답변이 도움되었나요?