Anthropic

Claude Sonnet 4.5 incluye protecciones de <a href="https://www.anthropic.com/news/activating-asl3-protections" rel="nofollow noopener noreferrer" target="_blank">Nivel de Seguridad de IA 3 (ASL-3)</a> diseñadas para prevenir el mal uso relacionado con armas químicas, biológicas, radiológicas y nucleares (CBRN). Estas medidas de seguridad incluyen filtros llamados clasificadores que detectan entradas y salidas potencialmente peligrosas.

Los filtros de seguridad de Sonnet 4.5 están diseñados para prevenir la asistencia en tareas relacionadas con armas CBRN (Químicas, Biológicas, Radiológicas y Nucleares). Si recibiste un mensaje de error, los filtros detectaron contenido que coincidía con patrones asociados a estas amenazas específicas.

Estos filtros aún se están refinando y pueden marcar inadvertidamente contenido normal en ocasiones. Como en cualquier sistema automatizado, pueden ocurrir falsos positivos, lo que significa que consultas legítimas pueden ser marcadas incorrectamente ocasionalmente. Estamos trabajando activamente para mejorar la precisión de estos clasificadores para minimizar las interrupciones mientras se mantiene la seguridad.

Si crees que tu mensaje está bloqueado en respuesta a un uso legítimo, tienes varias opciones:

Evita patrones que desencadenen falsos positivos

Los clasificadores son sensibles a ciertos patrones que pueden asemejar intentos de jailbreak u técnicas de ofuscación:

Evita contenido similar a cifrado: Las cadenas codificadas en Base64, hashes de commits de git, secuencias hexadecimales y otros datos codificados pueden desencadenar los filtros. Si necesitas incluir tal contenido, incluye contenido que lo rodee para explicar cómo y por qué se utiliza.

- Evita contenido similar a cifrado: Las cadenas codificadas en Base64, hashes de commits de git, secuencias hexadecimales y otros datos codificados pueden desencadenar los filtros. Si necesitas incluir tal contenido, incluye contenido que lo rodee para explicar cómo y por qué se utiliza.

Simplifica las instrucciones: Los prompts del sistema excesivamente largos o complejos que incluyen lógica condicional intrincada pueden asemejar intentos de ofuscar el comportamiento. Mantén los prompts <a href="https://docs.claude.com/en/docs/build-with-claude/prompt-engineering/overview" rel="nofollow noopener noreferrer" target="_blank">claros y directos</a>.

- Simplifica las instrucciones: Los prompts del sistema excesivamente largos o complejos que incluyen lógica condicional intrincada pueden asemejar intentos de ofuscar el comportamiento. Mantén los prompts <a href="https://docs.claude.com/en/docs/build-with-claude/prompt-engineering/overview" rel="nofollow noopener noreferrer" target="_blank">claros y directos</a>.

Ten cuidado con contenido relacionado con biología: Si tu aplicación no requiere específicamente información biológica o química, considera reformular las solicitudes para evitar estos temas cuando sea posible.

- Ten cuidado con contenido relacionado con biología: Si tu aplicación no requiere específicamente información biológica o química, considera reformular las solicitudes para evitar estos temas cuando sea posible.

Continúa con Claude Sonnet 4: Puedes cambiar a Claude Sonnet 4 para el resto de la conversación, que utiliza diferentes medidas de seguridad y puede ser capaz de ayudarte con tu solicitud.

- Continúa con Claude Sonnet 4: Puedes cambiar a Claude Sonnet 4 para el resto de la conversación, que utiliza diferentes medidas de seguridad y puede ser capaz de ayudarte con tu solicitud.

Envía comentarios: Puedes hacernos saber tus comentarios nos ayudan a mejorar la precisión del filtro.

- Envía comentarios: Puedes hacernos saber tus comentarios nos ayudan a mejorar la precisión del filtro.

Edita tu mensaje: Puedes intentar reformular tu pregunta o proporcionar contexto adicional sobre tu caso de uso legítimo.

- Edita tu mensaje: Puedes intentar reformular tu pregunta o proporcionar contexto adicional sobre tu caso de uso legítimo.

A medida que los modelos de IA se vuelven más capaces, requieren protecciones más fuertes contra el mal uso potencial. Las medidas de implementación de ASL-3 de Sonnet 4.5 son parte de la <a href="https://www.anthropic.com/news/activating-asl3-protections" rel="nofollow noopener noreferrer" target="_blank">Política de Escalado Responsable</a> de Anthropic, que asegura que los modelos cada vez más capaces tengan salvaguardas apropiadas.

Los filtros están diseñados específicamente para prevenir flujos de trabajo CBRN extendidos de extremo a extremo que podrían plantear riesgos catastróficos. No están destinados a bloquear discusiones científicas generales, contenido educativo o información comúnmente disponible.

Para investigadores y aplicaciones de doble uso

Si estás trabajando en investigación científica y necesitas acceso para propósitos legítimos, hemos establecido sistemas de control de acceso para usuarios verificados. Contacta a nuestro <a href="https://support.claude.com">equipo de soporte</a> para obtener más información.

Entendiendo los Filtros de Seguridad de Sonnet 4.5

Terms of Service - Consumer

Product

Research

Terms of Service - Commercial

Privacy Policy

Company

Usage Policy

News

Responsible Disclosure Policy

Careers

Compliance

Encuentra respuestas y obtén ayuda del servicio de Atención al cliente y de expertos de la comunidad de Intercom

Este sitio emplea cookies y otras tecnologías que nosotros y nuestros proveedores externos utilizamos para monitorizar y registrar datos personales sobre ti y tus interacciones con el sitio (por ejemplo, contenidos vistos, movimientos del cursor, grabaciones de pantalla y contenidos del chat) para los fines descritos en nuestra Política de cookies. Al continuar en nuestro sitio, aceptas nuestros {websiteTermsLink}, {privacyPolicyLink} y {cookiePolicyLink}.

Este sitio utiliza cookies y tecnologías similares (“cookies”) que son estrictamente necesarias para su funcionamiento. Nosotros y nuestros socios también desearíamos instalar cookies adicionales para activar las funciones de análisis del rendimiento del sitio, funcionalidad, publicidad y redes sociales. Consulta nuestra {cookiePolicyLink} para más detalles. Puedes cambiar tus preferencias de cookies en nuestra Configuración de cookies.

Usamos cookies para el correcto funcionamiento de nuestro sitio y también con fines analíticos y publicitarios. Puedes activar o desactivar las cookies opcionales como prefieras. Consulta nuestra {cookiePolicyLink} para más información.

Tienes derecho a oponerte a la venta de tus datos personales. Consulta nuestra {cookiePolicyLink} para obtener más detalles sobre el uso que hacemos de tus datos.

Sus opciones de privacidad

Utilizamos cookies para mejorar tu experiencia. A continuación puedes personalizar tus preferencias o consultar nuestra {cookiePolicyLink} para más detalles.

Configuración de cookies

Enlace, Pulse control-opción-flecha derecha para salir

Centro de ayuda vacío

Oh, oh. Esa página no existe.

Decepcionado/a

Imparcial

Sonriente

Pensando...

Buscando en las fuentes...

Analizando...

Los tickets enviados por Messenger o por un agente de atención al cliente con el que mantengas una conversación aparecerán aquí.

No hay tickets creados por ti

Prueba a usar diferentes palabras clave o comprobar si hay errores tipográficos.

Prueba a usar diferentes palabras clave o filtros.

No se ha encontrado ningún ticket

Título

Haz un seguimiento del progreso de todos los tickets relacionados con tu empresa.

Entendiendo los Filtros de Seguridad de Sonnet 4.5

¿Por qué se bloqueó mi mensaje?

Qué puedes hacer

Evita patrones que desencadenen falsos positivos

Otras opciones

¿Por qué los filtros?

Para investigadores y aplicaciones de doble uso