Para garantizar que estamos implementando responsablemente los modelos de clase Mythos, estamos requiriendo retención de datos limitada y revisión como parte de nuestro trabajo de seguridad. Los mensajes enviados a los modelos de clase Mythos y los resultados generados por estos se retienen durante 30 días para propósitos de confianza y seguridad, en todas las plataformas donde se ofrecen estos modelos.
Esto se aplica a los modelos de clase Mythos y a futuros modelos con capacidades similares que designamos como modelos cubiertos. Para todos los otros modelos, todo lo que uses no se ve afectado y permanece bajo los términos actuales.
Esta política, descrita a continuación, entra en vigor el 9 de junio de 2026. Para más información sobre el modelo de amenaza para datos retenidos y controles de privacidad asociados, consulta el correspondiente documento técnico en nuestro Centro de Confianza.
A quién se aplica esto
Los planes de consumidor (Claude Free, Pro y Max) en nuestras aplicaciones web, de escritorio y móviles, incluyendo Claude.ai y Claude Code, no se ven afectados por esta actualización, ya que ya retenemos entradas y salidas para propósitos de seguridad en estas superficies. Obtén más información sobre cómo retenemos datos para planes de consumidor.
Este cambio solo se aplica a organizaciones que han configurado espacios de trabajo con retención cero de datos (ZDR) en Claude Console, usan Claude Code con ZDR en Claude Enterprise, o acceden a Claude a través de AWS Bedrock, Google Cloud Agent Platform, o Microsoft Foundry con ZDR. El resto de este artículo se aplica solo a estas organizaciones.
Por qué estamos haciendo esto
Claude Mythos 5 representa un aumento sustancial en las capacidades del modelo, algunas de las cuales pueden usarse tanto para propósitos benignos como maliciosos. Claude Fable 5 comparte el mismo modelo subyacente que Claude Mythos 5, pero con salvaguardas adicionales, particularmente en los dominios cibernético y biológico. Aunque estas salvaguardas nos permiten compartir esta inteligencia de manera más amplia, estamos adoptando un enfoque conservador que nos permite buscar patrones de mal uso con esta clase de modelo. Algunos ataques solo se hacen visibles a través de múltiples solicitudes. El jailbreaking de mejor-de-N, por ejemplo, envía cientos de variaciones leves de un mensaje con la esperanza de que una funcione. Patrones más grandes de mal uso, como espionaje patrocinado por el estado o campañas de extorsión de datos, solo surgen cuando nuestros clasificadores de salvaguardas pueden ampliar la vista a través de muchas solicitudes. Detectar estas amenazas requiere retener temporalmente mensajes y resultados para que puedan analizarse juntos, en lugar de uno a la vez.
Cómo protegemos tus datos
Los empleados de Anthropic no pueden acceder a tus conversaciones a menos que estén marcadas por daño grave potencial o a solicitud escrita de un cliente. Estas revisiones solo pueden ser realizadas por un pequeño conjunto de revisores aprobados a través de herramientas que previenen exportación, copia o descarga. Cada instancia de acceso se registra en un registro a prueba de manipulación que los revisores no pueden suprimir o modificar. Después de 30 días, los datos se eliminan automáticamente, excepto en los casos raros donde es parte de una investigación de seguridad o estamos legalmente obligados a mantenerlo. Las organizaciones elegibles también tienen la opción de agregar claves de cifrado administradas por el cliente y registros de auditoría de transparencia de acceso.
Anthropic mantiene un programa de seguridad de la información documentado con medidas técnicas y organizacionales que están diseñadas para proteger la seguridad, confidencialidad e integridad de los datos del cliente. Nuestro programa basado en riesgos está construido para y evoluciona para defenderse contra modelos de amenaza conocidos y anticipados y se prueba regularmente. Para más información, consulta el documento técnico en nuestro Centro de Confianza.
Esto es lo que los líderes de seguridad están diciendo sobre nuestro enfoque:
"Databricks permite a las empresas construir agentes que razonan sobre datos críticos, y los nuevos modelos de frontera de Anthropic ayudan a nuestros clientes a hacerlo de manera más efectiva. Al evolucionar continuamente sus salvaguardas para que coincidan con las nuevas capacidades del modelo, Anthropic está haciendo posible que cada uno de nosotros escale la inteligencia de manera responsable. Apoyamos fuertemente la iniciativa de Anthropic de traer esta nueva clase de salvaguardas a la industria."
- Fermin Serna, CISO de Databricks | "La confianza en el ecosistema financiero depende de una seguridad sólida, y Stripe ha utilizado IA durante años para ayudar a fortalecer nuestras defensas en nombre de nuestros clientes. A medida que la IA de frontera se vuelve mejor en encontrar vulnerabilidades de seguridad, se vuelve más importante asegurar que esas capacidades se usen defensivamente. Anthropic está estableciendo un estándar sólido para Mythos al proporcionar transparencia en el manejo y retención de datos."
- Matthew Kemelhar, CISO de Stripe |
¿Qué, si es que algo, necesito configurar?
Este cambio solo se aplica a organizaciones que han configurado espacios de trabajo con retención cero de datos (ZDR) en Claude Console, usan Claude Code con ZDR en Claude Enterprise, o acceden a Claude a través de AWS Bedrock, Google Cloud Agent Platform, o Microsoft Foundry con ZDR. Para todas las otras organizaciones, no hay cambio y no hay nada que configurar. El resto de esta sección es para organizaciones que acceden a Claude sin retención de datos hoy y necesitan configurar retención de datos para usar modelos designados cuando estén disponibles.
Si tus desarrolladores usan la API de Claude
Directamente desde Anthropic a través de Claude Platform: Activa la retención para los espacios de trabajo donde deseas usar modelos cubiertos en la consola de desarrollador (Workspace > Manage > Privacy Controls). Tus otros espacios de trabajo habilitados para ZDR mantienen ZDR. Consulta el Centro de Confianza de Anthropic para documentación.
A través de Claude Platform en AWS: La retención funciona de la misma manera que la API de Claude directo. Se configura a nivel de espacio de trabajo, y los datos retenidos se manejan por Anthropic bajo los mismos controles.
A través de Amazon Bedrock: La retención deberá estar habilitada para acceder a tu nuevo modelo cubierto, y los datos retenidos permanecen en tu entorno de AWS. Cuando los modelos estén disponibles, se compartirán detalles de incorporación.
A través de Google Cloud Agent Platform: La retención deberá estar habilitada para tu nuevo modelo cubierto, y los datos retenidos permanecen en tu entorno de GCP. Cuando los modelos estén disponibles, se compartirán detalles de incorporación.
A través de Claude en Azure Foundry: La retención se configura para cada Suscripción de Azure. Si tienes Retención Cero de Datos configurada, entonces necesitarás crear y usar una Suscripción de Azure separada para acceder a estos modelos.
Si tu equipo usa Claude Code
A través de la API de Anthropic: Las prácticas de manejo de datos de Claude Code se rigen por el espacio de trabajo en el que opera. Si ese espacio de trabajo tiene retención habilitada, Claude Code puede usar modelos designados. Para desarrolladores que inician sesión directamente, habilita la retención en el espacio de trabajo de Claude Code de tu organización.
A través de Amazon Bedrock o Google Cloud Agent Platform: Claude Code usa tus credenciales en la nube, por lo que sigue la configuración de retención del entorno de tu nube. La retención debe estar habilitada en tu entorno de nube, y los datos retenidos permanecen en el entorno de tu proveedor. Lo mismo se aplica a Cowork accedido a través de Amazon Bedrock o Google Cloud Agent Platform.
A través de Claude Enterprise con ZDR: Estamos lanzando controles en la consola de administración para que tu Propietario Principal pueda cambiar la configuración de retención directamente. Si prefieres no tocar tu organización de producción aún, podemos ayudarte a configurar una organización de sandbox separada.
Si tu equipo usa Claude chat o Cowork a través de Claude for Enterprise
Estas superficies ya operan con retención estándar, por lo que tendrás acceso a los nuevos modelos a medida que estén disponibles.
