Anthropic

Ya sea que recién esté comenzando el proceso de configuración de salvaguardas para su implementación de API de Claude, o su implementación ya esté en funcionamiento, aquí hay algunas estrategias a considerar al crear su propio programa de seguridad de IA. Estas sugerencias están diseñadas para ayudarle a cumplir con nuestros <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Términos de Servicio</a> y <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Política de Uso</a>, que prohíben ciertos usos de Claude. El incumplimiento de los <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Términos</a> y la <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Política de Uso</a> puede resultar en la suspensión o terminación de su acceso a los servicios.

Almacene IDs vinculadas con cada llamada de API, de modo que si necesita identificar contenido violativo específico, tenga la capacidad de encontrarlo en sus sistemas.

Considere asignar IDs a los usuarios, lo que puede ayudarle a rastrear a individuos específicos que están violando la AUP de Anthropic, permitiendo acciones más específicas en casos de mal uso.

- La opción de <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">pasar IDs a Anthropic a través de la API</a> depende de usted. Pero, si se proporcionan, podemos identificar violaciones de manera más precisa. Para ayudar a proteger la privacidad de los usuarios finales, cualquier ID que se pase debe estar hasheado criptográficamente.

Considere requerir que los clientes se registren en una cuenta en su plataforma antes de utilizar Claude

Asegúrese de que sus clientes comprendan los usos permitidos

Advierta, limite la velocidad o suspenda a los usuarios que violen repetidamente los <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Términos de Servicio</a> y la <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Política de Uso</a> de Anthropic

- Almacene IDs vinculadas con cada llamada de API, de modo que si necesita identificar contenido violativo específico, tenga la capacidad de encontrarlo en sus sistemas.
- Considere asignar IDs a los usuarios, lo que puede ayudarle a rastrear a individuos específicos que están violando la AUP de Anthropic, permitiendo acciones más específicas en casos de mal uso.
  - La opción de <a href="https://docs.anthropic.com/claude/reference/messages_post#:~:text=models%20for%20details.-,metadata,object,-An%20object%20describing" rel="nofollow noopener noreferrer" target="_blank">pasar IDs a Anthropic a través de la API</a> depende de usted. Pero, si se proporcionan, podemos identificar violaciones de manera más precisa. Para ayudar a proteger la privacidad de los usuarios finales, cualquier ID que se pase debe estar hasheado criptográficamente.
- Considere requerir que los clientes se registren en una cuenta en su plataforma antes de utilizar Claude
- Asegúrese de que sus clientes comprendan los usos permitidos
- Advierta, limite la velocidad o suspenda a los usuarios que violen repetidamente los <a href="https://www.anthropic.com/legal/commercial-terms" rel="nofollow noopener noreferrer" target="_blank">Términos de Servicio</a> y la <a href="https://www.anthropic.com/legal/aup" rel="nofollow noopener noreferrer" target="_blank">Política de Uso</a> de Anthropic

Cree marcos de personalización que restrinjan las interacciones de los usuarios finales con Claude a un conjunto limitado de indicaciones o que solo permitan que Claude revise un corpus de conocimiento específico que ya posee, lo que disminuirá la capacidad de los usuarios de participar en comportamientos violativos.

Habilite filtros de seguridad adicionales - herramientas de moderación en tiempo real gratuitas creadas por Anthropic para ayudar a detectar indicaciones potencialmente dañinas y gestionar acciones en tiempo real para reducir el daño

- Para obtener más información sobre cómo habilitar nuestros filtros de seguridad adicionales, comuníquese con <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.

- Active su bucket privado de S3 para almacenar indicaciones y completaciones para su propia evaluación

- Cree marcos de personalización que restrinjan las interacciones de los usuarios finales con Claude a un conjunto limitado de indicaciones o que solo permitan que Claude revise un corpus de conocimiento específico que ya posee, lo que disminuirá la capacidad de los usuarios de participar en comportamientos violativos.
- Habilite filtros de seguridad adicionales - herramientas de moderación en tiempo real gratuitas creadas por Anthropic para ayudar a detectar indicaciones potencialmente dañinas y gestionar acciones en tiempo real para reducir el daño
  - Para obtener más información sobre cómo habilitar nuestros filtros de seguridad adicionales, comuníquese con <a href="mailto:usersafety@anthropic.com" rel="nofollow noopener noreferrer" target="_blank">usersafety@anthropic.com</a>.
- <i>Para Clientes de Bedrock:</i>
  - Active su bucket privado de S3 para almacenar indicaciones y completaciones para su propia evaluación

<a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Use Claude para su moderación de contenido</a>

Ejecute una API de moderación contra todas las indicaciones de usuarios finales antes de que se envíen a Claude para asegurar que no sean dañinas

- <a href="https://docs.anthropic.com/claude/docs/content-moderation" rel="nofollow noopener noreferrer" target="_blank">Use Claude para su moderación de contenido</a>
- Ejecute una API de moderación contra todas las indicaciones de usuarios finales antes de que se envíen a Claude para asegurar que no sean dañinas

Configure un sistema interno de revisión humana para marcar indicaciones que sean marcadas por Claude (siendo utilizado para moderación de contenido) o una API de moderación como dañinas para que pueda intervenir para restringir o eliminar usuarios con altas tasas de violación.

- Configure un sistema interno de revisión humana para marcar indicaciones que sean marcadas por Claude (siendo utilizado para moderación de contenido) o una API de moderación como dañinas para que pueda intervenir para restringir o eliminar usuarios con altas tasas de violación.

Herramientas de Salvaguardas de API

Terms of Service - Consumer

Product

Research

Terms of Service - Commercial

Privacy Policy

Company

Usage Policy

News

Responsible Disclosure Policy

Careers

Compliance

Encuentra respuestas y obtén ayuda del servicio de Atención al cliente y de expertos de la comunidad de Intercom

Este sitio emplea cookies y otras tecnologías que nosotros y nuestros proveedores externos utilizamos para monitorizar y registrar datos personales sobre ti y tus interacciones con el sitio (por ejemplo, contenidos vistos, movimientos del cursor, grabaciones de pantalla y contenidos del chat) para los fines descritos en nuestra Política de cookies. Al continuar en nuestro sitio, aceptas nuestros {websiteTermsLink}, {privacyPolicyLink} y {cookiePolicyLink}.

Este sitio utiliza cookies y tecnologías similares (“cookies”) que son estrictamente necesarias para su funcionamiento. Nosotros y nuestros socios también desearíamos instalar cookies adicionales para activar las funciones de análisis del rendimiento del sitio, funcionalidad, publicidad y redes sociales. Consulta nuestra {cookiePolicyLink} para más detalles. Puedes cambiar tus preferencias de cookies en nuestra Configuración de cookies.

Usamos cookies para el correcto funcionamiento de nuestro sitio y también con fines analíticos y publicitarios. Puedes activar o desactivar las cookies opcionales como prefieras. Consulta nuestra {cookiePolicyLink} para más información.

Las cookies de publicidad las instalan nuestros socios publicitarios para recopilar información sobre tu uso del sitio, nuestras comunicaciones y otros servicios online a lo largo del tiempo y con diferentes navegadores y dispositivos. Usan estos datos para mostrarte anuncios en Internet que creen que pueden interesarte y medir su rendimiento. Las cookies de redes sociales las instalan las plataformas de redes sociales para que puedas compartir contenidos en ellas y pueden rastrear información sobre tu actividad en otros servicios online para usarla como se describe en sus políticas de privacidad.

Estas cookies permiten mejorar la funcionalidad y la personalización del sitio web. Podemos instalarlas nosotros o proveedores externos cuyos servicios hemos añadido a nuestras páginas. Si no permites estas cookies, es posible que algunos o todos estos servicios no funcionen correctamente.

Estas cookies son necesarias para que el sitio web funcione y no se pueden desactivar en nuestros sistemas.

Estas cookies nos permiten contabilizar las visitas y las fuentes de tráfico para poder medir y mejorar el rendimiento de nuestro sitio. Nos ayudan a saber qué páginas son las más y las menos populares y a ver cómo se desplazan los visitantes por el sitio.

Tienes derecho a oponerte a la venta de tus datos personales. Consulta nuestra {cookiePolicyLink} para obtener más detalles sobre el uso que hacemos de tus datos.

Sus opciones de privacidad

Utilizamos cookies para mejorar tu experiencia. A continuación puedes personalizar tus preferencias o consultar nuestra {cookiePolicyLink} para más detalles.

Configuración de cookies

Centro de ayuda vacío

Oh, oh. Esa página no existe.

Inicio

Buscar

Decepcionado/a

Imparcial

Sonriente

Pensando...

Buscando en las fuentes...

Analizando...

Los tickets enviados por Messenger o por un agente de atención al cliente con el que mantengas una conversación aparecerán aquí.

No hay tickets creados por ti

Prueba a usar diferentes palabras clave o comprobar si hay errores tipográficos.

Prueba a usar diferentes palabras clave o filtros.

No se ha encontrado ningún ticket

Título

Haz un seguimiento del progreso de todos los tickets relacionados con tu empresa.