Unabhängig davon, ob Sie gerade mit der Einrichtung von Schutzmaßnahmen für Ihre API-Bereitstellung von Claude beginnen oder Ihre Bereitstellung bereits läuft, finden Sie hier einige Strategien, die Sie beim Aufbau Ihres eigenen KI-Sicherheitsprogramms berücksichtigen sollten. Diese Vorschläge sollen Ihnen helfen, unsere Nutzungsbedingungen und Nutzungsrichtlinie einzuhalten, die bestimmte Verwendungen von Claude verbieten. Die Nichtbeachtung der Nutzungsbedingungen und Nutzungsrichtlinie kann zur Sperrung oder Beendigung Ihres Zugriffs auf die Dienste führen.
Grundlegende Schutzmaßnahmen
Speichern Sie IDs, die mit jedem API-Aufruf verknüpft sind, damit Sie bei Bedarf spezifische Verstöße gegen die Richtlinien in Ihren Systemen finden können.
Erwägen Sie, Benutzern IDs zuzuweisen, mit denen Sie bestimmte Personen verfolgen können, die gegen Anthropics AUP verstoßen, um gezielter gegen Missbrauch vorgehen zu können.
Die Entscheidung, IDs über die API an Anthropic zu übermitteln, liegt bei Ihnen. Falls bereitgestellt, können wir Verstöße präziser identifizieren. Um die Privatsphäre der Endbenutzer zu schützen, sollten alle übermittelten IDs kryptografisch gehasht werden.
Erwägen Sie, dass Kunden sich auf Ihrer Plattform registrieren müssen, bevor sie Claude nutzen
Stellen Sie sicher, dass Ihre Kunden die zulässigen Verwendungen verstehen
Warnen Sie, drosseln Sie oder sperren Sie Benutzer, die wiederholt gegen Anthropics Nutzungsbedingungen und Nutzungsrichtlinie verstoßen
Mittlere Schutzmaßnahmen
Erstellen Sie Anpassungsrahmen, die die Interaktionen der Endbenutzer mit Claude auf einen begrenzten Satz von Prompts beschränken oder Claude nur erlauben, einen bestimmten Wissensfundus zu überprüfen, den Sie bereits haben, was die Möglichkeit von Benutzern, gegen die Richtlinien zu verstoßen, verringert.
Aktivieren Sie zusätzliche Sicherheitsfilter – kostenlose Echtzeit-Moderationswerkzeuge von Anthropic zur Erkennung potenziell schädlicher Prompts und zur Verwaltung von Echtzeit-Maßnahmen zur Schadensminderung
Weitere Informationen zur Aktivierung unserer zusätzlichen Sicherheitsfilter erhalten Sie unter [email protected].
Für Bedrock-Kunden:
Aktivieren Sie Ihren privaten S3-Bucket, um Prompts und Vervollständigungen für Ihre eigene Bewertung zu speichern
Erweiterte Schutzmaßnahmen
Führen Sie eine Moderations-API gegen alle Endbenutzer-Prompts aus, bevor sie an Claude gesendet werden, um sicherzustellen, dass sie nicht schädlich sind
Umfassende Schutzmaßnahmen
Richten Sie ein internes Überprüfungssystem ein, um Prompts zu kennzeichnen, die von Claude (für die Inhaltsmoderation verwendet) oder einer Moderations-API als schädlich gekennzeichnet wurden, damit Sie eingreifen können, um Benutzer mit hohen Verstoßquoten einzuschränken oder zu entfernen.
