Zum Hauptinhalt springen

API-Schutzmaßnahmen-Tools

Diese Woche aktualisiert

Unabhängig davon, ob Sie gerade mit der Einrichtung von Schutzmaßnahmen für Ihre API-Bereitstellung von Claude beginnen oder Ihre Bereitstellung bereits läuft, finden Sie hier einige Strategien, die Sie beim Aufbau Ihres eigenen KI-Sicherheitsprogramms berücksichtigen sollten. Diese Vorschläge sollen Ihnen helfen, unsere Nutzungsbedingungen und Nutzungsrichtlinie einzuhalten, die bestimmte Verwendungen von Claude verbieten. Die Nichtbeachtung der Nutzungsbedingungen und Nutzungsrichtlinie kann zur Sperrung oder Beendigung Ihres Zugriffs auf die Dienste führen.

Grundlegende Schutzmaßnahmen

  • Speichern Sie IDs, die mit jedem API-Aufruf verknüpft sind, damit Sie bei Bedarf spezifische Verstöße gegen die Richtlinien in Ihren Systemen finden können.

  • Erwägen Sie, Benutzern IDs zuzuweisen, mit denen Sie bestimmte Personen verfolgen können, die gegen Anthropics AUP verstoßen, um gezielter gegen Missbrauch vorgehen zu können.

    • Die Entscheidung, IDs über die API an Anthropic zu übermitteln, liegt bei Ihnen. Falls bereitgestellt, können wir Verstöße präziser identifizieren. Um die Privatsphäre der Endbenutzer zu schützen, sollten alle übermittelten IDs kryptografisch gehasht werden.

  • Erwägen Sie, dass Kunden sich auf Ihrer Plattform registrieren müssen, bevor sie Claude nutzen

  • Stellen Sie sicher, dass Ihre Kunden die zulässigen Verwendungen verstehen

  • Warnen Sie, drosseln Sie oder sperren Sie Benutzer, die wiederholt gegen Anthropics Nutzungsbedingungen und Nutzungsrichtlinie verstoßen

Mittlere Schutzmaßnahmen

  • Erstellen Sie Anpassungsrahmen, die die Interaktionen der Endbenutzer mit Claude auf einen begrenzten Satz von Prompts beschränken oder Claude nur erlauben, einen bestimmten Wissensfundus zu überprüfen, den Sie bereits haben, was die Möglichkeit von Benutzern, gegen die Richtlinien zu verstoßen, verringert.

  • Aktivieren Sie zusätzliche Sicherheitsfilter – kostenlose Echtzeit-Moderationswerkzeuge von Anthropic zur Erkennung potenziell schädlicher Prompts und zur Verwaltung von Echtzeit-Maßnahmen zur Schadensminderung

    • Weitere Informationen zur Aktivierung unserer zusätzlichen Sicherheitsfilter erhalten Sie unter [email protected].

  • Für Bedrock-Kunden:

    • Aktivieren Sie Ihren privaten S3-Bucket, um Prompts und Vervollständigungen für Ihre eigene Bewertung zu speichern

Erweiterte Schutzmaßnahmen

Umfassende Schutzmaßnahmen

  • Richten Sie ein internes Überprüfungssystem ein, um Prompts zu kennzeichnen, die von Claude (für die Inhaltsmoderation verwendet) oder einer Moderations-API als schädlich gekennzeichnet wurden, damit Sie eingreifen können, um Benutzer mit hohen Verstoßquoten einzuschränken oder zu entfernen.

Hat dies deine Frage beantwortet?