Zum Hauptinhalt springen

Unser Ansatz zu Ratenbegrenzungen für die Claude API

Heute aktualisiert

Ihr Ratenlimit hängt von Ihrer Nutzungsstufe ab und wird derzeit anhand von drei Schlüsselmetriken gemessen:

  1. Anfragen pro Minute (RPM)

  2. Eingabe-Token pro Minute (ITPM)

  3. Ausgabe-Token pro Minute (OTPM)

Wenn Sie eines dieser Ratenlimits überschreiten, erhalten Sie einen 429-Fehler, der angibt, welches Ratenlimit überschritten wurde, zusammen mit einem retry-after-Header, der anzeigt, wie lange Sie warten sollten.

Ratenlimits werden auf Organisationsebene festgelegt und sind durch Nutzungsstufen definiert. Jede Stufe hat unterschiedliche Ausgaben- und Ratenlimits, mit automatischer Stufenerhöhung basierend auf Nutzungsschwellwerten bis Stufe 4.

Sie können die aktuelle Stufe und die Limits Ihrer Organisation in der Claude Console einsehen.

Weitere Informationen zu Nutzungsstufen und Ratenlimits finden Sie in unserer Claude-Dokumentation.

Hat dies deine Frage beantwortet?