Baik Anda baru saja memulai proses penyiapan perlindungan untuk penerapan API Claude Anda, atau penerapan Anda sudah berjalan, berikut adalah beberapa strategi yang perlu dipertimbangkan saat membangun program keamanan AI Anda sendiri. Saran-saran ini dirancang untuk membantu Anda mematuhi Syarat Layanan dan Kebijakan Penggunaan kami, yang melarang penggunaan Claude tertentu. Kegagalan untuk mematuhi Syarat dan Kebijakan Penggunaan dapat mengakibatkan penangguhan atau penghentian akses Anda ke layanan.
Perlindungan Dasar
Simpan ID yang terkait dengan setiap panggilan API, sehingga jika Anda perlu menunjukkan konten yang melanggar tertentu, Anda memiliki kemampuan untuk menemukannya di sistem Anda.
Pertimbangkan untuk menetapkan ID kepada pengguna, yang dapat membantu Anda melacak individu tertentu yang melanggar AUP Anthropic, memungkinkan tindakan yang lebih tertarget dalam kasus penyalahgunaan.
Pilihan untuk meneruskan ID ke Anthropic melalui API terserah Anda. Namun, jika disediakan, kami dapat menunjukkan pelanggaran dengan lebih tepat. Untuk membantu melindungi privasi pengguna akhir, ID apa pun yang diteruskan harus di-hash secara kriptografi.
Pertimbangkan untuk mengharuskan pelanggan mendaftar akun di platform Anda sebelum menggunakan Claude
Pastikan pelanggan Anda memahami penggunaan yang diizinkan
Peringatkan, batasi, atau hentikan pengguna yang berulang kali melanggar Syarat Layanan dan Kebijakan Penggunaan Anthropic
Perlindungan Menengah
Buat kerangka kerja kustomisasi yang membatasi interaksi pengguna akhir dengan Claude ke serangkaian prompt terbatas atau hanya memungkinkan Claude meninjau korpus pengetahuan spesifik yang sudah Anda miliki, yang akan mengurangi kemampuan pengguna untuk terlibat dalam perilaku yang melanggar.
Aktifkan filter keamanan tambahan - alat moderasi real-time gratis yang dibangun oleh Anthropic untuk membantu mendeteksi prompt yang berpotensi berbahaya dan mengelola tindakan real-time untuk mengurangi kerugian
Untuk informasi lebih lanjut tentang cara mengaktifkan filter keamanan tambahan kami, silakan hubungi [email protected].
Untuk Pelanggan Bedrock:
Aktifkan bucket S3 pribadi Anda untuk menyimpan prompt dan penyelesaian untuk evaluasi Anda sendiri
Perlindungan Lanjutan
Jalankan API moderasi terhadap semua prompt pengguna akhir sebelum dikirim ke Claude untuk memastikan mereka tidak berbahaya
Perlindungan Komprehensif
Siapkan sistem tinjauan manusia internal untuk menandai prompt yang ditandai oleh Claude (digunakan untuk moderasi konten) atau API moderasi sebagai berbahaya sehingga Anda dapat melakukan intervensi untuk membatasi atau menghapus pengguna dengan tingkat pelanggaran tinggi.
