Claude Sonnet 4.5 mencakup perlindungan AI Safety Level 3 (ASL-3) yang dirancang untuk mencegah penyalahgunaan terkait senjata kimia, biologi, radiologi, dan nuklir (CBRN). Langkah-langkah keamanan ini mencakup filter yang disebut classifier yang mendeteksi input dan output yang berpotensi berbahaya.
Mengapa pesan saya diblokir?
Filter keamanan Sonnet 4.5 dirancang untuk mencegah bantuan dengan tugas-tugas terkait senjata CBRN (Kimia, Biologi, Radiologi, dan Nuklir). Jika Anda menerima pesan kesalahan, filter mendeteksi konten yang cocok dengan pola yang terkait dengan ancaman spesifik ini.
Filter ini masih dalam tahap penyempurnaan dan mungkin kadang-kadang secara tidak sengaja menandai konten normal. Seperti sistem otomatis apa pun, positif palsu dapat terjadi—artinya pertanyaan yang sah mungkin kadang-kadang ditandai secara tidak benar. Kami secara aktif bekerja untuk meningkatkan presisi classifier ini guna meminimalkan gangguan sambil mempertahankan keamanan.
Apa yang dapat Anda lakukan
Jika Anda percaya pesan Anda diblokir sebagai respons terhadap penggunaan yang sah, Anda memiliki beberapa opsi:
Hindari pola yang memicu positif palsu
Classifier sensitif terhadap pola tertentu yang mungkin menyerupai upaya jailbreak atau teknik obfuskasi:
Hindari konten seperti cipher: String yang dikodekan Base64, hash commit git, urutan heksadesimal, dan data terenkripsi lainnya dapat memicu filter. Jika Anda perlu menyertakan konten seperti itu, sertakan konten di sekitarnya untuk menjelaskan bagaimana dan mengapa konten tersebut digunakan.
Sederhanakan instruksi: Prompt sistem yang terlalu panjang atau kompleks yang mencakup logika kondisional rumit mungkin menyerupai upaya untuk mengaburkan perilaku. Jaga prompt agar jelas dan langsung.
Berhati-hati dengan konten terkait biologi: Jika aplikasi Anda tidak secara khusus memerlukan informasi biologi atau kimia, pertimbangkan untuk mengganti frasa permintaan untuk menghindari topik ini jika memungkinkan.
Opsi lainnya
Lanjutkan dengan Claude Sonnet 4: Anda dapat beralih ke Claude Sonnet 4 untuk sisa percakapan, yang menggunakan langkah-langkah keamanan yang berbeda dan mungkin dapat membantu dengan permintaan Anda.
Kirim umpan balik: Anda dapat memberi tahu kami karena umpan balik Anda membantu kami meningkatkan akurasi filter.
Edit pesan Anda: Anda dapat mencoba mengganti frasa pertanyaan Anda atau memberikan konteks tambahan tentang kasus penggunaan yang sah.
Mengapa filter ini?
Seiring dengan semakin canggihnya model AI, mereka memerlukan perlindungan yang lebih kuat terhadap potensi penyalahgunaan. Langkah-langkah penerapan ASL-3 Sonnet 4.5 adalah bagian dari Kebijakan Penskalaan Bertanggung Jawab Anthropic, yang memastikan bahwa model yang semakin canggih memiliki perlindungan yang sesuai.
Filter dirancang khusus untuk mencegah alur kerja CBRN yang panjang dan end-to-end yang dapat menimbulkan risiko bencana. Filter ini bukan dimaksudkan untuk memblokir diskusi ilmiah umum, konten pendidikan, atau informasi yang tersedia secara umum.
Untuk peneliti dan aplikasi dual-use
Jika Anda bekerja dalam penelitian ilmiah dan memerlukan akses untuk tujuan yang sah, kami telah menetapkan sistem kontrol akses untuk pengguna yang telah diverifikasi. Hubungi tim dukungan kami untuk mempelajari lebih lanjut.