Anthropic

Claude Sonnet 4.5 mencakup perlindungan <a href="https://www.anthropic.com/news/activating-asl3-protections" rel="nofollow noopener noreferrer" target="_blank">AI Safety Level 3 (ASL-3)</a> yang dirancang untuk mencegah penyalahgunaan terkait senjata kimia, biologi, radiologi, dan nuklir (CBRN). Langkah-langkah keamanan ini mencakup filter yang disebut classifier yang mendeteksi input dan output yang berpotensi berbahaya.

Filter keamanan Sonnet 4.5 dirancang untuk mencegah bantuan dengan tugas-tugas terkait senjata CBRN (Kimia, Biologi, Radiologi, dan Nuklir). Jika Anda menerima pesan kesalahan, filter mendeteksi konten yang cocok dengan pola yang terkait dengan ancaman spesifik ini.

Filter ini masih dalam tahap penyempurnaan dan mungkin kadang-kadang secara tidak sengaja menandai konten normal. Seperti sistem otomatis lainnya, positif palsu dapat terjadi—artinya pertanyaan yang sah mungkin kadang-kadang ditandai secara tidak benar. Kami secara aktif bekerja untuk meningkatkan presisi classifier ini guna meminimalkan gangguan sambil mempertahankan keamanan.

Jika Anda percaya pesan Anda diblokir sebagai respons terhadap penggunaan yang sah, Anda memiliki beberapa opsi:

Classifier sensitif terhadap pola tertentu yang mungkin menyerupai upaya jailbreak atau teknik obfuskasi:

Hindari konten seperti cipher: String yang dikodekan Base64, hash commit git, urutan heksadesimal, dan data terenkripsi lainnya dapat memicu filter. Jika Anda perlu menyertakan konten seperti itu, sertakan konten di sekitarnya untuk menjelaskan bagaimana dan mengapa konten tersebut digunakan.

- Hindari konten seperti cipher: String yang dikodekan Base64, hash commit git, urutan heksadesimal, dan data terenkripsi lainnya dapat memicu filter. Jika Anda perlu menyertakan konten seperti itu, sertakan konten di sekitarnya untuk menjelaskan bagaimana dan mengapa konten tersebut digunakan.

Sederhanakan instruksi: Prompt sistem yang terlalu panjang atau kompleks yang mencakup logika kondisional yang rumit mungkin menyerupai upaya untuk mengaburkan perilaku. Pertahankan prompt <a href="https://docs.claude.com/en/docs/build-with-claude/prompt-engineering/overview" rel="nofollow noopener noreferrer" target="_blank">jelas dan langsung</a>.

- Sederhanakan instruksi: Prompt sistem yang terlalu panjang atau kompleks yang mencakup logika kondisional yang rumit mungkin menyerupai upaya untuk mengaburkan perilaku. Pertahankan prompt <a href="https://docs.claude.com/en/docs/build-with-claude/prompt-engineering/overview" rel="nofollow noopener noreferrer" target="_blank">jelas dan langsung</a>.

Berhati-hati dengan konten terkait biologi: Jika aplikasi Anda tidak secara khusus memerlukan informasi biologi atau kimia, pertimbangkan untuk mengganti frasa permintaan untuk menghindari topik ini jika memungkinkan.

- Berhati-hati dengan konten terkait biologi: Jika aplikasi Anda tidak secara khusus memerlukan informasi biologi atau kimia, pertimbangkan untuk mengganti frasa permintaan untuk menghindari topik ini jika memungkinkan.

Lanjutkan dengan Claude Sonnet 4: Anda dapat beralih ke Claude Sonnet 4 untuk sisa percakapan, yang menggunakan langkah-langkah keamanan yang berbeda dan mungkin dapat membantu dengan permintaan Anda.

- Lanjutkan dengan Claude Sonnet 4: Anda dapat beralih ke Claude Sonnet 4 untuk sisa percakapan, yang menggunakan langkah-langkah keamanan yang berbeda dan mungkin dapat membantu dengan permintaan Anda.

Kirim umpan balik: Anda dapat memberi tahu kami karena umpan balik Anda membantu kami meningkatkan akurasi filter.

- Kirim umpan balik: Anda dapat memberi tahu kami karena umpan balik Anda membantu kami meningkatkan akurasi filter.

Edit pesan Anda: Anda dapat mencoba mengganti frasa pertanyaan Anda atau memberikan konteks tambahan tentang kasus penggunaan yang sah.

- Edit pesan Anda: Anda dapat mencoba mengganti frasa pertanyaan Anda atau memberikan konteks tambahan tentang kasus penggunaan yang sah.

Seiring dengan semakin canggihnya model AI, mereka memerlukan perlindungan yang lebih kuat terhadap potensi penyalahgunaan. Langkah-langkah penerapan ASL-3 Sonnet 4.5 adalah bagian dari <a href="https://www.anthropic.com/news/activating-asl3-protections" rel="nofollow noopener noreferrer" target="_blank">Kebijakan Penskalaan Bertanggung Jawab</a> Anthropic, yang memastikan bahwa model yang semakin canggih memiliki perlindungan yang sesuai.

Filter dirancang khusus untuk mencegah alur kerja CBRN yang panjang dan end-to-end yang dapat menimbulkan risiko bencana. Mereka bukan dimaksudkan untuk memblokir diskusi ilmiah umum, konten pendidikan, atau informasi yang tersedia secara umum.

Jika Anda bekerja dalam penelitian ilmiah dan memerlukan akses untuk tujuan yang sah, kami telah menetapkan sistem kontrol akses untuk pengguna yang telah diverifikasi. Hubungi <a href="https://support.claude.com">tim dukungan</a> kami untuk mempelajari lebih lanjut.

Memahami Filter Keamanan Sonnet 4.5

Terms of Service - Consumer

Product

Research

Terms of Service - Commercial

Privacy Policy

Company

Usage Policy

News

Responsible Disclosure Policy

Careers

Compliance

Temukan jawaban dan dapatkan bantuan dari Dukungan Interkom dan Pakar Komunitas

Percakapan yang telah Anda mulai melalui messenger akan muncul di sini.

Tidak ada percakapan yang dibuat oleh Anda

Cobalah menggunakan kata kunci yang berbeda atau periksa adanya kesalahan ketik.

Cobalah menggunakan kata kunci atau filter yang berbeda.

Tidak ada percakapan ditemukan

Jabatan

Situs ini menggunakan cookie dan teknologi lain yang kami dan vendor pihak ketiga kami gunakan untuk memantau dan mencatat informasi pribadi tentang Anda dan interaksi Anda dengan situs (termasuk konten yang dilihat, pergerakan kursor, rekaman layar, dan konten obrolan) untuk tujuan yang dijelaskan dalam Kebijakan Cookie kami. Dengan terus mengunjungi situs kami, Anda menyetujui {websiteTermsLink}, {privacyPolicyLink}, dan {cookiePolicyLink} kami.

Situs ini menggunakan cookie dan teknologi serupa ("cookies") yang sangat diperlukan untuk pengoperasian situs. Kami dan mitra-mitra kami juga ingin memasang cookie tambahan untuk mengaktifkan analitika kinerja situs, fungsionalitas, iklan, dan fitur media sosial. Silakan lihat {cookiePolicyLink} kami untuk informasi lebih lanjut. Anda dapat mengubah preferensi cookie Anda di Pengaturan Cookie kami.

Kami menggunakan cookie untuk memastikan situs kami berfungsi dan juga untuk tujuan analitik dan periklanan. Anda dapat mengaktifkan atau menonaktifkan cookie opsional sesuai keinginan Anda. Silakan lihat {cookiePolicyLink} kami untuk detail lanjut.

Cookie iklan ditetapkan oleh mitra periklanan kami untuk mengumpulkan informasi tentang penggunaan Anda atas situs, komunikasi kami, dan layanan online lainnya dari waktu ke waktu dan dengan berbagai browser dan perangkat. Mereka menggunakan informasi ini untuk menampilkan iklan online yang menurut mereka akan menarik minat Anda dan mengukur kinerja iklan tersebut. Cookie media sosial ditetapkan oleh platform media sosial untuk memungkinkan Anda berbagi konten di platform tersebut, dan dapat melacak informasi tentang aktivitas Anda di layanan online lainnya untuk digunakan sebagaimana dijelaskan dalam kebijakan privasi mereka.

Cookie ini memungkinkan situs web untuk menyediakan fungsionalitas dan personalisasi yang lebih baik. Cookie ini dapat ditetapkan oleh kami atau oleh penyedia pihak ketiga yang layanannya telah kami tambahkan ke halaman kami. Jika Anda tidak mengizinkan cookie ini, beberapa atau semua layanan ini mungkin tidak akan berfungsi dengan baik.

Cookie ini diperlukan agar situs web berfungsi dan tidak dapat dinonaktifkan di sistem kami.

Cookie ini memungkinkan kami menghitung kunjungan dan sumber lalu lintas sehingga kami dapat mengukur dan meningkatkan kinerja situs kami. Cookie ini membantu kami mengetahui halaman mana yang paling populer dan paling kurang populer, serta melihat bagaimana pengunjung menjelajahi situs.

Anda memiliki hak untuk memilih tidak berpartisipasi dalam penjualan informasi pribadi Anda. Silakan lihat {cookiePolicyLink} kami untuk detail lebih lanjut tentang cara kami menggunakan data Anda.

Pilihan Privasi Anda

Kami menggunakan cookie untuk meningkatkan pengalaman Anda. Anda dapat menyesuaikan preferensi cookie Anda di bawah ini. Silakan lihat {cookiePolicyLink} kami untuk detail lanjut.

Pengaturan Cookie

Pusat Bantuan Kosong

Uh oh. Halaman itu tidak ada.

Layar utama

Hasil pencarian

Kecewa

Netral

Senyum.

Sedang berpikir...

Mencari dalam berbagai sumber...

Menganalisis...

Tiket yang dikirimkan melalui messenger atau oleh agen dukungan dalam percakapan Anda akan tampil di sini.

Memahami Filter Keamanan Sonnet 4.5

Mengapa pesan saya diblokir?

Apa yang dapat Anda lakukan

Hindari pola yang memicu positif palsu

Opsi lainnya

Mengapa filter?

Untuk peneliti dan aplikasi dual-use