Anthropic

Claude Sonnet 4.5 mencakup perlindungan AI Safety Level 3 (ASL-3) baru yang dirancang untuk mencegah penyalahgunaan terkait senjata kimia, biologi, radiologi, dan nuklir (CBRN). Langkah-langkah keamanan ini menggunakan Constitutional Classifiers yang memantau input dan output untuk memblokir kategori konten berbahaya yang sempit.

Filter keamanan Sonnet 4.5 difokuskan secara sempit pada pencegahan bantuan dengan tugas-tugas terkait senjata CBRN. Jika permintaan Anda diblokir, filter mendeteksi konten yang cocok dengan pola yang terkait dengan ancaman spesifik ini.

Filter-filter ini masih dalam tahap penyempurnaan. Seperti halnya sistem otomatis apa pun, false positive dapat terjadi—artinya permintaan yang sah mungkin kadang-kadang ditandai secara tidak benar. Kami secara aktif bekerja untuk meningkatkan presisi classifier ini guna meminimalkan gangguan sambil mempertahankan keamanan.

Jika permintaan API Anda diblokir, berikut adalah langkah-langkah yang dapat Anda ambil:

Classifier sensitif terhadap pola tertentu yang mungkin menyerupai upaya jailbreak atau teknik obfuskasi:

Hindari konten seperti cipher: String yang dikodekan Base64, hash commit git, urutan heksadesimal, dan data terenkripsi lainnya dapat memicu filter. Jika Anda perlu menyertakan konten seperti itu, pertimbangkan apakah itu penting untuk kasus penggunaan Anda.

Sederhanakan instruksi sistem: Prompt sistem yang terlalu panjang atau kompleks yang mencakup logika kondisional rumit mungkin menyerupai upaya untuk mengaburkan perilaku. Jaga instruksi sistem tetap jelas dan langsung.

Berhati-hati dengan konten terkait biologi: Jika aplikasi Anda tidak secara khusus memerlukan informasi biologi atau kimia, pertimbangkan untuk memformulasi ulang permintaan guna menghindari topik-topik ini jika memungkinkan.

- Hindari konten seperti cipher: String yang dikodekan Base64, hash commit git, urutan heksadesimal, dan data terenkripsi lainnya dapat memicu filter. Jika Anda perlu menyertakan konten seperti itu, pertimbangkan apakah itu penting untuk kasus penggunaan Anda.
- Sederhanakan instruksi sistem: Prompt sistem yang terlalu panjang atau kompleks yang mencakup logika kondisional rumit mungkin menyerupai upaya untuk mengaburkan perilaku. Jaga instruksi sistem tetap jelas dan langsung.
- Berhati-hati dengan konten terkait biologi: Jika aplikasi Anda tidak secara khusus memerlukan informasi biologi atau kimia, pertimbangkan untuk memformulasi ulang permintaan guna menghindari topik-topik ini jika memungkinkan.

Gunakan Sonnet 4 alih-alih Sonnet 4.5 dalam panggilan API Anda. Sonnet 4 menggunakan langkah-langkah keamanan yang berbeda dan mungkin dapat memproses permintaan Anda dengan sukses.

Bangun penanganan kesalahan ke dalam aplikasi Anda yang dapat:

Mendeteksi ketika permintaan diblokir oleh filter keamanan.

Secara otomatis mencoba kembali dengan Sonnet 4 sebagai fallback.

Mencatat insiden untuk ditinjau guna mengidentifikasi pola dalam false positive.

- Mendeteksi ketika permintaan diblokir oleh filter keamanan.
- Secara otomatis mencoba kembali dengan Sonnet 4 sebagai fallback.
- Mencatat insiden untuk ditinjau guna mengidentifikasi pola dalam false positive.

Jika Anda percaya permintaan Anda diblokir secara tidak benar, hubungi <a href="https://support.claude.com/en/articles/9015913-how-to-get-support#h_beb6d0c9ce">tim dukungan API</a> kami. Umpan balik Anda membantu kami meningkatkan akurasi filter dan mengurangi false positive untuk kasus penggunaan yang sah.

Seiring dengan semakin canggihnya model AI, mereka memerlukan perlindungan yang lebih kuat terhadap potensi penyalahgunaan. Langkah-langkah penerapan ASL-3 Sonnet 4.5 adalah bagian dari <a href="https://www.anthropic.com/news/activating-asl3-protections" rel="nofollow noopener noreferrer" target="_blank">Kebijakan Penskalaan Bertanggung Jawab</a> Anthropic, yang memastikan bahwa model yang semakin canggih memiliki perlindungan yang sesuai.

Filter dirancang khusus untuk mencegah alur kerja CBRN yang diperpanjang dan end-to-end yang dapat menimbulkan risiko katastrofal. Mereka bukan dimaksudkan untuk memblokir diskusi ilmiah umum, konten pendidikan, atau informasi yang tersedia secara umum.

Jika Anda membangun aplikasi untuk penelitian ilmiah atau bidang teknologi dual-use dan memerlukan akses untuk tujuan yang sah, kami telah menetapkan sistem kontrol akses untuk pengguna yang telah diverifikasi. Hubungi <a href="https://support.claude.com/en/articles/9015913-how-to-get-support#h_beb6d0c9ce">tim dukungan API</a> kami untuk mempelajari lebih lanjut tentang pengecualian.

Memahami Filter Keamanan API Sonnet 4.5

Terms of Service - Consumer

Product

Research

Terms of Service - Commercial

Privacy Policy

Company

Usage Policy

News

Responsible Disclosure Policy

Careers

Compliance

Temukan jawaban dan dapatkan bantuan dari Dukungan Interkom dan Pakar Komunitas

Percakapan yang telah Anda mulai melalui messenger akan muncul di sini.

Tidak ada percakapan yang dibuat oleh Anda

Cobalah menggunakan kata kunci yang berbeda atau periksa adanya kesalahan ketik.

Cobalah menggunakan kata kunci atau filter yang berbeda.

Tidak ada percakapan ditemukan

Jabatan

Situs ini menggunakan cookie dan teknologi lain yang kami dan vendor pihak ketiga kami gunakan untuk memantau dan mencatat informasi pribadi tentang Anda dan interaksi Anda dengan situs (termasuk konten yang dilihat, pergerakan kursor, rekaman layar, dan konten obrolan) untuk tujuan yang dijelaskan dalam Kebijakan Cookie kami. Dengan terus mengunjungi situs kami, Anda menyetujui {websiteTermsLink}, {privacyPolicyLink}, dan {cookiePolicyLink} kami.

Situs ini menggunakan cookie dan teknologi serupa ("cookies") yang sangat diperlukan untuk pengoperasian situs. Kami dan mitra-mitra kami juga ingin memasang cookie tambahan untuk mengaktifkan analitika kinerja situs, fungsionalitas, iklan, dan fitur media sosial. Silakan lihat {cookiePolicyLink} kami untuk informasi lebih lanjut. Anda dapat mengubah preferensi cookie Anda di Pengaturan Cookie kami.

Kami menggunakan cookie untuk memastikan situs kami berfungsi dan juga untuk tujuan analitik dan periklanan. Anda dapat mengaktifkan atau menonaktifkan cookie opsional sesuai keinginan Anda. Silakan lihat {cookiePolicyLink} kami untuk detail lanjut.

Cookie iklan ditetapkan oleh mitra periklanan kami untuk mengumpulkan informasi tentang penggunaan Anda atas situs, komunikasi kami, dan layanan online lainnya dari waktu ke waktu dan dengan berbagai browser dan perangkat. Mereka menggunakan informasi ini untuk menampilkan iklan online yang menurut mereka akan menarik minat Anda dan mengukur kinerja iklan tersebut. Cookie media sosial ditetapkan oleh platform media sosial untuk memungkinkan Anda berbagi konten di platform tersebut, dan dapat melacak informasi tentang aktivitas Anda di layanan online lainnya untuk digunakan sebagaimana dijelaskan dalam kebijakan privasi mereka.

Cookie ini memungkinkan situs web untuk menyediakan fungsionalitas dan personalisasi yang lebih baik. Cookie ini dapat ditetapkan oleh kami atau oleh penyedia pihak ketiga yang layanannya telah kami tambahkan ke halaman kami. Jika Anda tidak mengizinkan cookie ini, beberapa atau semua layanan ini mungkin tidak akan berfungsi dengan baik.

Cookie ini diperlukan agar situs web berfungsi dan tidak dapat dinonaktifkan di sistem kami.

Cookie ini memungkinkan kami menghitung kunjungan dan sumber lalu lintas sehingga kami dapat mengukur dan meningkatkan kinerja situs kami. Cookie ini membantu kami mengetahui halaman mana yang paling populer dan paling kurang populer, serta melihat bagaimana pengunjung menjelajahi situs.

Anda memiliki hak untuk memilih tidak berpartisipasi dalam penjualan informasi pribadi Anda. Silakan lihat {cookiePolicyLink} kami untuk detail lebih lanjut tentang cara kami menggunakan data Anda.

Pilihan Privasi Anda

Kami menggunakan cookie untuk meningkatkan pengalaman Anda. Anda dapat menyesuaikan preferensi cookie Anda di bawah ini. Silakan lihat {cookiePolicyLink} kami untuk detail lanjut.

Pengaturan Cookie

Pusat Bantuan Kosong

Uh oh. Halaman itu tidak ada.

Layar utama

Hasil pencarian

Kecewa

Netral

Senyum.

Sedang berpikir...

Mencari dalam berbagai sumber...

Menganalisis...

Tiket yang dikirimkan melalui messenger atau oleh agen dukungan dalam percakapan Anda akan tampil di sini.

Tidak ada tiket yang dibuat oleh Anda

Tidak ditemukanda tiket

Lacak perkembangan semua tiket dan percakapan yang terkait dengan perusahaan Anda.

Portal pelanggan.

Lacak perkembangan semua tiket yang terkait dengan perusahaan Anda.

Portal tiket.

{assigneeName} telah menyelesaikan tiket Anda

{assigneeName} membutuhkan lebih banyak informasi dari Anda

Kami membutuhkan lebih banyak informasi dari Anda

Tiket

Tidak ada akses ke portal tiket

Cari dan tanyakan

Temukan panduan, jawaban, dan referensi.

Lewati pencarian. Jelaskan apa yang sedang Anda coba lakukan dan dapatkan jawaban yang berdasarkan fakta.

Jelajahi artikel dan panduan dalam topik ini.

Buat ruang kerja Anda dan undang orang-orang yang bekerja bersama Anda.

Siapkan akun Anda

Buat alur kerja pertama Anda dan lihatlah alur kerja tersebut berjalan dari awal hingga akhir.

Kirim sesuatu

Hubungkan alat yang sudah digunakan tim Anda untuk mendatangkan data.

Hubungkan stack Anda

Penjelajahan singkat produk agar Anda tahu letak semuanya.

{appName} dalam 60 detik

Demo prototipe ini mengetahui bahwa Anda sedang membaca “{title}”. Ini dapat mengarahkan Anda kembali ke artikel saat ini, tetapi kontrak Fin yang sadar artikel untuk produksi masih merupakan pekerjaan tindak lanjut.

Jawaban prototipe yang memahami artikel

Karena Anda sudah menanyakan tentang undangan, demo prototipe ini dapat menambahkan tindak lanjutnya: gunakan pemilih peran sebelum mengirim setiap undangan untuk membatasi akses sesuai tanggung jawab rekan satu tim.

Tindak lanjut pembatasan peran prototipe

Demo prototipe ini menyarankan untuk memulai dengan profil ruang kerja Anda, mengundang anggota tim yang memerlukan akses, lalu menghubungkan integrasi yang Anda gunakan.

Jawaban prototipe untuk memulai

Dalam demo prototipe ini, integrasi dikonfigurasi dari pengaturan ruang kerja. Pilih integrasi, hubungkan akun, lalu tinjau izin yang diaktifkan.

Jawaban integrasi prototipe

Dalam demo prototipe ini, undang rekan satu tim dari pengaturan ruang kerja, lalu pilih akses yang dibutuhkan setiap rekan satu tim sebelum mengirim undangan.

Prototipe jawaban undang tim

Demo prototipe ini belum memiliki jawaban yang telah disiapkan untuk pertanyaan tersebut. Cobalah menanyakan cara mengundang tim Anda atau membuka artikel sumber. Tidak ada Fin API produksi yang dipanggil.

Jawaban prototipe tidak tersedia

Saya sudah membuka halaman ini. Tanyakan apa saja tentang ini kepada saya dan saya akan menjawab dari dokumen.

Memahami Filter Keamanan API Sonnet 4.5

Mengapa permintaan API saya diblokir?

Apa yang dapat Anda lakukan

Hindari pola yang memicu false positive

Beralih ke Sonnet 4

Implementasikan logika fallback

Berikan umpan balik

Mengapa filter baru?

Untuk peneliti dan aplikasi dual-use