Polisi
OpenAI dan Anthropic kongsi penemuan penilaian keselamatan bersama
Dengar Ringkasan
Audio AI dalam sebutan Bahasa Melayu Malaysia, berdasarkan ringkasan NadiAI dan sumber asal.
Digest Audio Harian
Dapatkan ringkasan audio harian pada peranti anda.
Pasang NadiAI untuk akses pantas kepada ringkasan audio harian.
- Klik Aktifkan Alert dan benarkan notifikasi daripada NadiAI.
- Jika pilihan Pasang App muncul di address bar, anda boleh pasang NadiAI untuk akses lebih pantas.
- Jika tidak, bookmark halaman ini atau pin tab NadiAI.
Ringkasan
OpenAI dan Anthropic menerbitkan penemuan daripada penilaian keselamatan bersama pertama seumpamanya yang menguji model satu sama lain untuk isu seperti ketidakselarasan, pematuhan arahan, halusinasi dan jailbreaking. Laporan itu menonjolkan kemajuan, cabaran yang masih wujud, dan manfaat kerjasama antara makmal.
Kenapa Ini Penting
Ia menunjukkan nilai penilaian silang dan boleh mempengaruhi amalan keselamatan model serta dasar industri.