Polisi

OpenAI dan Anthropic kongsi penemuan penilaian keselamatan bersama

Sumber: OpenAI News 27 Aug 2025

Dengar Ringkasan

Audio AI dalam sebutan Bahasa Melayu Malaysia, berdasarkan ringkasan NadiAI dan sumber asal.

Ringkasan

OpenAI dan Anthropic menerbitkan penemuan daripada penilaian keselamatan bersama pertama seumpamanya yang menguji model satu sama lain untuk isu seperti ketidakselarasan, pematuhan arahan, halusinasi dan jailbreaking. Laporan itu menonjolkan kemajuan, cabaran yang masih wujud, dan manfaat kerjasama antara makmal.

Kenapa Ini Penting

Ia menunjukkan nilai penilaian silang dan boleh mempengaruhi amalan keselamatan model serta dasar industri.