Polisi
Memperbaiki Tingkah Laku Keselamatan Model dengan Ganjaran Berasaskan Peraturan
Dengar Ringkasan
Audio AI dalam sebutan Bahasa Melayu Malaysia, berdasarkan ringkasan NadiAI dan sumber asal.
Digest Audio Harian
Dapatkan ringkasan audio harian pada peranti anda.
Pasang NadiAI untuk akses pantas kepada ringkasan audio harian.
- Klik Aktifkan Alert dan benarkan notifikasi daripada NadiAI.
- Jika pilihan Pasang App muncul di address bar, anda boleh pasang NadiAI untuk akses lebih pantas.
- Jika tidak, bookmark halaman ini atau pin tab NadiAI.
Ringkasan
OpenAI membangunkan dan mengaplikasikan kaedah baru menggunakan Ganjaran Berasaskan Peraturan (RBR) untuk melaras tingkah laku model agar lebih selamat. Kaedah ini dikatakan mengurangkan keperluan pengumpulan data manusia yang meluas.
Kenapa Ini Penting
Pendekatan ini boleh mempercepat penyelarasan keselamatan model tanpa bergantung secara besar pada data manusia.