Polisi

Memperbaiki Tingkah Laku Keselamatan Model dengan Ganjaran Berasaskan Peraturan

Sumber: OpenAI News 24 Jul 2024

Dengar Ringkasan

Audio AI dalam sebutan Bahasa Melayu Malaysia, berdasarkan ringkasan NadiAI dan sumber asal.

Ringkasan

OpenAI membangunkan dan mengaplikasikan kaedah baru menggunakan Ganjaran Berasaskan Peraturan (RBR) untuk melaras tingkah laku model agar lebih selamat. Kaedah ini dikatakan mengurangkan keperluan pengumpulan data manusia yang meluas.

Kenapa Ini Penting

Pendekatan ini boleh mempercepat penyelarasan keselamatan model tanpa bergantung secara besar pada data manusia.