Tools

RL-Teacher: Antara Muka Terbuka Untuk Maklum Balas Manusia

Sumber: OpenAI News 03 Aug 2017

Dengar Ringkasan

Audio AI dalam sebutan Bahasa Melayu Malaysia, berdasarkan ringkasan NadiAI dan sumber asal.

Ringkasan

OpenAI menerbitkan RL-Teacher, pelaksanaan sumber terbuka bagi antara muka yang melatih model melalui maklum balas manusia sekali-sekala berbanding fungsi ganjaran ditulis tangan. Kaedah ini dibangunkan sebagai langkah ke arah sistem AI yang lebih selamat dan juga boleh digunakan pada masalah pembelajaran penguatan dengan ganjaran sukar ditakrifkan.

Kenapa Ini Penting

RL-Teacher memudahkan latihan AI untuk situasi di mana sukar merumuskan fungsi ganjaran, sambil menyokong pendekatan yang lebih berfokuskan keselamatan.