Kajian
Algoritma LOLA: Melatih Agen AI Memodelkan Pembelajaran Pihak Lain
Dengar Ringkasan
Audio AI dalam sebutan Bahasa Melayu Malaysia, berdasarkan ringkasan NadiAI dan sumber asal.
Digest Audio Harian
Dapatkan ringkasan audio berita AI harian pada peranti anda.
Pasang NadiAI untuk akses pantas kepada 5 berita AI terkini setiap hari.
- Klik Aktifkan Alert dan benarkan notifikasi daripada NadiAI.
- Jika pilihan Pasang App muncul di address bar, anda boleh pasang NadiAI untuk akses lebih pantas.
- Jika tidak, bookmark halaman ini atau pin tab NadiAI.
Ringkasan
OpenAI mengeluarkan algoritma bernama Learning with Opponent-Learning Awareness (LOLA) yang mengambil kira bahawa agen lain juga sedang belajar. Algoritma ini dapat menemui strategi kolaboratif tetapi mementingkan diri sendiri, seperti tit-for-tat dalam dilema banduan berulang (iterated prisoner’s dilemma).
Kenapa Ini Penting
Ia langkah awal ke arah agen AI yang mampu memodelkan niat dan pembelajaran pihak lain untuk interaksi strategik lebih baik.