Kajian

Algoritma LOLA: Melatih Agen AI Memodelkan Pembelajaran Pihak Lain

Sumber: OpenAI News 14 Sep 2017

Dengar Ringkasan

Audio AI dalam sebutan Bahasa Melayu Malaysia, berdasarkan ringkasan NadiAI dan sumber asal.

Ringkasan

OpenAI mengeluarkan algoritma bernama Learning with Opponent-Learning Awareness (LOLA) yang mengambil kira bahawa agen lain juga sedang belajar. Algoritma ini dapat menemui strategi kolaboratif tetapi mementingkan diri sendiri, seperti tit-for-tat dalam dilema banduan berulang (iterated prisoner’s dilemma).

Kenapa Ini Penting

Ia langkah awal ke arah agen AI yang mampu memodelkan niat dan pembelajaran pihak lain untuk interaksi strategik lebih baik.