Kajian
MLE-bench: Penanda Aras Untuk Agen Kejuruteraan Pembelajaran Mesin
Dengar Ringkasan
Audio AI dalam sebutan Bahasa Melayu Malaysia, berdasarkan ringkasan NadiAI dan sumber asal.
Digest Audio Harian
Dapatkan ringkasan audio harian pada peranti anda.
Pasang NadiAI untuk akses pantas kepada ringkasan audio harian.
- Klik Aktifkan Alert dan benarkan notifikasi daripada NadiAI.
- Jika pilihan Pasang App muncul di address bar, anda boleh pasang NadiAI untuk akses lebih pantas.
- Jika tidak, bookmark halaman ini atau pin tab NadiAI.
Ringkasan
OpenAI memperkenalkan MLE-bench, penanda aras untuk mengukur sejauh mana agen AI mampu melaksanakan kejuruteraan pembelajaran mesin. Alat ini direka untuk memberi ukuran objektif prestasi agen dalam tugasan kejuruteraan ML.
Kenapa Ini Penting
Penanda aras ini boleh membantu penyelidik dan pembangun menilai serta meningkatkan kebolehan agen AI dalam tugasan kejuruteraan model.