Kajian
OpenAI News
Analisis OpenAI menunjukkan sejak 2012 jumlah compute untuk melatih rangkaian neural mencapai prestasi ImageNet berkurang dua kali setiap 16 bulan. Berbanding 2012, kini diperlukan 44 kali kurang compute untuk mencapai tahap AlexNet, melebihi peningkatan 11x yang dijangka oleh Moore's Law.
Tools
OpenAI News
OpenAI memperkenalkan Jukebox, rangkaian neural yang menghasilkan muzik, termasuk nyanyian asas, sebagai audio mentah dalam pelbagai genre dan gaya artis. Syarikat itu menerbitkan berat model dan kod, serta alat untuk meneroka sampel yang dijana.
Kajian
OpenAI News
Laporan multi-pihak oleh 58 pengarang dari 30 organisasi menerangkan 10 mekanisme untuk meningkatkan kebolehbuktian tuntutan terhadap sistem AI. Mekanisme ini membantu pembangun menyediakan bukti bahawa sistem AI selamat, terjamin, adil atau memelihara privasi, dan membolehkan pengguna serta pembuat dasar menilai proses pembangunan.
Kajian
OpenAI News
OpenAI memperkenalkan Microscope, koleksi visualisasi setiap lapisan dan neuron penting bagi lapan model visi yang sering dikaji dalam interpretabiliti. Peranti ini memudahkan analisis ciri dalam rangkaian neural dan dimaksudkan untuk membantu komuniti penyelidikan memahami sistem kompleks tersebut.
Tools
Hugging Face Blog
Menurut Hugging Face, panduan ini menerangkan langkah asas melatih model bahasa baharu dari awal menggunakan Transformers dan Tokenizers. Pembaca digalakkan merujuk artikel asal untuk butiran teknikal dan keperluan sumber.
Tools
OpenAI News
OpenAI mengumumkan mereka menstandardkan rangka kerja pembelajaran mendalam kepada PyTorch. Maklumat itu disiarkan oleh OpenAI sendiri.
Kajian
OpenAI News
OpenAI News menerbitkan analisis tentang "scaling laws" bagi model bahasa neural. Ringkasan itu membincangkan bagaimana saiz model, jumlah data dan prestasi saling berkaitan menurut laporan OpenAI.
Kajian
OpenAI News
OpenAI menunjukkan fenomena double descent berlaku pada CNN, ResNet dan transformer: prestasi meningkat, kemudian merosot, lalu meningkat semula apabila saiz model, jumlah data atau masa latihan ditambah. Fenomena ini sering diuruskan dengan regularisasi tetapi masih belum difahami sepenuhnya, dan memerlukan kajian lanjut.
Kajian
OpenAI News
OpenAI mengeluarkan versi terbesarnya GPT-2 (1.5 bilion parameter) bersama kod dan berat model sebagai pelepasan akhir dalam pelan pelepasan berperingkat mereka. Tujuan termasuk memudahkan pengesanan keluaran GPT-2 dan menyediakan contoh kes untuk pembangun model berkuasa serta meneruskan perbincangan tentang penerbitan bertanggungjawab.
Tools
OpenAI News
OpenAI melatih dua rangkaian neural dalam simulasi untuk mengendalikan tangan robot mirip manusia bagi menyelesaikan Rubik’s Cube. Latihan menggunakan kod OpenAI Five dan teknik Automatic Domain Randomization membolehkan sistem menahan gangguan tidak diduga seperti dicucuk mainan zirafah.