VentureBeat AI
08 Jan 2026
Nous Research melancarkan NousCoder-14B, model penjana kod sumber terbuka yang dilatih dalam empat hari menggunakan 48 GPU Nvidia B200 dan mencapai 67.87% pada LiveCodeBench v6. Syarikat itu turut menerbitkan berat model, rangkaian latihan Atropos dan alat pengesahan, serta memberi amaran bahawa set data verifikasi kompetitif (≈24,000 soalan) mungkin hampir mencapai had kualiti tersedia.
Hugging Face Blog
06 Jan 2026
Menurut Hugging Face Blog, NVIDIA memperkenalkan Cosmos Reason 2 yang dikatakan membawa penaakulan lanjutan kepada AI fizikal. Butiran teknikal dan contoh aplikasi dirujuk kepada sumber asal.
Hugging Face Blog
05 Jan 2026
Hugging Face memperkenalkan Falcon-H1-Arabic, sebuah model bahasa berasaskan seni bina hibrid yang direka khusus untuk Bahasa Arab. Menurut entri blog rasmi, model ini bertujuan meningkatkan prestasi pemahaman dan penjanaan bahasa Arab berbanding pendekatan sebelum ini.
OpenAI News
18 Dec 2025
OpenAI memperkenalkan rangka kerja dan suite penilaian baharu bagi kebolehpantauan chain-of-thought, merangkumi 13 penilaian dalam 24 persekitaran. Hasil awal OpenAI menunjukkan pemantauan proses dalaman model jauh lebih berkesan daripada pemantauan keluaran semata-mata, membuka laluan untuk kawalan yang boleh diskalakan.
OpenAI News
18 Dec 2025
OpenAI dan U.S. Department of Energy menandatangani memorandum persefahaman untuk memperdalam kerjasama dalam AI dan pengkomputeran maju bagi menyokong penemuan saintifik. Perjanjian itu membina atas kerja dengan makmal kebangsaan dan mencipta rangka bagi penggunaan AI dalam penyelidikan berimpak tinggi di seluruh ekosistem DOE.
Hugging Face Blog
17 Dec 2025
Hugging Face menerangkan penggunaan NeMo Evaluator untuk menanda aras model NVIDIA NeMoTron 3 Nano menurut standard penilaian terbuka. Ringkasan itu menggariskan kaedah dan metrik yang digunakan serta tujuan untuk meningkatkan keterbandingan keputusan.
OpenAI News
16 Dec 2025
Menurut OpenAI, FrontierScience ialah penanda aras yang menguji kebolehan reasoning AI dalam fizik, kimia dan biologi. Ia bertujuan mengukur kemajuan AI ke arah melaksanakan tugas penyelidikan saintifik yang sebenar.
OpenAI News
16 Dec 2025
OpenAI memperkenalkan rangka penilaian dunia sebenar untuk mengukur sejauh mana AI boleh mempercepat kerja penyelidikan biologi di makmal basah. Kertas kerja itu menggunakan GPT‑5 untuk mengoptimumkan protokol klon molekul dan membincangkan potensi serta risiko eksperimen dibantu AI.
OpenAI News
11 Dec 2025
Menurut OpenAI, GPT-5.2 adalah model terkuat setakat ini untuk matematik dan sains dan mencapai keputusan terbaharu pada penanda aras seperti GPQA Diamond dan FrontierMath. OpenAI menyatakan peningkatan ini membantu kemajuan penyelidikan, termasuk menyelesaikan masalah teoretikal terbuka dan menjana bukti matematik yang lebih boleh dipercayai.
Google DeepMind Blog
11 Dec 2025
Google DeepMind mengukuhkan kerjasama dengan UK AI Security Institute untuk mempertingkatkan penyelidikan keselamatan dan sekuriti kritikal AI. Kolaborasi ini menumpukan kepada penyelidikan bersama dan perkongsian kepakaran antara kedua pihak.
OpenAI News
11 Dec 2025
OpenAI menyemak perjalanan 10 tahun dari penemuan awal kepada sistem AI yang meluas digunakan. Mereka berkongsi pengajaran dekad lalu dan menyatakan optimisme berterusan terhadap pembinaan AGI yang memberi manfaat kepada seluruh kemanusiaan.
OpenAI News
11 Dec 2025
GPT‑5.2 ialah keluarga model terkini dalam siri GPT‑5 dan menggunakan pendekatan mitigasi keselamatan yang serupa dengan kad sistem GPT‑5 dan GPT‑5.1. Model ini dilatih pada set data pelbagai termasuk maklumat awam di internet, data daripada rakan kongsi pihak ketiga, dan input daripada pengguna serta jurulatih manusia.