NVIDIA meluncurkan Nemotron 3 Nano Omni, multimodal sumber terbuka
NVIDIA mengumumkan model multimoda open-source Nemotron 3 Nano Omni, yang mengintegrasikan visual, suara, dan bahasa dalam satu model sebagai lapisan persepsi untuk AI agent. Intinya adalah 30B-A3B MoE, context 256K, dan throughput 9x; mendukung input teks, gambar, audio, video, dan lainnya, dengan output berupa teks. Dipadukan dengan Nemotron 3 Super/Ultra, ditujukan untuk skenario seperti operasi komputer, kecerdasan dokumen, serta pemahaman audio-visual. Bobot dan data pelatihan dipublikasikan, dengan opsi penyebaran mencakup lokal, NIM, dan platform pihak ketiga.
ChainNewsAbmedia·05-07 10:56