NVIDIA publie les poids du modèle phare Cosmos-Reason2-32B et étend la fenêtre de contexte à 256 000 jetons

Beating : NVIDIA a publié les poids de Cosmos-Reason2-32B, la version phare de sa vision-langage d’IA physique (VLM) axée sur le raisonnement, conçue pour aider les robots et les systèmes de conduite autonome à comprendre des principes spatiaux, temporels et physiques. Le modèle de 32 milliards de paramètres, basé sur Qwen3-VL-32B-Instruct, est disponible sous la NVIDIA Open Model License pour un usage commercial.

Le modèle peut analyser des flux vidéo pour évaluer la sécurité routière, détecter des objets sur des images avec des coordonnées 2D/3D, et servir de moteur de planification pour les robots humanoïdes et les véhicules autonomes. Par rapport à la génération précédente, Cosmos-Reason2 ajoute la détection d’objets avec une localisation temporelle précise et étend la fenêtre de contexte à 256K tokens.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire