PANews, le 27 novembre - Selon des informations de Zhitong Finance, DeepSeek a lancé un nouveau modèle de raisonnement mathématique, DeepSeekMath-V2, qui utilise un cadre d'entraînement auto-validable. Ce modèle est construit sur la base de DeepSeek-V3.2-Exp-Base, et il passe en revue automatiquement les preuves mathématiques générées grâce à un vérificateur LLM, tout en optimisant continuellement ses performances avec des échantillons de haute difficulté.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
DeepSeek a lancé le modèle DeepSeekMath‑V2
PANews, le 27 novembre - Selon des informations de Zhitong Finance, DeepSeek a lancé un nouveau modèle de raisonnement mathématique, DeepSeekMath-V2, qui utilise un cadre d'entraînement auto-validable. Ce modèle est construit sur la base de DeepSeek-V3.2-Exp-Base, et il passe en revue automatiquement les preuves mathématiques générées grâce à un vérificateur LLM, tout en optimisant continuellement ses performances avec des échantillons de haute difficulté.