D’après le suivi de 1M AI News, la société d’infrastructure de raisonnement Fireworks AI a publié une version bêta de Fireworks Training, passant d’une plateforme de raisonnement pur à une plateforme intégrée pour l’entraînement et le déploiement. Fireworks AI a été fondée par Qiao Lin (Lin Qiao), ancienne ingénieure chez Meta ayant participé à la construction de PyTorch. Sa valorisation s’élève à 4 milliards de dollars, et le volume de tokens traité par jour atteint 1 500 milliards.

La plateforme propose trois niveaux :

Training Agent : destiné aux équipes produit qui n’ont pas d’infrastructure ML, vous décrivez la tâche et téléversez les données, et vous obtenez le processus complet de l’entraînement au déploiement. Actuellement, il ne prend en charge que LoRA.
Managed Training : destiné aux ingénieurs ML, prend en charge le SFT, le DPO et l’ajustement par renforcement, avec entraînement en paramètres complets.
Training API : destiné aux équipes de recherche, vous permet de personnaliser les fonctions de perte et la boucle d’entraînement, et prend en charge des algorithmes tels que GRPO, DAPO, etc.

L’échelle de l’entraînement en paramètres complets va d’un Qwen3 8B sur un nœud unique jusqu’à Kimi K2.5 (paramètres en billions) sur 64 cartes NVIDIA B200.

Les clients de raisonnement en production de Fireworks AI, notamment l’outil de programmation IA Cursor, Vercel et Genspark, ont déjà achevé des entraînements d’apprentissage par renforcement de pointe sur cette plateforme. Vercel a entraîné un modèle de correction automatique pour son produit de génération de code v0 ; le taux de génération de code sans erreur atteint 93 %. Son CTO, Malte Ubl, indique qu’en comparaison, Sonnet 3.5 n’est qu’à 62 %, et que la latence de bout en bout s’améliore de 40 fois par rapport aux modèles propriétaires utilisés auparavant. Genspark réalise un ajustement par apprentissage par renforcement du modèle open source Kimi K2 de plusieurs billions de paramètres afin de construire un agent de recherche approfondie ; le volume d’appels d’outils augmente de 33 % et les coûts diminuent de 50 %. Cursor a terminé un entraînement par renforcement de Composer 2 de manière distribuée sur 3 à 4 clusters à l’échelle mondiale (actuellement classé n° 1 dans CursorBench) ; l’entraînement et le raisonnement en production partagent le même pool de GPU.

La différenciation technique centrale mise en avant par Fireworks AI est la cohérence numérique entre l’entraînement et l’inférence. Les modèles MoE (mélange d’experts) sont plus fragiles numériquement que les modèles denses ; de minuscules variations des états cachés peuvent inverser le routage des experts et amplifier ensuite en cascade. Fireworks publie pour tous les modèles pris en charge la valeur de la divergence KL entre l’entraînement et l’inférence, qui est toujours inférieure à 0.01.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.

Commentaire

0/400

Aucun commentaire