2026, le début de l'année, la architecture mHC de DeepSeek a encore franchi une nouvelle étape.
Il faut dire que, en largeur, HC a toujours rencontré des goulots d'étranglement en termes d'expansion — stabilité médiocre, évolutivité limitée. mHC est conçu pour briser ce plafond. Il conserve non seulement la méthode traditionnelle de empilement vertical du transformer, mais ouvre également la porte à un flux d'informations parallèle en largeur, rendant le traitement multi-flux possible.
Que cela signifie-t-il ? Le modèle peut à la fois s'empiler verticalement et s'étendre horizontalement. La dimension d'expansion passe d'une à deux dimensions. En continuant à évoluer, le plafond de capacité est encore repoussé.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
6 J'aime
Récompense
6
4
Reposter
Partager
Commentaire
0/400
LiquidationOracle
· Il y a 9h
Wow, mHC, cette chose est vraiment impressionnante, l'idée d'étendre en deux dimensions est vraiment audacieuse.
Voir l'originalRépondre0
Hash_Bandit
· Il y a 9h
ngl, la technique de mise à l'échelle en 2D semble familière... n'avons-nous pas essentiellement essayé cela avec le clustering ASIC précoce ? le débit horizontal atteint toujours un plafond thermique à un moment donné. on verra si DeepSeek a vraiment trouvé la formule magique pour la parallélisation cette fois ou si c'est juste le cycle habituel de hype qui tourne encore.
Voir l'originalRépondre0
AirdropHunterKing
· Il y a 10h
Mec, si ce mHC peut vraiment se déployer horizontalement et empiler verticalement, ce serait le rythme du « deux dimensions » pour le farming, l’évolutivité serait déployée, combien de gas cela permettrait-il d’économiser ?
DeepSeek a fait un bon coup, mais il faut voir comment cela se concrétise par la suite, aussi impressionnant que cela puisse paraître, il faut attendre que les données d’interaction réelles parlent.
Les optimisations d’architecture précédentes n’ont finalement abouti qu’à des tokens sans valeur, cette fois-ci, ce ne sera pas encore une autre mise en scène, n’est-ce pas ?
Voir l'originalRépondre0
AirdropDreamer
· Il y a 10h
L'échelle en 2D, là ça change vraiment, on peut étirer à la fois horizontalement et verticalement, on a l'impression que le plafond n'a pas de fin
2026, le début de l'année, la architecture mHC de DeepSeek a encore franchi une nouvelle étape.
Il faut dire que, en largeur, HC a toujours rencontré des goulots d'étranglement en termes d'expansion — stabilité médiocre, évolutivité limitée. mHC est conçu pour briser ce plafond. Il conserve non seulement la méthode traditionnelle de empilement vertical du transformer, mais ouvre également la porte à un flux d'informations parallèle en largeur, rendant le traitement multi-flux possible.
Que cela signifie-t-il ? Le modèle peut à la fois s'empiler verticalement et s'étendre horizontalement. La dimension d'expansion passe d'une à deux dimensions. En continuant à évoluer, le plafond de capacité est encore repoussé.