Gate-News-Meldung, 23. April — Tencent hat Hunyuan Hy3-Vorschau vorgestellt und Open Source gestellt: ein hybrides Mixture-of-Experts-Sprachmodell mit einer Fusion aus schnellem und langsamen Denken. Das Modell umfasst 295 Milliarden Gesamtparameter mit 21 Milliarden aktiven Parametern und unterstützt eine maximale Kontextlänge von 256K Tokens.
Die Hy3-Vorschau ist das erste Modell, das nach der Umstrukturierung von Hunyuan trainiert wurde, und Tencents bislang intelligentestes Modell. Das Unternehmen berichtet über deutliche Verbesserungen bei komplexem Schlussfolgern, dem Befolgen von Anweisungen, In-Context Learning, Code-Generierung, agentischen Fähigkeiten und der Inferenzleistung. Der Chef-AI-Wissenschaftler Yao Shunyu erklärte, dass die Hy3-Vorschau den ersten Schritt der Rekonstruktion von Hunyuan markiert, und äußerte die Hoffnung, dass das Feedback der Open-Source-Community die praktische Nutzbarkeit der formalen Version verbessern wird.
Tencent skaliert parallel das Pretraining und Reinforcement Learning, um die intellektuelle Obergrenze des Modells anzuheben, und arbeitet mit mehreren Tencent-Produkten durch tiefes Co-Design zusammen, um die Leistung in der realen Welt zu verbessern. Das Unternehmen beginnt außerdem damit, spezialisierte Modellfähigkeiten zu erforschen.