Noticias de CoinWorld, Doubao doubao-seed-2.0-lite se ha actualizado a un modelo de comprensión multimodal completo, la versión lite supera a la pro en varias métricas, y su rendimiento en reconocimiento de voz es mejor que Gemini 3.1 Pro.


Este modelo procesa simultáneamente videos, imágenes, audio y texto, soportando la transcripción de voz en 19 idiomas y la traducción mutua en 16 idiomas.
En el aspecto visual, la nueva versión lite supera a doubao-seed-2.0-pro en métricas de disciplinas avanzadas como razonamiento físico y preguntas médicas, y alcanza el estado del arte en percepción de detalles finos y comprensión encarnada.
El modelo está adaptado a frameworks como openclaw y hermes agent, fortaleciendo la descomposición de tareas en múltiples pasos y la estabilidad en tareas a largo plazo, soportando la ejecución continua de procesos comerciales a través de diferentes aplicaciones.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado