Meituan lança modelo LongCat-2.0 com um bilião de parâmetros e 30 biliões de tokens a 30 de junho

Segundo a Jin10, a Meituan lançou o LongCat-2.0, um novo modelo de linguagem de grande escala com biliões de parâmetros, a 30 de junho e anunciou a sua disponibilidade como código aberto. O conjunto de dados de pré-treinamento do modelo excede 30 biliões de tokens e abrange chinês, inglês, várias línguas e código. A equipa da Meituan abordou desafios de hardware e computacionais no treino em larga escala em dez mil GPUs, melhorando a estabilidade do sistema e reduzindo a taxa média mensal de falhas diárias em mais de 70 por cento através de mecanismos de recuperação automatizados e protocolos de verificação de consistência.
Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário