NVIDIA disponibiliza em código aberto a arquitetura TwoTower, alcança uma aceleração de geração de texto de 2,42x

Segundo a Beating, a NVIDIA disponibilizou como código aberto o Nemotron-Labs-TwoTower, uma arquitetura de difusão de texto discreta concebida para acelerar a geração de texto em modelos de linguagem de grande escala. O design de torre dupla desacopla um modelo autorregressivo congelado que preserva a capacidade de raciocínio de uma torre de remoção de ruído treinável que gera texto em paralelo. Utilizando apenas 1/12 dos dados de pré-treino de base num modelo de mistura de especialistas Mamba-Transformer com 30 mil milhões de parâmetros, o TwoTower manteve 98,7% da qualidade de base, aumentando a velocidade de geração em 2,42 vezes sem sobrecarga de memória adicional.
Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário