NVIDIA відкриває вихідний код архітектури TwoTower, досягаючи прискорення генерації тексту в 2,42 рази

За даними Beating, NVIDIA відкрила вихідний код Nemotron-Labs-TwoTower — дискретної архітектури дифузії тексту, призначеної для прискорення генерації тексту великими мовними моделями. Двобаштова конструкція розділяє заморожену авторегресійну модель, яка зберігає здатність до міркувань, і навчальну вежу знешумлення, що генерує текст паралельно. Використовуючи лише 1/12 базових даних попереднього навчання на моделі Mamba-Transformer mixture-of-experts із 30 мільярдами параметрів, TwoTower зберіг 98,7% базової якості, збільшивши швидкість генерації в 2,42 раза без додаткових витрат пам'яті.
Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів