Cursor опубліковує технічний звіт Composer 2, базова модель покращила оцінку на 70%

Gate News повідомляє, що 25 березня Cursor опублікував технічний звіт Composer 2, вперше розкривши повний план тренування. Базова модель Kimi K2.5 побудована на архітектурі MoE, має загальну кількість параметрів 1,04 трильйона та 32 мільярди активних параметрів. Тренування проходить у два етапи: спочатку додаткове попереднє тренування на кодових даних для зміцнення знань кодування, потім — масштабне підкріплювальне навчання для покращення здатності кодування від кінця до кінця. Середовище RL повністю імітує реальні сценарії використання Cursor, включаючи редагування файлів, командний рядок, пошук коду та виклики інструментів, що дозволяє моделі навчатися у умовах, близьких до виробничих. Звіт також одночасно опублікував методику створення власного бенчмарку CursorBench: збір завдань із реальних сеансів кодування інженерної команди, а не штучно створених. Базова модель Kimi K2.5 отримала 36.0 балів на цьому бенчмарку, а після двох етапів тренування Composer 2 досяг 61.3 балів, що становить зростання на 70%. Cursor заявляє, що її модель має значно нижчі витрати на обчислення порівняно з передовими великими моделями API, забезпечуючи оптимальний баланс між точністю та витратами.

Переглянути оригінал
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів