Всебічна оцінка Veo 3 лише проаналізувала понад 18 000 відео за якості та кількісними показниками. Що вражає, так це здатність моделі сприймати, редагувати та взаємодіяти з візуальним середовищем, починаючи лише з зображень і текстових вводів. Система демонструє ранні можливості логічного мислення, які з’явилися без явного навчання в цих сферах—що є значним кроком уперед у тому, як ШІ розуміє та маніпулює візуальним контентом. Така мультимодальна компетентність змінює наші очікування від моделей генерації відео наступного покоління.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
8 лайків
Нагородити
8
5
Репост
Поділіться
Прокоментувати
0/400
BtcDailyResearcher
· 2025-12-31 20:30
Чорт, Veo 3 можна зрозуміти візуальне середовище прямо з графіки та тексту? Ця здатність до емердженції трохи лякає.
Переглянути оригіналвідповісти на0
ForkInTheRoad
· 2025-12-31 13:33
Боже, понад 18000 відео для тестування? Яка ж ця кількість даних вражаюча, здається, Veo 3 дійсно тихо робить великі справи
Переглянути оригіналвідповісти на0
mev_me_maybe
· 2025-12-28 21:47
ngl ця здатність до появи дійсно не витримує, вона сама придумана без тренування... відчувається, що ми ближче до універсального AGI
Переглянути оригіналвідповісти на0
gas_fee_therapy
· 2025-12-28 21:39
veo3 ця кількість даних дійсно вражає, понад 18000 відео зразків, і з їхньою допомогою з'являється така здатність до логічних висновків... але чесно кажучи, відчувається, що ще трохи не вистачає для справжнього візуального мислення.
Переглянути оригіналвідповісти на0
MetaEggplant
· 2025-12-28 21:28
veo3 цього разу справді крутий, не повідомляючи явно про тренування, він сам навчився робити висновки, і саме тут полягає справжня страшна частина
Всебічна оцінка Veo 3 лише проаналізувала понад 18 000 відео за якості та кількісними показниками. Що вражає, так це здатність моделі сприймати, редагувати та взаємодіяти з візуальним середовищем, починаючи лише з зображень і текстових вводів. Система демонструє ранні можливості логічного мислення, які з’явилися без явного навчання в цих сферах—що є значним кроком уперед у тому, як ШІ розуміє та маніпулює візуальним контентом. Така мультимодальна компетентність змінює наші очікування від моделей генерації відео наступного покоління.