Согласно мониторингу Beating.AI, в списке выбора моделей Google Cloud по состоянию на 17 мая появилась новая опция модели под названием gemini-3.2-flash-lite-live-preview. Суффиксы «lite» и «live» указывают на то, что Google создает специализированную версию, оптимизированную для сверхнизкой задержки при интерактивных взаимодействиях в реальном времени.
Ранее генеральный директор Abacus.AI Бинду Редди сообщила, что Gemini 3.2 Flash обеспечивает 92% возможностей кодирования и рассуждений GPT-5.5, при этом затраты на инференс составляют лишь 1/20 от затрат GPT-5.5, а большинство запросов возвращают ответы менее чем за 200 миллисекунд. Ожидается, что этот ориентированный на снижение издержек облегчённый модель будет официально представлен на Google I/O 20 мая.
Related News
Следующие крупнейшие крипто-победители: лучшие монеты с потенциалом 1000x
X опубликовал исходный код алгоритма рекомендаций «For You»: практическое руководство по управлению аккаунтами в Twitter с помощью алгоритма
OpenAI добавила обнаружение кризисных диалогов в ChatGPT, улучшив способность предупреждать о самоповреждающем насилии