Microsoft представила функции Critique и Council для Copilot Researcher; тестирование DRACO показало 57,4 балла, опережая отрасль

GateNews

Gate News сообщении, 31 марта, в понедельник Microsoft объявила о выпуске двух новых функций для Copilot Researcher — Critique и Council, которые объединяют GPT от OpenAI и Claude от Anthropic для выполнения одной исследовательской задачи. Critique использует последовательный совместный режим: GPT отвечает за планирование исследования, поиск материалов и создание черновика, после чего Claude выступает в роли рецензента, проверяя точность фактов и качество цитирования; Council же позволяет двум моделям параллельно и независимо генерировать отчеты, а затем третий модель-арбитр сравнивает различия и обобщает разногласия. В тесте бенчмарка DRACO, включающем 100 сложных исследовательских задач в 10 областях, таких как медицина, право и технологии, Copilot с Critique набрал 57.4 балла, опередив второе место почти на 14%, что значительно выше, чем 42.7 балла у одиночного запуска Claude Opus 4.6.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев