Квантовый взгляд на оценку ИИ: ожидания прибыли у всех меньше 1, насколько далеко искусственный интеллект от замены трейдеров?

PANews

2025-11-24 06:43:22

Автор: Фрэнк, PANews

Если бы вам дали 10000 долларов, какому искусственному интеллекту вы бы доверили управлять вашими средствами?

Ранее PANews провел обзор AI-торгового соревнования от nof1.ai (см. также: Шесть основных AI «трейдеров» Десятидневное противостояние: открытый урок о трендах, дисциплине и жадности). Однако во время соревнования nof1.ai его временные рамки касались определенного периода рынка, и конечные торговые способности различных больших AI-моделей, похоже, не могли полностью проявиться в рамках конкретного торгового цикла. Кроме того, людям также срочно нужен ответ на вопрос о реальных предсказательных способностях AI-моделей в различных условиях. Вдобавок, в последнее время различные AI-компании выпустили новые большие модели, и рейтинг их способностей находится на этапе переоценки.

Чтобы разгадать эту загадку, PANews организовал «Соревнование трейдеров на базе ИИ». Узнайте о способности больших моделей ИИ оценивать рыночные условия и разрабатывать торговые планы в различных сценариях. Например, какие временные рамки анализа рынка им больше подходят и повысится ли процент успешных прогнозов ИИ при наличии вспомогательных индикаторов.

Мы расширили временную шкалу с 2017 года до сегодняшнего дня и случайным образом выбрали 100 реальных фрагментов рынка из исторических данных BTC Binance, создав три уровня адских тестовых сценария: “4-часовой голый K”, “15-минутный краткосрочный”, “4-часовой полный индикатор”. Шестеро участников соревнования представляют собой вершину вычислительной мощности в Китае и США: Gemini-3-pro, Doubao-1.6-vision, DeepSeek V3.2, Grok 4.1, GPT-5.1, Qwen3-max.

В этом тестировании были собраны данные о 15-минутных свечах торговой пары BTC на Binance с августа 2017 года по настоящее время, а также 4-часовые свечные данные с 2021 года по настоящее время. Для каждого периода случайным образом генерировалось 50 изображений с временным интервалом в 100 свечей. 4-часовые графики делятся на два типа: один — это графики только с свечами и объемом торгов, другой — графики свечей с информацией о таких индикаторах, как EMA, SMA, полосы Боллинджера, MACD, RSI и т.д. 15-минутные графики свечей являются голыми графиками (с объемом торгов). Также синхронизируются конкретные значения цен или индикаторов, соответствующие текущему графику свечей, для AI. Все результаты, выведенные AI, можно просмотреть здесь.

Схема с индикаторами на 4 часа

Схема чистых свечей на 4 часа

В процессе тестирования данные и команды, получаемые каждой крупной моделью, полностью идентичны. С другой стороны, это также проверяет многомодальные способности этих крупных моделей (DeepSeek, так как у него есть только текстовая большая модель, в конечном итоге получает только данные, без передачи изображений).

Gemini 3 : Король голого K, запечатанный «индикаторами»

Gemini 3 является наиболее популярной AI большой моделью на данный момент, судя по отзывам и тестам в СМИ после его выпуска 18 ноября, это, безусловно, самая сильная AI мультидоменная модель на сегодняшний день. Однако в тестах на прогнозирование сделок результаты Gemini 3 не являются лучшими, можно сказать, что они находятся в пределах нормы. В трех сценах (4-часовой голый K, 4-часовой с индикаторами, 15-минутный голый K) Gemini 3 показал лучший результат в сцене 4-часового голого K, где процент побед составил 39,58%, затем в 15-минутной голой K сцене 34,04%, в то время как при наличии индикаторов (в тот же временной период) точность 4-часового периода снизилась до 31%, что является худшим результатом среди трех сцен.

С этой точки зрения, Gemini 3, похоже, лучше справляется с чистыми состояниями свечных формаций, и при наложении индикаторов он легко поддается влиянию. В процессе конкретной операции, без индикаторов, Gemini 3, кажется, более смел в открытии позиций; в условиях чистых свечей 95% рынка выбирают вход, в то время как с добавлением индикаторов этот показатель снижается до 71%. Стоит отметить, что Gemini 3 является единственной моделью, которая приносит прибыль в условиях чистых свечей на 4-часовом графике.

В 15-минутном сценарии общая прибыль Gemini 3 была наилучшей, общая прибыль составила 15,34%, тогда как в сценарии с индикаторами произошло убыток в 21,18%. Тем не менее, эта прибыль также является краткосрочной удачей, учитывая данные о соотношении прибыли и убытков, прибыльные ожидания Gemini 3 (вероятность выигрыша * соотношение прибыли и убытков) ниже 1, что означает, что в долгосрочной перспективе это приводит к убыткам.

DeepSeek V3.2: надежная, как старая собака, «сверхкороткая торговая машина»

DeepSeek является моделью с наилучшей общей производительностью среди шести моделей, и, как правило, также самой стабильной. В трех сценариях (4-часовой голый график, 4-часовой график с индикаторами, 15-минутный голый график) процент побед составил 40%, 41,38%, 42,86% соответственно. С этой точки зрения, предсказательные способности DeepSeek относительно стабильны в различных временных интервалах и при наличии или отсутствии индикаторов.

Тем не менее, окончательная прибыль DeepSeek не была хорошей, из-за слишком низкого соотношения прибыль/убыток, среднее значение которого составляет всего 1,25. Это соотношение прибыли и убытка, при котором фиксируются выигрыши, также свидетельствует о том, что DeepSeek не обладает способностью позволить прибыли расти во время торговли. В результате, это приводит к тому, что их ожидаемая прибыль почти всегда составляет около 0,5, что также указывает на отсутствие возможностей для получения прибыли в долгосрочной перспективе. Кроме того, DeepSeek также относительно консервативен в отношении принятия решений о открытии позиций, общий коэффициент открытия позиций составляет всего 58%.

Доубао (豆包): В этом соревновании “Универсальный MVP”

В этом тестовом соревновании综合结果 Doubao1.6-vision был лучшим. В сценах с 4-часовыми индикаторами коэффициент побед Doubao1.6-vision достиг максимальных значений в тестировании, составив 50%, а итоговая прибыль составила 22,2%. В то же время в коротком периоде в 15 минут общая прибыль также составила 8,2%. Это единственная модель, которая стабильно приносит прибыль в двух различных измерениях (короткие позиции и 4-часовые индикаторы).

Кроме того, результаты Doubao1.6-vision не были достигнуты в относительно консервативном стиле, а были получены при среднем уровне открытия позиций выше 92%. Это означает, что Doubao1.6-vision в большинстве сценариев выбирает открытие позиций. Однако, относительно, возможности Doubao1.6-vision также сильно зависят от индикаторных сигналов; при отсутствии индикаторов общая прибыль отличается на 38%. Кроме того, судя по данным о соотношении прибыли и убытков, Doubao1.6-vision имеет высокое соотношение положительных и отрицательных результатов в двух периодах с положительной доходностью, что также является причиной его общей выдающейся производительности.

Grok 4.1: “Радикальный азартный игрок” от xAI

Общий стиль Grok 4.1 - это смелость, но с зависимостью от квартальных индикаторов, при этом готовность преследовать большую прибыль. В трех сценариях только с индикаторами на 4-часовом графике в течение недели Grok 4.1 достиг 34,69% выигрышной ставки, в оставшихся двух сценариях процент побед крайне низок. В случае чистых свечей на 4-часовом графике процент побед составляет всего 14,58%, а на 15-минутном интервале - 26,53%. Однако средний процент открытия позиций составляет целых 98%, и он почти всегда готов открывать позиции в любых сценариях свечей. С этой точки зрения стиль Grok 4.1 больше похож на игрока, который не может контролировать свои руки.

Однако соотношение прибыли и убытков у Grok 4.1 часто довольно высокое, в среднем достигая 2, что является самым высоким показателем среди всех моделей. Но в целом, если вы доверите свои средства Grok 4.1, это не будет разумным выбором.

GPT 5.1: крайне осторожные “медвежьи” пессимисты

Стиль открытия сделок GPT 5.1 и Grok 4.1 совершенно противоположен. GPT 5.1 в этом плане достигает крайности в своей осторожности, в большинстве случаев он предпочитает наблюдать. В итоге из 150 тестов было открыто только 52 сделки, средний коэффициент открытия позиций составил всего 0,34%.

Тем не менее, даже такая осторожность не смогла обеспечить GPT 5.1 лучшую процентную вероятность победы. В лучших сценариях она достигла лишь 35% вероятности победы. Кроме того, по сравнению с периодами в 4 часа и 15 минут, GPT 5.1 явно не очень хорошо справляется с открытием позиций на длительные циклы, даже с добавлением технических индикаторов, вероятность победы на 4-часовом графике составляет всего 27%. А на 15-минутном графике, благодаря высокому соотношению прибыли к убытку (2,02), удалось получить положительный отклик по доходности, окончательный результат составил 9,9%.

Кроме того, у GPT 5.1 есть одна особенность — явный пессимизм, он очень склонен к шортам. Более 70% заказов — это шортовые позиции.

Qwen 3: бережливый “склоняющийся к риску”

Qwen 3, безусловно, является самым осторожным большим моделем, за все время тестирования он открыл позиции всего 44 раза, коэффициент открытия составляет всего 29%. Однако, как и GPT, эта крайняя осторожность не привела к более высокой вероятности выигрыша. Его средний уровень выигрыша составляет всего 34%, наилучший результат наблюдается в сценарии с индикаторами на 4-часовом графике.

Кроме того, коэффициент прибыли и убытков Qwen 3 также довольно высок. Он достигает 1,96. Похоже, он принадлежит к игрокам с рисковым подходом, лучше справляясь с уменьшением количества открытых позиций, но позволяя прибыли расти. А в сценарии с индикатором за 4 часа ожидание прибыли Qwen 3 также самое близкое к прибыли, достигая 0,95, что является самым высоким показателем среди всех моделей.

Сводка данных

Резюме:

В целом, мы, возможно, получили следующие выводы из этих симуляций торговли с ИИ.

Во-первых, для подавляющего большинства моделей наличие индикаторов дает больше уверенности, чем чистые графики цен. С индикаторами средний коэффициент выигрыша для этих шести моделей составил 38%, тогда как без индикаторов он составил всего 30%.

Во-вторых, ИИ может быть более успешным в краткосрочной торговле, чем в долгосрочной. В условиях 15-минутного чистого графика средний коэффициент выигрыша шести крупных моделей достигает 34%, что выше 30% в четырехчасовом периоде. Из шести моделей три приносят прибыль (Gemini, GPT, Doubao), и среднее соотношение прибыли к убыткам в целом довольно хорошее.

Третье, полностью доверять позиции ИИ нецелесообразно. В ходе этого тестирования все модели ИИ имели ожидаемую прибыль ниже 1, что также говорит о том, что при долгосрочном взгляде на такую процентную ставку и соотношение прибыли и убытков, их конечный результат будет убыточным. Просто разница лишь в скорости потерь (хотя здесь не проводилась специализированная настройка моделей ИИ, а использовались лишь довольно простые общепринятые индикаторы). Поэтому, если вы хотите, чтобы ИИ заменил вас в торговле, возможно, потребуется более сложный процесс настройки и больше данных для обратного тестирования.

Когда эта битва вычислительных мощностей подошла к концу, глядя на окончательную цифру на счете, мы, возможно, получаем самый важный вывод, который заключается не в том, “какая модель самая сильная”, а в том, “где границы AI торговли”. В конечном итоге, вывод таков: сегодняшний AI, возможно, еще не может непосредственно заменить отличного фондового менеджера, но он уже эволюционировал в относительно зрелого торгового помощника, некоторые из которых хорошо разбираются в графиках, некоторые хорошо контролируют риски, а некоторые хорошо анализируют данные для достижения стабильной выигрышной ставки. Что касается растущих ожиданий людей от AI, то желание заменить человека в торговле AI по-прежнему остается сложной задачей.

BTC1.89%

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .