Біблія арбітражу Polymarket: справжня різниця полягає у математичній інфраструктурі

Для торгів на Polymarket потрібна математика (повна дорожня карта)

Автор: Roan

Джерело:

Переклад: Mars Finance

У процесі створення @insidersdotbot я глибоко спілкувався з командами високочастотних маркетмейкерів і арбітражних команд. Одним із найважливіших запитів було — як розробляти арбітражні стратегії.

Наші користувачі, друзі, партнери — всі досліджують складний і багатовимірний шлях арбітражу на Polymarket. Якщо ви активний користувач Twitter, то, ймовірно, бачили пости типу: «Я заробив @XX на арбітражі у прогнозних ринках».

Однак більшість статей спрощують логіку арбітражу до рівня «я можу», «Clawdbot вирішить» — і не пояснюють системний підхід до розуміння та розробки власних арбітражних систем.

Якщо ви хочете зрозуміти, як працюють інструменти арбітражу на Polymarket і як вони заробляють — ця стаття є найповнішою з усіх, що я бачив.

Через технічну складність англійського оригіналу я зробив реконструкцію і доповнення, щоб вам було достатньо однієї статті — без додаткових пошуків — щоб зрозуміти всі ключові моменти.

Арбітраж на Polymarket — не просто математика

На Polymarket ви бачите ринок:

YES — $0.62, NO — $0.33.

Думаєте: 0.62 + 0.33 = 0.95 — і є можливість арбітражу! Купуючи одночасно YES і NO за $0.95, незалежно від результату, отримаєте $1.00 — і заробите $0.05.

Ви праві.

Але проблема в тому, що — поки ви вручну рахуєте цю суму, автоматизована система вже робить зовсім інше.

Вона одночасно сканує 17 218 умов, аналізує 2^63 можливих комбінацій результатів і за мілісекунди знаходить усі цінові суперечності. Як тільки ви розміщуєте дві транзакції, різниця зникає. Система вже давно знайшла ці ж вразливості у десятках ринків, розрахувала оптимальні обсяги з урахуванням глибини книг і комісій, виконує всі операції паралельно і перекидає кошти до наступної можливості.[1]

Різниця не лише у швидкості. Це — математична інфраструктура.

Глава 1: Чому «додавання» недостатньо — проблема маргінального многогранника

Помилка у одному ринку

Розглянемо простий приклад.

Ринок А: «Чи виграє Трамп вибори у Пенсильванії?»

YES — $0.48, NO — $0.52. Разом — $1.00.

Здається ідеально, арбітражу немає, так?

Ні.

Додамо ще один ринок:

Ринок В: «Чи обійде Республіканець опонента більш ніж на 5% у Пенсильванії?»

YES — $0.32, NO — $0.68. Разом — $1.00.

Обидва ринки «нормальні». Але тут є логічна залежність:

Президентські вибори — це не підрахунок голосів по всій країні одночасно, а по штатах. Кожен штат — окремий «фронт». Хто у штаті отримує більше голосів — той отримує всі виборчі голоси цього штату (перемагає — все). Трамп — кандидат від Республіканців. Тому «Республіканець у Пенсильванії виграв» і «Трамп у Пенсильванії виграв» — одна й та сама річ. Якщо Республіканець виграв більш ніж на 5%, це означає, що Трамп виграв і у цьому штаті, і з великим запасом.

Інакше кажучи, YES на ринку В (перемога Республіканця з великим запасом) — підмножина YES на ринку А (перемога Трампа). Велика перемога — означає перемогу, але перемога не обов’язково велика.

Ця логіка створює можливості для арбітражу.

Це схоже на ставку на два події — «Чи буде завтра дощ?» і «Чи буде гроза завтра?»

Якщо буде гроза, то обов’язково буде дощ (гроза — підмножина дощу). Тому ціна на «Гроза — так» не може бути вищою за ціну на «Дощ — так». Якщо ціни порушують цю логіку, можна купити дешевше і продати дорожче — і отримати «безризиковий прибуток», тобто арбітраж.

Вибух індексів: чому брутальний пошук не працює

Для будь-якого ринку з n умовами теоретично існує 2^n можливих цінових комбінацій.

Звучить просто? Розглянемо реальний приклад.

Ринок NCAA 2010 року [2]: 63 матчі, кожен з двома результатами — виграш або програш. Можливих комбінацій — 2^63 = 9 223 372 036 854 775 808 — понад 9 квінтильйонів. На ринку понад 5000 лотів.

Як велике число 2^63? Якщо перевіряти 1 мільярд комбінацій за секунду, потрібно приблизно 292 роки, щоб пройти всі. Тому «брутальний пошук» тут — зовсім не варіант.

Перевіряти кожну комбінацію — нереально.

Ще приклад — президентські вибори у США 2024 року. Дослідники виявили 1576 пар ринків із залежностями. Якщо кожна пара має по 10 умов, то потрібно перевірити 2^20 = 1 048 576 комбінацій на пару. Помножити на 1576 пар — і результат — вибори вже давно закінчились, поки ви це рахуєте.

Цілочисельне програмування: замість перебирання — обмеження

Рішення системи — не «швидше перебирать», а — зовсім не перебирать.

Вони використовують цілочисельне програмування (Integer Programming), щоб описати «які результати є допустимими».

Розглянемо реальний приклад. Ринок матчу Duke проти Cornell: кожна команда має 7 можливих результатів (0–6 перемог), всього 14 умов. Кількість комбінацій — 2^14 = 16 384.

Але існує обмеження: обидві команди не можуть виграти понад 5 матчів, бо тоді вони зустрінуться у півфіналі (може пройти лише один).

Як цілочисельне програмування вирішує цю задачу? Три обмеження:

· Обмеження 1: у 7 умовах Duke — рівно одна істина (Duke може мати лише один підсумковий результат).

· Обмеження 2: у 7 умов Cornell — рівно одна істина.

· Обмеження 3: сума перемог Duke і Cornell — не більше 1 (вони не можуть обидва виграти понад 5 матчів).

Три лінійні обмеження замінюють 16 384 перевірки.

Інакше кажучи, брутальний пошук — це читання кожного слова у словнику, щоб знайти потрібне. Цілочисельне програмування — це одразу перейти до потрібної сторінки. Не потрібно перевіряти всі можливості — достатньо описати «який має бути допустимий результат», і алгоритм знайде порушення.

Реальні дані: 41% ринків — арбітраж [2]

У статті згадується, що команда досліджувала дані з квітня 2024 до квітня 2025 року:

• Перевірили 17 218 умов

• 7051 — з них мають арбітраж у одному ринку (41%)

• Медіана цінового відхилення: $0.60 (з очікуваних $1.00)

• 13 пар ринків — з підтвердженим арбітражем між ринками

Медіана відхилення — $0.60 — означає, що ринки часто відхиляються на 40%. Це не «близько до ефективного», а — «масштабно exploitable».

Глава 2: Проєкція Брегмана — як обчислити найкращу арбітражну операцію

Знаходження арбітражу — це одна проблема. Обчислення найоптимальнішої — інша.

Не достатньо просто «зробити середнє» або «підкоригувати ціну». Потрібно «спроектувати» поточний стан ринку у допустимий простір без арбітражу, з урахуванням структури цін.

Чому «лінійна відстань» не підходить

Найінтуїтивніше — знайти найближчу до поточних цін «допустиму ціну», і торгувати різницею.

Математично — мінімізувати евклідову відстань: ||μ - θ||²

Але тут є критична проблема: вона вважає всі зміни цін однаковими.

Зростання з $0.50 до $0.60 і з $0.05 до $0.15 — обидва на 10 центів. Але інформаційна цінність різна.

Чому? Тому що ціна — це прихована ймовірність. Зміна з 50% до 60% — це помірна зміна погляду. А з 5% до 15% — це значний перекіс у переконаннях — майже неможливе подія раптово стає «можливою».

Уявіть, що ви зважуєтесь: з 70 кг до 80 кг — скажете «пішло набралося». А з 30 кг до 40 кг — це вже «загрожує життю». Той самий 10-кілограмовий приріст, але сенс різний. Аналогічно і ціна: чим ближче до 0 або 1, тим більше інформації вона несе.

Відстань Брегмана: правильна «відстань»

Маркетмейкери Polymarket використовують LMSR (логічний ринок-оцінювач) [4], де ціна — це ймовірність.

У такій структурі правильна міра відстані — не евклідова, а — дивергенція Брегмана [5].

Для LMSR ця дивергенція — KL-розбіжність (Кульбак-Лейблера) [6], що вимірює «інформаційний відстань» між двома ймовірностями.

Не потрібно запам’ятовувати формули. Потрібно зрозуміти одне:

KL-розбіжність автоматично надає більшу вагу «змінам у крайніх цінах». З $0.05 до $0.15 — більше, ніж з $0.50 до $0.60. Це відповідає нашій інтуїції — крайні ціни несуть більший інформаційний імпульс.

Приклад — у попередньому прогнозному ринку @zachxbt, коли Axiom у кінці обігнав Meteora, це був саме крайній ціновий рух.

Арбітражний прибуток = відстань проєкції Брегмана

Це — один із ключових висновків автора статті:

Максимальний гарантований прибуток — це відстань між поточним станом ринку і безарбітражним простором у дивергенції Брегмана.

Інакше кажучи: чим далі ціна від «допустимого простору», тим більше можна заробити. А дивергенція Брегмана підкаже:

  1. Що купувати/продавати (напрямок проєкції)

  2. Скільки (з урахуванням глибини книг)

  3. Скільки можна заробити (відстань — це максимум прибутку)

Найкращий арбітражник за рік заробив $2 009 631,76 [2]. Його стратегія — швидко і точно розв’язувати цю оптимізацію.

Уявіть: ви стоїте на горі, у підніжжя — річка (безарбітражний простір). Ваша позиція (поточна ціна) — на відстані від річки.

Дивергенція Брегмана — це шлях «від вашої позиції до берега», але не прямий, а — з урахуванням рельєфу (структури ринку). Довжина цього шляху — ваш потенційний прибуток.

Глава 3: Алгоритм Френка-Волфа — як зробити теорію реальністю

Тепер ви знаєте: щоб знайти найкращий арбітраж, потрібно зробити дивергенцію Брегмана.

Але — прямо обчислювати цю дивергенцію — неможливо.

Чому? Тому що безарбітражний простір (многогранник М) має експоненційно багато вершин. Стандартні методи оптимізації — вимагають доступу до всіх обмежень, тобто — перебирання всіх допустимих результатів. Це — нереально у масштабі.

Ідея алгоритму Френка-Волфа

Геніальність алгоритму [7] у тому, що він не намагається одразу розв’язати всю задачу, а — поступово наближається до відповіді.

Працює так:

  1. Починає з невеликого набору відомих допустимих результатів.

  2. На цьому наборі виконує оптимізацію — знаходить найкращий на даний момент.

  3. За допомогою цілочисельного програмування знаходить новий допустимий результат і додає його до набору.

  4. Перевіряє, чи достатньо близько до оптимального. Якщо ні — повторює.

Кожен крок додає один вершину. Навіть за 100 ітерацій — ви матимете лише 100 вершин, а не 2^63.

Уявіть — ви шукаєте вихід із лабіринту.

Брутальний метод — пройти кожен шлях. Алгоритм Френка-Волфа — спочатку обирає один шлях, а потім на кожному роздоріжжі питає «гідного» (інтелектуальне рішення — цілочисельне програмування): «Звідси — який шлях найкращий?» — і йде цим шляхом. Не потрібно досліджувати весь лабіринт, достатньо робити правильний вибір у ключових точках.

Розв’язувач цілочисельних задач: «гід»

Кожен крок алгоритму — це розв’язання цілочисельної лінійної програми. Це — NP-складна задача (тобто — «немає відомого швидкого універсального алгоритму»).

Але сучасні розв’язувачі, наприклад Gurobi [8], — дуже ефективні для структурованих задач.

Дослідницька команда використовує Gurobi 5.5. Час розв’язання:

• на початкових ітераціях (кілька матчів вже завершено): менше 1 секунди

• у середніх — 10–30 секунд

• у пізніх — менше 5 секунд

Чому у пізніх ітераціях швидше? Тому що зменшується кількість можливих рішень — результат стає більш визначеним, і обмеження — більш жорсткими.

Проблема вибуху градієнтів і бар’єрний Френка-Волф

Стандартний алгоритм Френка-Волфа має проблему: коли ціна близька до 0, градієнт LMSR — прямує до мінус безконечності. Це — нестабільно.

Рішення — бар’єрний Френка-Волфа: оптимізувати не на всьому многограннику М, а — на його «звуженій» версії. Параметр ε адаптивно зменшується з кожною ітерацією — спочатку віддалений від межі (стабільність), потім — все ближче до реальної межі (точність).

Дослідження показують, що 50–150 ітерацій — достатньо для сходження.

Реальні результати

У статті наведено важливий висновок [2]:

На перших 16 матчах NCAA — алгоритм FWMM (Frank-Wolfe Market Maker) і простий лінійний маркетмейкер (LCMM) показали схожу ефективність — через повільність цілочисельних розв’язувачів.

Але після 45 матчів — перша успішна проєкція за 30 хвилин.

З того моменту FWMM показує на 38% кращі ціни, ніж LCMM.

Ключовий момент — коли обсяг ринку зменшується до рівня, що цілочисельний розв’язувач може швидко знайти рішення.

FWMM — це студент, що в перший час «розігрівається», а потім починає «заводити». LCMM — стабільний, але з обмеженим потенціалом. Головна різниця — FWMM має «потужнішу зброю» (дивергенцію Брегмана), але потребує часу для «зарядки» (очікування рішення).

Глава 4: Виконання — чому, після обчислень, можна програти

Ви знайшли арбітраж і обчислили найкращу операцію.

Тепер потрібно її виконати.

Це — найскладніше.

Проблема неатомарного виконання

Polymarket використовує CLOB (централізований книг ордерів) [9]. На відміну від децентралізованих бірж, тут ордери виконуються послідовно — гарантії атомарності немає.

Ваш план:

Купити YES за $0.30. Купити NO за $0.30. Загальні витрати — $0.60. Незалежно від результату — отримати $1.00. Прибуток — $0.40.

Реальність:

· Подати ордер на YES — транзакція виконується за $0.30 ✓

· Ваш ордер змінює ціну.

· Подати ордер на NO — транзакція за $0.78 ✗

· Загальні витрати — $1.08. Віддаєте $1.00. Втрати — $0.08.

Одна транзакція пройшла, інша — ні. Ви піддалися ризику.

Саме тому у статті фіксується, що можливий прибуток має бути не менше $0.05 — менші цінові різниці ризик «з’їсть».

VWAP: реальна ціна виконання

Не припускайте, що ви можете купити за ціновою пропозицією. Потрібно враховувати середню ціну за обсягом — VWAP (volume-weighted average price) [10].

Дослідники на Polygon-мережі щосекунди рахує VWAP для кожного блоку (близько 2 секунд), і якщо |VWAP_YES + VWAP_NO - 1.0| > 0.02 — фіксують арбітраж [2].

VWAP — це «середня ціна, яку ви фактично заплатили». Якщо ви хочете купити 10 000 токенів, але на книгів $0.30 — лише 2000, на $0.32 — 3000, на $0.35 — 5000, то ваш VWAP — (2000×0.30 + 3000×0.32 + 5000×0.35) / 10000 = $0.326. Це дорожче за «оптимальну ціну» $0.30.

Обмеження ліквідності: скільки можна заробити

Навіть якщо ціна дійсно відхиляється, ваш потенційний прибуток обмежений глибиною книг.

Реальний приклад [2]:

Ринок показує арбітраж: сума YES — $0.85. Потенційний прибуток — $0.15 за долар. Але глибина книг — лише $234. Максимальний прибуток — $234 × $0.15 = $35.10.

Для міжринкового арбітражу потрібно одночасно мати ліквідність у всіх позиціях. Мінімальна глибина — обмежує максимум.

Саме тому у сучасних платформах важливо враховувати ціну ордерів і їхній вплив на ціну виконання.

Глава 5: Повна система — що реально працює

Теорія — чиста. Виробниче середовище — хаос.

Ось як виглядає справжня арбітражна система [2].

Потік даних

Реальні дані: WebSocket-з’єднання з API Polymarket [9], що отримує оновлення книг ордерів (зміни цін/кількості), повідомлення про виконання транзакцій, створення/закриття ринків.

Історичні дані: через API Alchemy Polygon — події контрактів: OrderFilled, PositionSplit, PositionsMerge.

Команда проаналізувала 86 мільйонів транзакцій [2]. Це — обсяг, що вимагає інфраструктури, а не скриптів.

Планується відкрити API для високошвидкісної торгівлі — якщо плануєте використовувати подібну модель — DM.

Залежності — детектор

Для 305 ринків президентських виборів у США — потрібно перевірити 46 360 пар можливих залежностей. Це — нереально вручну.

Команда застосувала розумний підхід: використання LLM (моделі глибокого навчання) — DeepSeek-R1-Distill-Qwen-32B — для попереднього відбору.

Вхід: опис умов двох ринків. Вихід: JSON із допустимими результатами.

Далі — три рівні перевірки: чи у кожному ринку рівно один істинний результат? Чи кількість допустимих комбінацій менша за n×m (залежності)? Чи задовольняють залежності умови арбітражу?

Результат: 40 057 незалежних пар (без арбітражу), 1576 — з залежностями, 374 — з суворими умовами, 13 — підтверджено вручну [2].

Точність LLM у складних багатопараметричних ринках — 81.45%. Достатньо для попереднього відбору, але перед виконанням потрібна людська перевірка.

Три рівні оптимізації

· Перший: прості лінійні обмеження (LCMM). Швидка перевірка — «сума ймовірностей = 1», «якщо A — імплікація B, то P(A) ≤ P(B)». Мілісекунди — і все.

· Другий: цілочисельне проєктування (Frank-Wolfe + Gurobi). Це — ядро. Параметри: Alpha=0.9 (забирати щонайменше 90% можливого арбітражу), ε=0.1 (10% звуження), точність 1e-6, час — 30 хвилин. В середньому — 50–150 ітерацій, кожна — 1–30 секунд.

· Третій: перевірка виконання. Перед поданням — симуляція транзакцій у поточній книзі. Перевірка: чи достатньо ліквідності? Який очікуваний скілл? Після врахування скіллу — скільки гарантовано заробити? Чи перевищує прибуток мінімальний поріг ($0.05)? — і тільки тоді виконуємо.

Управління позиціями: модифікація Kelly

Стандартна формула Kelly [11] — визначає, яку частку капіталу вкладати. Але для арбітражу потрібно враховувати ризик виконання:

f = (b×p - q) / b × √p

де b — відсоток прибутку, p — ймовірність повного виконання (залежить від глибини книг), q=1−p.

Обмеження: не більше 50% глибини книг. Більше — ризик сильного руху ціни.

Результат

З квітня 2024 до квітня 2025 року:

Арбітраж у одному ринку: купівля обох сторін — $5 899 287 + продаж — $4 682 075 = $10 581 362

Ринок-реінжиниринг: купити всі YES — $11 092 286, продати всі YES — $612 189, купити всі NO — $17 307 114, всього — $29 011 589

Міжринковий арбітраж: $95 634

Загалом: $39 688 585

Перші 10 арбітражників — отримали $8 127 849 (20.5%). Перша позиція — $2 009 632 з 4049 транзакцій, середній прибуток — $496 за транзакцію [2].

Це — не лотерея. Не випадковість. Це — системна математика.

Реальність сьогодні

Поки трейдери читають «10 порад для прогнозних ринків», системи вже рахує залежності, виконує проєкцію Брегмана, запускає алгоритм Френка-Волфа, оцінює скілл за VWAP і системно отримує $40 млн прибутку.

Різниця — не в удачі. Це — математична інфраструктура.

Публікація статті — відкритий код [1]. Алгоритми — відомі. Прибутки — реальні.

Питання — чи зможете ви побудувати таку систему до того, як вона вкраде ще $40 млн?

Короткий глосарій

• Многогранник маргінальний (Marginal Polytope) — простір усіх «допустимих цін». Ціни мають бути у ньому — без арбітражу. Це «законна зона цін».

• Цілочисельне програмування (Integer Programming) — опис допустимих результатів лінійними обмеженнями, щоб уникнути перебирання. Замість 2^63 перевірок — кілька обмежень [3].

• Дивергенція Брегмана / KL — міра «відстані» між ймовірностями, більш релевантна для цін і ймовірностей, ніж евклідова. Враховує інформаційний зміст — крайні ціни мають більший вагу [5][6].

• LMSR (логічний ринок-оцінювач) — механізм ціноутворення Polymarket, де ціна — ймовірність [4].

• Алгоритм Френка-Волфа — ітеративний метод оптимізації, що додає по одному вершині, уникаючи експоненційної кількості можливих результатів [7].

• Gurobi — провідний розв’язувач цілочисельних задач, «гід» кожного кроку алгоритму.

• CLOB — централізований книга ордерів, де ордери виконуються послідовно, без гарантії атомарності [9].

• VWAP — середня ціна за обсягом, враховуючи глибину книг. Більш реальна, ніж «оптимальна ціна» [10].

• Формула Kelly — визначає частку капіталу для вкладення, балансуючи ризик і прибуток [11].

• Неатомарне виконання — коли одна транзакція проходить, інша — ні, ризик витоку.

• DeepSeek — модель глибокого навчання для попереднього аналізу залежностей ринків, точність 81.45%.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити