تقييم الذكاء الاصطناعي من منظور كمي: توقعات الأرباح للجميع أقل من 1، كم تبعد الذكاء الاصطناعي عن استبدال المتداولين؟

PANews

2025-11-24 06:43:22

المؤلف: فرانك، PANews

إذا أعطوك 10000 دولار، أي ذكاء اصطناعي ستختار أن تثق به لإدارة أموالك؟

في السابق، قامت PANews بإجراء مراجعة لمسابقة التداول بالذكاء الاصطناعي التي نظمتها nof1.ai (لمزيد من القراءة: ستة “تجار” ذكاء اصطناعي، تحدي عشرة أيام: فصل دراسي مفتوح حول الاتجاه والانضباط والجشع). ومع ذلك، فإن فعالية مسابقة nof1.ai كانت مخصصة لفترة معينة من السوق، ويبدو أن القدرة النهائية للتداول لنماذج الذكاء الاصطناعي الكبيرة لا يمكن أن تظهر بالكامل في فترة التداول المحددة. بالإضافة إلى ذلك، يحتاج الناس إلى إجابة حول القدرة التنبؤية الفعلية لنماذج الذكاء الاصطناعي في ظروف مختلفة. ومع إصدار أحدث النماذج من قبل مختلف شركات الذكاء الاصطناعي مؤخرًا، فإن ترتيب قدرات النماذج في مرحلة إعادة الترتيب.

لكشف هذا اللغز، نظمت PANews مسابقة بعنوان “بطولة المتداولين بالذكاء الاصطناعي”. لفهم قدرة نماذج الذكاء الاصطناعي على الحكم على السوق وتخطيط التداول في سيناريوهات مختلفة. على سبيل المثال، ما هي أطر الزمن التي تتقن تحليل السوق بشكل أفضل، وما إذا كانت نسبة نجاح توقعات الذكاء الاصطناعي ستتحسن عندما تكون هناك مؤشرات كشرط مساعد.

نحن نمدد الجدول الزمني من 2017 حتى الآن، حيث قمنا باختيار 100 شريحة بيانات حقيقية عشوائية من بيانات تاريخ BTC في بينانس، وخلقنا ثلاث سيناريوهات اختبار على مستوى الجحيم: “K العاري لمدة 4 ساعات”، “التداول القصير لمدة 15 دقيقة”، و"جميع المؤشرات لمدة 4 ساعات". المتسابقون الستة يمثلون قمة قدرة الحوسبة اليوم في الصين والولايات المتحدة: Gemini-3-pro، Doubao-1.6-vision، DeepSeek V3.2، Grok 4.1، GPT-5.1، Qwen3-max.

تم جمع بيانات اختبارية لزوج تداول BTC الفوري في بينانس من أغسطس 2017 حتى الآن، تشمل بيانات ك线 مدتها 15 دقيقة وبيانات ك线 مدتها 4 ساعات من 2021 حتى الآن. تم إنشاء 50 صورة عشوائية لكل فترة زمنية تحتوي على 100 ك线، حيث تم تقسيم فترة 4 ساعات إلى نوعين: الأول هو صور تحتوي فقط على ك线 وحجم التداول، والثاني هو ك图 مع معلومات مؤشرات مثل EMA وSMA وBollinger Bands وMACD وRSI. جميع صور ك线 لمدة 15 دقيقة هي صور ك裸K (مع حجم التداول). وتمت مزامنة قيم بيانات السعر الدقيقة أو قيم بيانات المؤشر لك图 الحالي مع AI. يمكن مشاهدة جميع نتائج مخرجات AI هنا.

رسم توضيحي لمؤشر على مدى 4 ساعات

رسم توضيحي لشمعة نقيّة على مدى 4 ساعات

خلال عملية الاختبار، كانت معلومات البيانات والأوامر التي حصلت عليها كل نموذج كبير متطابقة تمامًا. من وجهة نظر أخرى، فإن هذا يختبر أيضًا قدرة هذه النماذج الكبيرة على التعددية النمطية (لأن DeepSeek يحتوي فقط على نموذج نصي كبير، فإن ما تم استلامه في النهاية هو معلومات البيانات فقط، ولم يتم نقل الصور).

جمني 3: ملك الشموع العارية المختوم بـ"المؤشرات"

جيميني 3 هو نموذج AI الكبير الأكثر شيوعًا في الوقت الحالي، ومن خلال التعليقات الإعلامية والاختبارات بعد إصداره في 18 نوفمبر، يمكن القول إنه أقوى نموذج AI متعدد الوسائط من حيث القدرات الشاملة. ومع ذلك، في اختبار توقعات التداول هذا، لم تكن نتائج جيميني 3 هي الأفضل، بل كانت متوسطة. في ثلاثة سيناريوهات (4 ساعات بدون مؤشرات، 4 ساعات مع مؤشرات، 15 دقيقة بدون مؤشرات)، كان أداء جيميني 3 الأفضل في سيناريو 4 ساعات بدون مؤشرات، حيث بلغت نسبة الفوز 39.58%، تليها نسبة 34.04% في سيناريو 15 دقيقة بدون مؤشرات، في حين أن الدقة في حالة استخدام المؤشرات (في نفس الفترة الزمنية) انخفضت إلى 31% في دورة 4 ساعات، مما يجعلها الأسوأ بين السيناريوهات الثلاثة.

من هذه النقطة، يبدو أن Gemini 3 يتفوق في حالة أنماط الشموع اليابانية النقية، وعند إضافة المؤشرات يصبح من السهل تشويش الأمر. في سياق العملية المحددة، يبدو أن Gemini 3 يجرؤ على فتح مراكز بدون مؤشرات، حيث أن 95% من الحالات تتجه للدخول في حالة الشموع اليابانية النقية، بينما تنخفض هذه النسبة إلى 71% بعد إضافة المؤشرات. وتجدر الإشارة إلى أن Gemini 3 هو النموذج الوحيد الذي حقق أرباحًا في حالة الشموع اليابانية النقية على مدى 4 ساعات.

في سياق 15 دقيقة ، كانت الحالة العامة للربحية لـ Gemini 3 هي الأفضل ، حيث حقق المركز العام ربحًا بنسبة 15.34٪ ، بينما كان في السيناريو المدعوم بالمؤشرات خاسرًا بنسبة 21.18٪. ومع ذلك ، فإن هذه الأرباح هي أيضًا نوع من الحظ على المدى القصير ، وعند الجمع بين بيانات نسبة الربح والخسارة في كل مرة ، فإن توقع الربح لـ Gemini 3 (نسبة الفوز \ * نسبة الربح والخسارة) أقل من 1 ، مما يعني أنه على المدى الطويل ، تكون الحالة هي خسارة المال.

DeepSeek V3.2: آلة “التداول السريع” المستقرة ككلب قديم

يعتبر DeepSeek أفضل نموذج من حيث الأداء الشامل لنسبة الفوز بين النماذج الستة، وهو أيضًا الأكثر استقرارًا نسبيًا. في ثلاثة سيناريوهات (4 ساعات K العارية، 4 ساعات مع المؤشرات، 15 دقيقة K العارية) كانت نسب الفوز على التوالي 40٪، 41.38٪، 42.86٪. من هذه النقطة، يمكن القول إن قدرة DeepSeek على التنبؤ مستقرة نسبيًا في فترات زمنية مختلفة، سواء مع وجود مؤشرات أو بدونها.

ومع ذلك، فإن الوضع الربحي النهائي لـ DeepSeek ليس جيدًا، ويرجع ذلك إلى انخفاض نسبة الأرباح إلى الخسائر، حيث تبلغ المعدل 1.25 فقط. تعكس هذه النسبة التي تميل إلى جني الأرباح على الفور أيضًا افتقار DeepSeek لقدرة السماح للأرباح بالتدفق خلال عملية التداول. وبالتالي، يؤدي ذلك إلى توقعات ربحية تقارب 0.5، مما يعني أنه على المدى الطويل، تفتقر أيضًا إلى إمكانية تحقيق الأرباح. بالإضافة إلى ذلك، فإن DeepSeek تعتبر محافظة نسبيًا من حيث قرار فتح الصفقات، حيث تبلغ نسبة فتح الصفقات الإجمالية 58% فقط.

دو باو (豆包): هذه المسابقة “أكثر لاعب شامل”

في هذه المباراة التجريبية ، كانت النتائج الشاملة لـ Doubao1.6-vision هي الأفضل. في سيناريو 4 ساعات مع مؤشرات ، وصلت نسبة الفوز لـ Doubao1.6-vision إلى أعلى البيانات خلال الاختبار ، حيث بلغت 50٪ ، وبلغت العائدات النهائية 22.2٪. في نفس الوقت ، في الدورة القصيرة التي تستغرق 15 دقيقة ، حقق أيضًا مستوى عائدات بلغ 8.2٪. إنه النموذج الوحيد الذي يمكنه تحقيق أرباح مستقرة في بعدين مختلفين (القصير ومؤشر 4 ساعات).

علاوة على ذلك، فإن هذه النتيجة لـ Doubao1.6-vision لم تتحقق بأسلوب محافظ نسبيًا، بل تم الوصول إليها بمعدل فتح مراكز يزيد عن 92%. بعبارة أخرى، اختار Doubao1.6-vision فتح المراكز في الغالبية العظمى من السيناريوهات. ومع ذلك، بالمقارنة، فإن قدرة Doubao1.6-vision تعتمد أيضًا بشكل كبير على إشارات المؤشرات، حيث أن الفرق في الأرباح الإجمالية بدون مؤشرات يصل إلى 38%. بالإضافة إلى ذلك، من حيث بيانات نسبة الربح والخسارة، فإن Doubao1.6-vision لديه نسبة خسارة مرتفعة خلال فترتين من العوائد الإيجابية، وهو ما يعد سببًا رئيسيًا لأدائه العام المتميز.

Grok 4.1: “المقامر الجريء” من xAI

أسلوب Grok 4.1 العام جريء ولكنه يعتمد على مؤشرات ربع سنوية، مع الرغبة في متابعة الأرباح الأكبر. في ثلاثة سيناريوهات، حصل Grok 4.1 على معدل فوز بنسبة 34.69% فقط خلال 4 ساعات مع وجود مؤشرات، بينما كانت معدلات الفوز في السيناريوهين الآخرين منخفضة للغاية. في حالة مخططات Kline النقية لمدة 4 ساعات، كان معدل الفوز 14.58%، وفي فترة 15 دقيقة كان 26.53%. لكن نسبة فتح الصفقات المتوسطة بلغت 98%، حيث إنه على استعداد لفتح صفقات في جميع سيناريوهات Kline تقريبًا. من هذه الزاوية، يبدو أن أسلوب Grok 4.1 يشبه مقامرًا لا يمكنه التحكم في يده.

ومع ذلك، فإن نسبة الربح والخسارة في Grok 4.1 غالبًا ما تكون مرتفعة، حيث بلغ متوسطها 2، وهو الأعلى بين جميع النماذج. لكن بشكل عام، إذا قمت بتسليم الأموال إلى Grok 4.1، فلا يعد خيارًا حكيمًا.

GPT 5.1: المتشائمون “المكشوفون” بحذر شديد

أسلوب فتح الصفقة لـ GPT 5.1 و Grok 4.1 متناقض تمامًا. يعتبر GPT 5.1 في درجة الحذر الأمثل، حيث أنه في معظم الحالات، اختار أن يراقب. في النهاية، خلال 150 اختبارًا، قام بفتح الصفقة 52 مرة فقط، بمتوسط نسبة فتح الصفقة تبلغ 0.34%.

ومع ذلك، حتى مع هذا الحذر الشديد، لم تتمكن GPT 5.1 من تحقيق أداء أفضل في نسبة الفوز. في أفضل السيناريوهات، حققت نسبة فوز تبلغ 35% فقط. وبالمقارنة مع الفترات الزمنية لأربعة ساعات وخمسة عشر دقيقة، من الواضح أن GPT 5.1 ليست بارعة في فتح الصفقات على الفترات الطويلة، حتى مع إضافة المؤشرات الفنية، فإن نسبة الفوز في فترة الأربعة ساعات لم تتجاوز 27%. وفي فترة الخمسة عشر دقيقة، بفضل نسبة الربح والخسارة العالية (2.02)، تمكنت فقط من تحقيق عائد إيجابي، حيث كانت النتيجة النهائية 9.9%.

بالإضافة إلى ذلك، فإن GPT 5.1 لديه سمة بارزة وهي التشاؤم الواضح، وهو متحمس جدًا للقيام بعمليات البيع القصير. أكثر من 70% من الطلبات هي طلبات بيع.

Qwen 3: “المتعاملون المتحفظون” الذين يقدرون الكلمات كأنها ذهب.

يبدو أن Qwen 3 هو النموذج الكبير الأكثر حذرًا، حيث قام بفتح مراكز تداول فقط 44 مرة في جميع الاختبارات، وكانت نسبة فتح المراكز 29%. ومع ذلك، مثل GPT، فإن هذه الحذر المفرط لم يحقق أيضًا معدل فوز أعلى. متوسط معدل فوزه هو 34% فقط، وأفضل سيناريو له هو السيناريو الذي يعتمد على مؤشرات زمنية مدتها 4 ساعات.

بالإضافة إلى ذلك، فإن نسبة الربح إلى الخسارة في Qwen 3 مرتفعة أيضًا. تصل إلى 1.96. يبدو أنه ينتمي إلى اللاعبين الذين يتجنبون المخاطرة، حيث إنه أكثر كفاءة في تقليل عدد الصفقات، ولكنه يتيح للربح أن يتزايد. وفي سيناريو المؤشرات على مدى 4 ساعات، فإن توقعات الربح لـ Qwen 3 هي الأقرب لتحقيق الربح، حيث تصل إلى 0.95 وهي الأعلى بين جميع النماذج.

ملخص البيانات

ملخص:

بشكل عام، قد نحصل على النقاط التالية من عملية التداول المحاكية لهذه الذكاءات الاصطناعية.

أولاً، بالنسبة للغالبية العظمى من النماذج، فإن استخدام المؤشرات يعد أكثر موثوقية من مخطط الشموع اليابانية البسيط. في حالة وجود مؤشرات، بلغ متوسط معدل الفوز لهذه النماذج الستة 38%، بينما في حالة عدم وجود مؤشرات، كان معدل الفوز 30%.

ثانياً، قد تكون الذكاء الاصطناعي أكثر كفاءة في التداولات قصيرة الأجل بدلاً من التداولات طويلة الأجل. في سياق الشموع اليابانية النقية لمدة 15 دقيقة، وصل متوسط معدل الربح لستة نماذج كبيرة إلى 34٪، وهو أعلى من 30٪ لفترة الأربع ساعات. من بين النماذج الستة، هناك ثلاثة نماذج تحقق أرباح (Gemini, GPT, Doubao)، ومتوسط نسبة الربح إلى الخسارة عمومًا جيدة.

ثالثًا، من غير المناسب تمامًا تسليم جميع المراكز إلى الذكاء الاصطناعي. خلال عملية الاختبار هذه، كانت جميع نماذج الذكاء الاصطناعي ذات توقعات ربحية أقل من 1، وهذا يعني أنه إذا نظرنا إلى معدل الفوز ونسبة الربح والخسارة على المدى الطويل، ستكون النتائج النهائية جميعها خسائر. الفرق فقط هو سرعة الخسارة (ومع ذلك، لم يتم تخصيص تدريب خاص على نماذج الذكاء الاصطناعي هنا، وكانت المؤشرات المستخدمة مجرد مؤشرات شائعة وبسيطة). لذلك، إذا كنت ترغب في أن يحل الذكاء الاصطناعي محل نفسك في التداول، فقد تحتاج إلى عملية تدريب أكثر تعقيدًا وبيانات اختبار أكثر.

عندما تسدل الستار عن هذه المعركة في قوة الحوسبة، وعند النظر إلى الرقم النهائي في رصيد الحساب، قد تكون أهم الدروس التي نتعلمها ليست “أي نموذج هو الأقوى”، بل “ما هي حدود تداول الذكاء الاصطناعي”. الاستنتاج النهائي هو أن الذكاء الاصطناعي اليوم قد لا يستطيع مباشرة استبدال مدير صندوق ممتاز، لكنه قد تطور ليصبح مساعد تداول ناضج نسبيًا من جانب واحد، بعضهم بارع في قراءة الرسوم البيانية، وبعضهم بارع في إدارة المخاطر، وآخرون بارعون في تحليل البيانات لتحقيق نسبة نجاح مستقرة. ومع توقعات الناس المتزايدة تجاه الذكاء الاصطناعي، لا يزال جعل الذكاء الاصطناعي يحل محل الإنسان في التداول مسألة معقدة.

BTC0.98%

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.