الابتكار لا يتبع السيناريو أبدًا. إنه يتسارع ويتعثر ويفاجئ. قبل عامين، حذرت مذكرة مسربة من جوجل من أن النماذج مفتوحة المصدر من شأنها أن تؤدي في يوم من الأيام إلى تآكل الخندق الذي بدا وكأنه يحمي مطوري LLM المملوكين.
لفترة من الوقت، تحدى المطورون المملوكون هذه النبوءة بينما كانوا يتسابقون للأمام في القدرات والسمعة. حتى الآن، تبدو المذكرة أكثر صحة من أسوأ التوقعات في ذلك الوقت. والأهم من ذلك، أن قِلة من الناس كان بوسعهم أن يتنبأوا بنوع وكمية الأحزاب التي ستغتنم هذه اللحظة.
قبل عام واحد، بدت فكرة الريادة الصينية في مجال الذكاء الاصطناعي غير قابلة للتصديق. لقد أثارت سلسلة مقالاتنا، بدءاً بالمقالة التي تحمل عنوان “الطفرة الهادئة: صعود مبتكري الذكاء الاصطناعي الصينيين”، شكوكاً حول المحتوى أكثر من مجرد المراجعات للمشهد العام. وحتى بعد برنامج DeepSeek، افترض العالم أن النماذج الصينية مشتقة أو نسخ، مع ادعاءات مبالغ فيها وغير قابلة للإثبات، وأن مختبراتها مقيدة بالعقوبات والتكاليف.
يبدو هذا الرأي الآن قديمًا. وبحلول منتصف عام 2025، أصدر المطورون الصينيون عددًا أكبر من شهادات الماجستير العامة مقارنة بأي شخص آخر. لقد بدأوا في السيطرة على مخططات التنزيل. لم تعد DeepSeek وQwen وMiniMax وKimi أسماء هامشية. بدأ هذا الانعكاس قبل الإصدارات الأخيرة التي ظهرت في الأسابيع الأخيرة.
عندما بدأنا كتابة المقال في وقت سابق من الأسبوع، كانت ثمانية من النماذج المفتوحة العشرة التي حصلت على أعلى الدرجات صينية. إذا كان يمكن للمرء أن يصدق ذلك، فقد اتسعت الصدارة منذ ذلك الحين! بينما كنا نكتب، في يوم الجمعة هذا (7 نوفمبر)، حصلنا على أول نموذج مفتوح المصدر، هذا النموذج من Kimi، والذي يدعي أنه يتجاوز قدرات أفضل النماذج المسجلة الملكية عبر قائمة من المعايير الشائعة.
لم يعد التغيير يقتصر فقط على الخوارزميات. يتعلق الأمر بكيفية خضوع اقتصاديات الذكاء الاصطناعي لمزيد من التغييرات في عام 2026.
الشلال باتجاه الغرب
قبل أن نناقش تفاصيل التغييرات على قدم وساق، دعونا ننظر إلى دليل القبول.
ولمجموعة من الأسباب القومية والمثالية والتاريخية وغيرها، اجتذبت النماذج الصينية الازدراء في وسائل الإعلام الشعبية بسبب مطالباتها المتعلقة بالتكاليف، وقضايا الأمن والخصوصية، وصدق الابتكارات المزعومة، ومشروعية الأجهزة التي ربما تم استخدامها. لم تتم الإجابة على أي من هذه الأسئلة بشكل كاف أو يمكن الإجابة عليها بما يرضي الجميع، ولكن في العديد من الأوساط الغربية، لم تنتهي الشكوك بحجة. انتهى مع الاستخدام.
وفقًا لتقارير وسائل الإعلام، يعتمد مهندسو Cursor الآن على النماذج الصينية المفتوحة لتشغيل وكلاء توليد الأكواد الخاصة بهم. تم بناء SWE-1.5 ذو الحجم الحدودي لشركة Cognition بهدوء على نموذج أساسي صيني. Airbnb، التي كان من المتوقع أن تميل نحو OpenAI، تدير روبوتات خدمة العملاء الخاصة بها على Qwen التابع لشركة Alibaba.
وقبل أسبوعين، وصفها رئيسها التنفيذي، بريان تشيسكي، بأنها “سريعة وجيدة ورخيصة”. صرح Chamath Palihapitiya، مؤسس Social Capital، أن بعض شركاته نقلت أعباء عمل متعددة من Anthropic وOpenAI إلى Kimi من Moonshot، واصفًا إياها بأنها “أكثر أداء وأرخص بكثير”.
يمكن للمرء أن يرفض الأخبار الأخيرة عن تفوق النماذج الصينية على النماذج الأخرى في تداول العملات المشفرة والأسهم (تم الإبلاغ عن اختبارات منفصلة هنا وهنا) باعتبارها أخبارًا لمرة واحدة وغريبة وليس لها تاريخ طويل بما فيه الكفاية. ومع ذلك، فإن الأدلة على التكافؤ آخذة في الازدياد.
إن ما نشهده من اعتماد إنتاج عدد صغير من الشركات الأمريكية له آثار طويلة المدى. النماذج التي تم رفضها ذات يوم بسبب مشكلات تتعلق بالأمان أو الموثوقية أصبحت الآن ترسيخ الشركات التي لن تغير تفضيلاتها دون الحصول على مزايا ضخمة للغاية بحيث لا يمكن تجاهلها. ومن الواضح أن الشكوك حول التسريبات من الباب الخلفي أو إعانات الدعم الحكومية تتلاشى عندما تفوز الكفاءة.
إن النماذج الصينية تضع معايير جديدة ومعايير جديدة للشفافية. يأتي كل إصدار صيني رئيسي مزودًا بورقة ومعيار وأوزان يمكن لأي شخص تنزيلها دون أي رسوم أو شروط مطبوعة.
العمارة في الحركة
وفي قلب هذه الطفرة هناك مبدأ واحد: أنجز المزيد بموارد أقل. والتكنولوجيا التي تقوم عليها هذه الموجة الجديدة هي مزيج من الخبراء (MoE). والخلاصة البسيطة هي أن النماذج الصينية تبنت وزارة التعليم على مستوى العالم. وهم الآن يبتكرون ضمن هذا الإطار، فيخلقون موجات جديدة لا هوادة فيها من الكفاءة.
وفي المقابل، هناك عدد قليل من النماذج الغربية الرئيسية، مثل كلود الأنثروبي، تقاوم وزارة التعليم بالكامل. وقد تبناه آخرون، ولكن دون نفس التركيز المهووس على الكفاءة. وفي الصين، أصبح السباق الآن ضد بعضهم البعض.
إن عدد التوجيهات الجديدة وسرعة الإعلانات وجودة التنفيذ مذهلة. بقية القسم قابل للتخطي بالنسبة لأولئك الذين لا يهتمون بالتفاصيل العامة لوزارة التربية والتعليم.
بالنسبة للمهتمين بالتفاصيل، فإنه يساعد على فهم السياق. يتابع معظم المراقبين تطور الذكاء الاصطناعي بشكل واسع. كانت الموجة الأولى، في عام 2023، بحجمها تقريبًا. لقد كان سباقًا لنماذج أكبر من أي وقت مضى.
وكانت الموجة الثانية، في عام 2024، تدور حول الاستدلال، حيث أصبحت تقنيات “سلسلة الأفكار” هي المعيار. وقد تبنى الكثيرون هذا التحول بسرعة. البعض، مثل اللاما وميسترال، أخطأوا الإيقاع وعانوا من عواقب دائمة. إن الضربة العريضة في الفترة الحالية هي هذا المزيج من الخبراء.
هذه الطريقة، التي نشأت في جوجل، هي استراتيجية كفاءة. وتقوم وزارة التربية والتعليم بتحويل نموذج ضخم واحد إلى اتحاد من النماذج الأصغر حجمًا. بدلاً من إضاءة جميع المعلمات لكل استعلام، تقوم وزارة التربية والتعليم بتنشيط الخبراء اللازمين لمهمة معينة فقط. ويظل الباقي خاملاً، مما يؤدي إلى خفض التكاليف دون تقليص الحجم الإجمالي.
تكمن عبقرية وزارة التربية والتعليم في أنها تدعو إلى التنوع. بمجرد أن يصبح النموذج عبارة عن مجموعة من المتخصصين بدلاً من كتلة واحدة، يمكن لكل مختبر أن يقرر كيفية تقسيم هؤلاء المتخصصين وتعيينهم. بعضها يتجمع حسب المهارة، حيث يمكن أن تكون مجموعة واحدة من الخبراء للغة، وأخرى للرياضيات، وأخرى للاستدلال. وقد يوزع آخرون حسب العمق مع خبراء خفيفين للحصول على إجابات سريعة، وخبراء ثقيلين للمهام المعقدة.
يقوم البعض، مثل MiniMax، بتبديل الخبراء ديناميكيًا ضمن استعلام واحد، ويتعاملون مع كل خطوة على أنها مشكلة توجيه منفصلة. تقوم DeepSeek بتجميع خبرائها بشكل هرمي، وتمرير النتائج الجزئية إلى أعلى الشجرة حتى تكمل الطبقة الأفضل الإجابة.
تسعى Qwen إلى تحقيق الكفاءة من خلال “البوابات المتفرقة”، مما يسمح للعديد من الخبراء الصغار بمشاركة فتحات التنشيط بحيث لا يكون هناك أي حساب في وضع الخمول على الإطلاق. كيمي، الأحدث، يمزج التوجيه المعياري مع الاهتمام بالسياق الطويل، ويستدعي خبراء مختلفين لكل مرحلة من سلسلة الاستدلال.
تبدو خيارات التصميم هذه وكأنها لغة اصطلاحية، لكنها تُترجم إلى مكاسب واضحة. نماذج أسرع. تكلفة أقل. نوافذ السياق أطول. في جيل واحد، أظهر Minimax تناثرًا شديدًا، وحقق أعلى أداء من خلال تنشيط 10 فقط من 230 مليار معلمة.
يقوم كيمي بمزج MoE مع آلية انتباه جديدة يبدو أنها تنمو بشكل خطي، على عكس المعدل التربيعي للمحولات التقليدية، مما يعد بمكاسب هائلة للسياق الطويل. تعمل شركة DeepSeek على إعادة هندسة منطق توجيه الخبراء الأساسي نفسه، في حين صدمت شركة Tencent الجميع مؤخرًا بمفهوم الأوزان غير الثابتة.
وقد أظهرت الفرق الصينية أنه لا توجد وصفة واحدة أفضل لوزارة التربية والتعليم، بل هناك طرق لا حصر لها للجمع بين الخبراء. يفتح كل تبديل قفزة صغيرة أخرى في الكفاءة أو عمق التفكير.
الدرس الأوسع هو أن MoE يثبت مدى بعد المجال عن الحدود النظرية للمحول. تشير وتيرة التقدم إلى أنه من غير المرجح أن تكون البنى الحالية قريبة من التصميم النهائي الأمثل. لقد انتهى الاعتقاد السائد بأن التوسع في الحجم وحده يضمن التقدم.
وزارة التربية والتعليم هي تذكير بأن الاستدلال، وليس القوانين، هو الذي يوجه هذا العلم. لا يوجد مسار ثابت. قد تأتي اختراقات الكفاءة من التوجيه، أو التشتت، أو الذاكرة، أو شيء لم يتم تصوره بعد. والأمر الوحيد المؤكد هو أنه حيث يتم استكشاف المزيد من الأساليب، هناك احتمال أكبر لتحقيق اختراق. والصين هي الآن مركز هذا الاستكشاف.

اقتصاديات الانفتاح
المصدر المفتوح لا يعني صفر الإيرادات. يتغير من أين تأتي الإيرادات.
لا يزال تشغيل نموذج كبير يحتاج إلى حساب. تتطلب استضافة نموذج مفتوح على مستوى المؤسسة رفوفًا من وحدات معالجة الرسومات أو الوصول إلى السعة السحابية. وتنتقل التكلفة الرأسمالية من الترخيص إلى البنية التحتية. بالنسبة لمعظم المستخدمين، تفضل هذه المقايضة الدفع لمنشئ النموذج مقابل الوصول إلى واجهة برمجة التطبيقات (API) بدلاً من الاستضافة الذاتية.
هذا هو نموذج العمل الخفي للانفتاح. معرفة مجانية، راحة مدفوعة الأجر.
تبلغ تكلفة نموذج DeepSeek الذي يحتوي على 671 مليار معلمة أقل من ستة ملايين دولار، ويسري نفس الرقم على أحدث طراز Kimi الذي يتنافس وجهاً لوجه مع أفضل OpenAI في المعايير الشائعة.
وبغض النظر عما إذا كانت تكاليف التدريب الفعلية هي ما يُعتقد أو أكثر عدة مرات، فإن تدريب هذه النماذج فعال للغاية من حيث التكلفة. ونتيجة لذلك، يمكن للفرق الصينية أن تتقاضى أجراً زهيداً وتظل تكسب هوامش الربح. واجهات برمجة التطبيقات (APIs) الخاصة بهم أرخص بـ 10 إلى 50 مرة من نظيراتها الغربية. إنهم بحاجة إلى عدد أقل من المستخدمين لتحقيق التعادل.
تكلفة الإدراك (لكل مليون رمز)

الوحشية الجديدة
لقد تحولت المنافسة من رمزية إلى وجودية. وتقوم المختبرات الصينية بشحن نماذج جديدة كل بضعة أسابيع، وغالباً ما تحقق مكاسب قابلة للقياس. وكما شهدنا في الأيام الأخيرة، بدأ بعض مطوري النماذج الغربية في ممارسة الضغوط من أجل سياسات الحماية.
ومع ذلك، فإن النتيجة الحقيقية هي أنه نظراً لكثافة الابتكارات والتقدم، لا يستطيع أي من مراكز الابتكار الإقليمية الكبرى أو فرق الشركات أن يتحمل التباطؤ في جهوده. وإذا فشل البعض فشلاً ذريعاً في معايير التكلفة، فسوف يحتاجون إلى العثور على فائزين آخرين في مجال الابتكار في القدرات.
ليس من المفاجئ أن يشعر جنسن هوانج أن الصين تتأخر بمقدار نانوثانية في مجال الذكاء الاصطناعي. وحتى مع القيود المفروضة على الأجهزة، لم يظهر محرك الابتكار الخاص بها أي علامات على النضال. قد يجادل البعض بأن القيود جعلتهم أكثر تركيزًا على الكفاءة.
للوهلة الأولى، نعتقد أن تحسين الكفاءة يضاعف الطلب. يدعو كل تحسين في تكلفة النموذج إلى استخدامات جديدة: إنشاء الفيديو والبحث متعدد الوسائط والوكلاء المستقلين.
يمكن أن يستهلك مقطع فيديو واحد مدته 30 ثانية قدرًا أكبر من الحساب مقارنة بصفحات استنتاج النص. ومع ذلك، سنكون أول من يؤمن بأي فرضية من هذا القبيل ببساطة على خلفية “المشاعر” أو “التاريخ” أو قانون مسمى.
بينما نتطلع إلى قدوم عام 2026، يتجمع سباقان ضخمان بقوة. أحدهما في تطويرات النموذج الموصوفة أعلاه، والآخر في تصميم الرقائق المخصصة. اللاعبون في سباق الرقائق، كما هو موضح إلى حد ما في القسم الأوسط من هذه المذكرة، يشملون أكبر أسماء الأجهزة في العالم بميزانيات أكبر. وأظهر إعلان Google عن Ironwood TPU قبل بضعة أيام أنه يمكن أن يقدم أيضًا مفاجآت لا يمكن لأحد التنبؤ بها.
الحقيقة البسيطة هي أن التوقعات خطيرة. لم يتوقع أحد أن تصبح الأوزان المفتوحة الصينية هي الرائدة في العالم. ولا يستطيع أحد أن يعرف أي موضوع من الابتكارات سوف يهيمن في العام المقبل.
القاعدة الدائمة الوحيدة هي المرونة. في GenInnov، نستمر في تذكير أنفسنا بالتعلم من الأحداث أثناء حدوثها بدلاً من توقع اتباع أي مسار معين. يتطلب الاستثمار المبني على الأدلة أن يظل المرء مرنا في الاختيار أو الخروج، وأن يستمر في التعلم، بغض النظر عن مدى تعقيده.
ظهرت هذه المقالة لأول مرة على GenInnov وتم إعادة نشرها بإذن. اقرأ النص الأصلي هنا.

