مسابقة النماذج الكبيرة للذكاء الاصطناعي: من الابتكار الأكاديمي إلى الممارسات الهندسية

معركة المئة نموذج في مجال الذكاء الاصطناعي: من الابتكار التكنولوجي إلى الممارسة الهندسية

في الشهر الماضي، شهدت صناعة الذكاء الاصطناعي منافسة شديدة على النماذج.

من جهة أخرى، هناك نموذج لغة كبير مفتوح المصدر أطلقته إحدى شركات التكنولوجيا العملاقة، والذي حظي بشعبية كبيرة بين المطورين بسبب طبيعته المفتوحة. قامت شركة يابانية بعد دراسة أوراق البحث والشيفرة المصدرية لهذا النموذج، بتطوير نظام ذكاء اصطناعي محادثة باللغة اليابانية بسرعة، مما ساعد اليابان في تجاوز عقبات تطوير الذكاء الاصطناعي.

الطرف الآخر هو نموذج كبير يسمى "الصقر". في مايو من هذا العام، صدر Falcon-40B، متفوقًا على المنافسين ليحتل المركز الأول في تصنيف LLM المفتوح المصدر.

تم إعداد هذا الترتيب بواسطة مجتمع نموذج مفتوح المصدر، ويقدم مجموعة من المعايير لتقييم قدرات LLM. يحتل هذا الترتيب بشكل أساسي هذين النموذجين بالتناوب.

في بداية سبتمبر، أطلقت "الصقر" الإصدار 180B، محققة تصنيفاً أعلى مرة أخرى. ومن المثير للاهتمام أن مطوري "الصقر" ليسوا شركة تكنولوجيا، بل مؤسسة بحثية تقع في الإمارات العربية المتحدة. وأكد المسؤولون الإماراتيون أنهم يشاركون في هذه المنافسة لكسر النمط القائم.

اليوم، دخل مجال الذكاء الاصطناعي مرحلة تنافسية قوية. أي دولة أو شركة لديها رأس المال الكافي تخطط لتطوير نظام ذكاء اصطناعي محلي للحوار. فقط في منطقة الخليج، يوجد أكثر من لاعب واحد يعمل على التخطيط. في أغسطس، اشترت السعودية آلاف من رقائق الذكاء الاصطناعي المتطورة للجامعات المحلية، لاستخدامها في تدريب نماذج اللغة الكبيرة.

مستثمر معروف يعبر على وسائل التواصل الاجتماعي: "عندما كنت أحتقر الابتكار في نماذج الأعمال عبر الإنترنت في ذلك الوقت، كنت أعتقد أنه لا يوجد عائق. لم أتوقع أن ريادة الأعمال في النماذج الكبيرة للتكنولوجيا الصلبة ستكون لا تزال معركة مئات النماذج..."

كيف تطورت ما يسمى بالتكنولوجيا الصعبة عالية الصعوبة لتصبح حلبة تنافس بين الدول؟

خوارزمية المحولات تثير ثورة الذكاء الاصطناعي

سواء كانت الشركات الناشئة الأمريكية أو عمالقة التكنولوجيا الصينية أو المليارديرات النفطيين في الشرق الأوسط، فإن القدرة على الانغماس في تطوير النماذج الكبيرة تعود الفضل إلى تلك الورقة الشهيرة: "الاهتمام هو كل ما تحتاجه".

في عام 2017، كشف ثمانية من علماء جوجل للعالم عن خوارزمية Transformer في هذه الورقة. هذه الورقة هي حالياً ثالث أكثر ورقة تم الاقتباس منها في مجال الذكاء الاصطناعي، وقد أدت ظهور Transformer إلى هذه الموجة الحالية من الذكاء الاصطناعي.

تستند جميع النماذج الكبيرة الحالية، بغض النظر عن جنسيتها، بما في ذلك سلسلة GPT التي تحظى بشهرة عالمية، على أساس Transformer.

حتى الآن، كانت "تثقيف الآلة على القراءة" تعتبر مشكلة أكاديمية معترف بها. على عكس التعرف على الصور، فإن القراءة البشرية لا تركز فقط على الكلمات والجمل الحالية، بل تأخذ في الاعتبار السياق لفهم النص. كانت المدخلات في الشبكات العصبية المبكرة مستقلة عن بعضها البعض، مما جعلها صعبة الفهم للنصوص الطويلة أو حتى المقالات الكاملة، وبالتالي كانت تحدث بعض الأخطاء المضحكة في الترجمة.

حتى عام 2014، استخدم عالم حاسوب الشبكات العصبية التكرارية (RNN) لمعالجة اللغة الطبيعية، مما أدى إلى تحسين كبير في أداء نظام ترجمة معين. اقترحت RNN "تصميم دائري" يجعل كل خلية عصبية تستقبل المدخلات الحالية وكذلك المدخلات من اللحظة السابقة، مما يمنحها القدرة على "دمج السياق".

أدى ظهور الشبكات العصبية المتكررة (RNN) إلى إشعال حماس البحث في الأوساط الأكاديمية، وكان أحد مؤلفي ورقة عمل الـ Transformer مغمورًا بذلك لفترة. ومع ذلك، أدرك المطورون بسرعة أن الـ RNN تعاني من عيوب خطيرة: حيث أن الخوارزمية تستخدم حسابات متسلسلة، وعلى الرغم من أنها تحل مشكلة السياق، إلا أن كفاءتها التشغيلية ليست عالية، مما يجعل من الصعب معالجة كميات كبيرة من المعلمات.

أدى التصميم المعقد لـ RNN سريعًا إلى شعور الباحثين بالملل. منذ عام 2015، بدأ مجموعة من العلماء ذوي الرؤى المشتركة في تطوير بدائل لـ RNN، وكانت النتيجة النهائية هي Transformer.

بالمقارنة مع RNN، يتمتع Transformer بابتكارات رئيسية: الأولى هي استخدام تشفير المواقع بدلاً من التصميم الدوري، مما يحقق حساباً متوازياً، ويعزز بشكل كبير من كفاءة التدريب، مما يجعل الذكاء الاصطناعي يدخل عصر النماذج الكبيرة؛ والثانية هي تعزيز القدرة على فهم السياق.

قم محول بحل العديد من المشكلات دفعة واحدة، وأصبح تدريجياً الحل السائد في معالجة اللغة الطبيعية. حتى مؤسس RNN انتقل إلى معسكر المحول. يمكن القول إن المحول هو أساس جميع النماذج الكبيرة اليوم، حيث حول النماذج الكبيرة من البحث النظري إلى مشكلة هندسية.

في عام 2019، طورت شركة ذكاء اصطناعي معينة نموذج GPT-2 بناءً على تقنية Transformer، مما أثار إعجاب الأوساط الأكاديمية. استجابةً لذلك، أطلقت شركة تكنولوجيا عملاقة بسرعة نظام ذكاء اصطناعي أقوى. بالمقارنة مع GPT-2، لم يكن لهذا النظام أي ابتكار في الخوارزميات، بل زاد بشكل كبير من معلمات التدريب وقوة الحوسبة. شعر مؤلفو ورقة Transformer بالصدمة من هذا "التكديس العنيف"، وكتبوا مذكرة لتوثيق مشاعرهم.

أدى ظهور Transformer إلى تباطؤ سرعة الابتكار في الخوارزميات الأساسية في الأوساط الأكاديمية. أصبحت عناصر الهندسة مثل هندسة البيانات، ومقياس القوة الحسابية، وهياكل النماذج، عناصر حاسمة في سباق الذكاء الاصطناعي. يمكن لأي شركة تمتلك مستوى معين من القدرات التقنية تطوير نماذج كبيرة.

لذلك، طرح خبير AI معروف في خطابه: "الذكاء الاصطناعي هو مجموعة من الأدوات، بما في ذلك التعلم تحت الإشراف، التعلم غير الخاضع للإشراف، التعلم المعزز، والذكاء الاصطناعي التوليدي. هذه كلها تقنيات عامة، مشابهة للكهرباء والإنترنت."

على الرغم من أن شركة AI معينة لا تزال تمثل معيارًا في نماذج اللغة الكبيرة، إلا أن التحليلات في الصناعة تشير إلى أن قدرتها التنافسية تأتي أساسًا من الحلول الهندسية. إذا تم فتح المصدر، يمكن لأي منافس نسخ ذلك بسرعة. ويتوقع بعض المحللين أنه في وقت قريب ستتمكن شركات التكنولوجيا الكبرى الأخرى من تطوير نماذج كبيرة ذات أداء متساو.

التحديات التي تواجه مسابقة النماذج الكبيرة

الآن، "معركة المائة نموذج" لم تعد مجرد بلاغة، بل هي واقع موضوعي.

تشير التقارير ذات الصلة إلى أنه حتى يوليو من هذا العام، بلغ عدد النماذج الكبيرة في الصين 130 نموذجًا، متجاوزًا الولايات المتحدة التي لديها 114 نموذجًا. بالإضافة إلى الصين والولايات المتحدة، نجحت بعض الدول الغنية في تحقيق "نموذج واحد لكل دولة" بشكل أولي: بالإضافة إلى اليابان والإمارات العربية المتحدة، هناك أيضًا Bhashini التي تقودها الحكومة الهندية وHyperClova X التي طورتها شركة إنترنت كورية.

هذا المشهد يشبه إلى حد كبير فترة فقاعة الإنترنت في السنوات الماضية، حيث كان رأس المال يتدفق بشكل متسابق.

كما ذُكر سابقًا، جعلت تقنية Transformer النماذج الكبيرة مشكلة هندسية، طالما يوجد موهبة، تمويل، وعتاد، فإن الأمر المتبقي يعتمد على ضبط المعلمات. لكن انخفاض عتبة الدخول لا يعني أن الجميع يمكن أن يصبحوا عمالقة في عصر الذكاء الاصطناعي.

تتناول بداية المقال "صراع النماذج" وهو حالة نموذجية: على الرغم من أن نموذجًا معينًا يتصدر الترتيب، إلا أنه من الصعب القول إنه أحدث تأثيرًا كبيرًا على عملاق تكنولوجي معين.

من المعروف أن الشركات تفتح مصادر نتائج أبحاثها، ليس فقط لمشاركة فوائد التكنولوجيا مع المجتمع، ولكن أيضًا على أمل الاستفادة من حكمة الجماهير. مع استمرار مختلف المجالات في استخدام وتحسين نموذج مفتوح المصدر معين، يمكن للشركة الأم تطبيق هذه النتائج على منتجاتها الخاصة.

بالنسبة للنماذج الكبيرة مفتوحة المصدر، فإن مجتمع المطورين النشط هو القوة التنافسية الأساسية.

أنشأت إحدى شركات وسائل التواصل الاجتماعي الكبرى مختبرًا للذكاء الاصطناعي في عام 2015، حيث وضعت استراتيجية مفتوحة المصدر؛ مؤسسها يتقن فن "الحفاظ على العلاقات المجتمعية". في أكتوبر من هذا العام، أطلقت الشركة أيضًا نشاط "تحفيز المبدعين بالذكاء الاصطناعي": حيث يحصل المطورون الذين يستخدمون نماذجها المفتوحة المصدر لحل مشاكل اجتماعية مثل التعليم والبيئة، على فرصة للحصول على تمويل بقيمة 500,000 دولار.

الآن، أصبحت سلسلة النماذج مفتوحة المصدر للشركة معيارًا في الصناعة. حتى أوائل أكتوبر، كان 8 من بين أفضل 10 نماذج مفتوحة المصدر مبنية على هذه السلسلة. فقط على هذه المنصة، تم استخدام أكثر من 1500 نموذج يستخدم بروتوكولها المفتوح.

بالطبع، تحسين أداء النموذج ليس بالأمر السيء، ولكن لا يزال هناك فجوة واضحة بين معظم النماذج في السوق وأنظمة الذكاء الاصطناعي الرائدة.

على سبيل المثال، في وقت سابق، حصل نظام ذكاء اصطناعي معين على الدرجة الأولى برصيد 4.41 في اختبار AgentBench. تم إطلاق AgentBench بالتعاون بين عدة جامعات معروفة، ويستخدم لتقييم قدرة النماذج الكبيرة على الاستدلال واتخاذ القرارات في بيئات مفتوحة متعددة الأبعاد، وتشمل محتويات الاختبار ثمانية مهام مثل أنظمة التشغيل، وقواعد البيانات، ورسوم المعرفة، ومواجهات بطاقات اللعب.

أظهرت نتائج الاختبار أن المركز الثاني حصل على 2.77 نقطة فقط، والفارق واضح. بالنسبة لتلك النماذج مفتوحة المصدر ذات الضجة الكبيرة، فإن درجات الاختبار تتراوح عادة حول 1 نقطة، وهي أقل من ربع النقاط التي حصل عليها البطل.

للعلم، تم إصدار أقوى نظام ذكاء صناعي في مارس من هذا العام، وهذا هو نتيجة تفوق زملائه في جميع أنحاء العالم بعد أكثر من نصف عام. السبب وراء هذه الفجوة هو فريق البحث العلمي عالي المستوى في الشركة والخبرة المتراكمة على مدى سنوات، مما يجعلها دائمًا في المقدمة.

بعبارة أخرى، الميزة الأساسية للنموذج الكبير ليست في عدد المعاملات، بل في بناء النظام البيئي ( الطريق المفتوح ) أو القدرة على الاستدلال البحت ( الطريق المغلق ).

مع تزايد نشاط مجتمع المصادر المفتوحة، قد تتقارب أداء النماذج المختلفة لأن الجميع يستخدم هياكل ومجموعات بيانات مشابهة.

مشكلة واقعية أخرى هي: باستثناء عدد قليل من الحالات، يبدو أنه لا يوجد أي نموذج كبير قادر على تحقيق الربح.

الضغوط الاقتصادية التي تواجه النماذج الكبيرة

في أغسطس من هذا العام، أثار مقال بعنوان "قد تفلس شركة AI معينة بنهاية عام 2024" اهتمامًا. يمكن تلخيص مضمون المقال تقريبًا في جملة واحدة: سرعة إنفاق الشركة سريعة جدًا.

تشير المقالة إلى أنه منذ تطوير نظام ذكاء اصطناعي للحوار، توسعت خسائر الشركة بسرعة، حيث بلغت خسائرها حوالي 540 مليون دولار في عام 2022 فقط، ولم يكن أمامها سوى الاعتماد على المستثمرين.

على الرغم من أن عنوان المقال مبالغ فيه، إلا أنه يعكس واقع العديد من مزودي النماذج الكبيرة: عدم التوازن الشديد بين التكاليف والإيرادات.

تؤدي التكاليف المرتفعة إلى أن الشركات المصنعة للرقائق القليلة فقط هي التي تحقق أرباحًا حقيقية بالاعتماد على الذكاء الاصطناعي.

وفقًا لتقديرات شركة استشارات، قامت إحدى عمالقة الرقائق ببيع أكثر من 300,000 شريحة AI عالية الأداء في الربع الثاني من هذا العام. هذه شريحة تتمتع بكفاءة عالية في تدريب الذكاء الاصطناعي، وتتنافس الشركات التكنولوجية العالمية ومراكز البحث على شرائها. إذا تم تكديس الشرائح المباعة، فإن وزنها يعادل 4.5 طائرات بوينغ 747.

شهدت شركة الشرائح ارتفاعًا كبيرًا في أدائها، حيث زادت الإيرادات بنسبة 854% مقارنة بالعام السابق، مما صدم وول ستريت. ومن الجدير بالذكر أن هذه الشرائح تم تداولها في السوق الثانوية بمبلغ يتراوح بين 40,000 و 50,000 دولار، بينما تبلغ تكلفتها حوالي 3,000 دولار.

تكاليف قوة الحوسبة المرتفعة تعيق تطوير الصناعة إلى حد ما. وقد قدر أحد المؤسسات الاستثمارية المعروفة أن الشركات التكنولوجية العالمية ستستثمر سنويًا حوالي 200 مليار دولار في بناء بنية تحتية للنماذج الكبيرة؛ بالمقابل، يمكن أن تحقق النماذج الكبيرة ما يصل إلى 75 مليار دولار فقط في الإيرادات سنويًا، مما يعني وجود فجوة لا تقل عن 125 مليار دولار.

علاوة على ذلك، باستثناء بعض الحالات النادرة، لم تتمكن معظم شركات البرمجيات من العثور على نماذج ربحية واضحة بعد استثمار مبالغ ضخمة. حتى الشركات الرائدة في هذا القطاع تواجه صعوبات.

أداة توليد الأكواد التي طورتها إحدى الشركات التكنولوجية العملاقة بالتعاون مع شركة AI، على الرغم من أنها تتقاضى 10 دولارات شهرياً، إلا أنها تخسر شهرياً 20 دولاراً بسبب تكاليف المرافق، وقد يتسبب المستخدمون الكثيفون في خسارة الشركة 80 دولاراً شهرياً. بناءً على ذلك، يُحتمل أن تكبد خدمة مساعد AI التي يتم تسعيرها بـ 30 دولاراً خسائر أكبر.

على نفس المنوال، قامت إحدى عمالقة البرمجيات التي أطلقت أدوات الذكاء الاصطناعي مؤخرًا بإطلاق نظام نقاط بسرعة، مما ي限制 استخدام المستخدمين المفرط لتجنب خسائر الشركة. بمجرد أن يتجاوز المستخدم النقاط المخصصة له شهريًا، ستقوم الشركة بتقليل سرعة الخدمة.

لقد حصلت هاتان الشركتان بالفعل على سيناريوهات عمل واضحة وعدد كبير من المستخدمين المدفوعين. بينما لا يزال السيناريو الرئيسي لتطبيقات النماذج الكبيرة الحجم هو الحوار.

لا يمكن إنكار أنه لولا ظهور شركة معينة في مجال الذكاء الاصطناعي ونظام المحادثة الخاص بها، قد لا تحدث هذه الثورة في الذكاء الاصطناعي. لكن حتى الآن، لا يزال من الممكن مناقشة القيمة التي تم إنشاؤها من تدريب النماذج الكبيرة.

علاوة على ذلك، مع تزايد حدة المنافسة المتجانسة، وازدياد عدد النماذج مفتوحة المصدر، قد تواجه الشركات التي تقدم خدمات النماذج الكبيرة ضغوطًا أكبر.

كما أن نجاح هاتف ذكي معين ليس بسبب معالجه المتقدم، بل لأنه قادر على تشغيل مجموعة متنوعة من التطبيقات الشائعة، فإن قيمة النموذج الكبير يجب أن تتجلى في سيناريوهات التطبيق المحددة.

GPT1.65%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 7
  • إعادة النشر
  • مشاركة
تعليق
0/400
Whale_Whisperervip
· منذ 7 س
الهيئات كلها تتنافس، وأنا فقط أطفو على السطح.
شاهد النسخة الأصليةرد0
ChainBrainvip
· منذ 22 س
تقريبًا كانت سيئة جدًا، أليس كذلك؟
شاهد النسخة الأصليةرد0
GasFeeVictimvip
· منذ 22 س
لقد أحرقنا شاحنة أخرى من بطاقات gpu
شاهد النسخة الأصليةرد0
blocksnarkvip
· منذ 22 س
بشدة جذب صوف رأس المال
شاهد النسخة الأصليةرد0
Rekt_Recoveryvip
· منذ 22 س
لا أستطيع أن أنكر أن هذا الشيء عن الصقر يذكرني بشكل كبير بصدمة سوق الثور... يبدو وكأنه فخ رافعة آخر في انتظار الحدوث
شاهد النسخة الأصليةرد0
GasFeeLadyvip
· منذ 22 س
تماماً مثل رسوم الغاز على الإيثيريوم... هذه النماذج الذكية تستمر في ضخ السعر والإغراق ههههه
شاهد النسخة الأصليةرد0
HashBrowniesvip
· منذ 22 س
الموديل المتنافس يتفوق في حجم المعلمات
شاهد النسخة الأصليةرد0
  • تثبيت