![]() |
غوغل و"أوبن إيه آي" تخسران حرب الذكاء الاصطناعي.. فمن يفوز بها؟
غوغل و"أوبن إيه آي" تخسران حرب الذكاء الاصطناعي ... فمن يفوز بها؟ https://www.aljazeera.net/wp-content...513&quality=80 17/5/2023 "لقد تلفّتنا خلف أكتافنا كثيرا نحو شركة أوبن إيه آي، متسائلين مَن الذي سيحرز الهدف التالي؟ وما الخطوة القادمة؟ لكن الحقيقة المُرّة هي أن وضعنا لا يسمح لنا بالفوز في سباق التسلح، وليست أوبن إيه آي أيضا مَن ستفوز. بينما انشغلنا بهذا النزاع، كان هناك فريق ثالث يلتهم غداءنا في هدوء. ما أتحدث عنه بالطبع هو مجتمع البرمجيات مفتوحة المصدر".بتلك الكلمات بدأ المهندس لوك سيرناو، كبير مهندسي البرمجيات في غوغل، تقريرا داخليا ينتقد فيه صراع شركته مع شركة "أوبن إيه آي" في حرب الذكاء الاصطناعي التوليدي الأخيرة، مؤكدا أن الصراع هذا الصراع أدى بهم إلى التغافل عن منافس شرس آخر وهو مجتمع البرمجيات مفتوحة المصدر. نشر سيرناو هذا التقرير على منصة داخلية في غوغل في أوائل شهر أبريل/نيسان الماضي، ثم على مدار الأسابيع القليلة الماضية، انتشر التقرير وشاركه آلاف الموظفين داخل الشركة، وفقا لما ذكرته صحيفة "بلومبيرغ". (1) ثم في الرابع من مايو/أيار، تسرّب التقرير على شبكة الإنترنت، ونشرته شركة الاستشارات "SemiAnalysis" على مدونتها، ليشعل النقاش الدائر في أوساط وادي السيليكون حول إتاحة نماذج الذكاء الاصطناعي التأسيسية وجعلها مفتوحة المصدر، ومَن يجب أن يملك ويتحكم في تلك النماذج القوية الجديدة! والسؤال الأهم في ذلك السياق: هل حقا ظهر جيش جديد خطير انضم إلى حرب الذكاء الاصطناعي القائمة منذ سنوات؟ لا نملك خندقا! https://www.aljazeera.net/wp-content...513&quality=80 ما تستغرقه غوغل و"أوبن إيه آي" من بناء وتدريب نماذجها الهائلة على مدار شهور وسنوات ويكلف ملايين الدولارات، استغرق بضعة أيام من مجتمع البرمجيات مفتوحة المصدر. (شترستوك) جاء التقرير الداخلي لمهندس غوغل بعنوان "غوغل: لا نملك خندقا حول قلعتنا، وكذلك أوبن إيه آي". (2) قديما كان يُحفر الخندق المائي (Moat) ليحيط بالقلاع أو الحصون أو المدن، وكان بمنزلة خط الدفاع الأول لها، بينما يشير المصطلح في سياق الأعمال والشركات التقنية إلى الميزة التنافسية التي تملكها الشركة الرائدة في مجالها، مما يصعّب مهمة المنافسين في اللحاق بها. قد يتمثَّل هذا الخندق في قوة مالية أو لوجستية أو تقنية فريدة من نوعها. مثلا، تمتلك الشركات الكبيرة المصنعة للهواتف الذكية، مثل أبل وسامسونغ، ميزة تنافسية لوجستية ومالية تصعّب مهمة اللاعبين الجدد في هذا المجال على خلق منافسة كبيرة وحقيقية معها. لكن عندما يتعلق الأمر بمجال الذكاء الاصطناعي التوليدي، وخاصة نماذج اللغة الكبيرة، يدّعي التقرير أن شركة غوغل لم تعد تملك هذا الخندق المائي الذي سيحمي قلعتها الحصينة. كان إصدار النموذج اللغوي "GPT-3″، الذي أطلقته شركة "أوبن إيه آي" عام 2020، بمثابة وعد بالحجم والتطور الهائليْن لهذا المجال، إذ امتلك النموذج 175 مليار معامل (parameters)، (3) وهي وحدة يمكن بها قياس مدى ضخامة وحجم النموذج وقدرته على التعلم، كما تشير إلى إمكانية تنفيذه الكثير من المهام التي لم يتدرب عليها مسبقا. https://www.aljazeera.net/wp-content...513&quality=80 (شترستوك) التطور اللاحق في نماذج "GPT" أشار إلى أن الشركات إذا واصلت إنشاء نماذج لغوية أكبر وأضخم في الحجم، ودرَّبتها على مجموعات بيانات أكبر، فستتمكن في النهاية من إنتاج نموذج أقوى ويملك قدرات أكثر. نتيجة لذلك، وتسابقت مختبرات أبحاث الذكاء الاصطناعي لإنشاء هذا النوع من النماذج، ومن أشهرها "غوفر" (Gopher) بـ280 مليار معامل، و"لامدا" (LaMDA) بـ137 مليار معامل، و"بالم" (PaLM) بـ540 مليار معامل، و"ميجاترون-تورينج" (Megatron-Turing) بـ530 مليار معامل. المشكلة الأساسية في تلك النماذج الهائلة هي ارتفاع تكاليف تطويرها وتدريبها، فضلا عن احتياجها إلى إمكانيات وأجهزة قوية لتشغيلها، كل هذا يكلف ملايين الدولارات. لهذا احتاجت مختبرات مثل "أوبن إيه آي" إلى مصدر تمويل هائل، ولذا تحولت إلى منظمة هادفة للربح، ووقعت تحت ضغط متزايد لاستثمار تقنياتها، وإنشاء منتجات يمكن بيعها والكسب منها. ولكن في الوقت نفسه، كانت بحاجة إلى بناء خندق حول تلك المنتجات، لكي تتمكن من الصمود أمام منافس قوي بحجم غوغل. في حالة النماذج اللغوية الكبيرة، يوجد ثلاثة خنادق أساسية يمكنها أن تحمي الشركة، وهي بيانات تدريب النموذج، وحجم النموذج أو المعاملات، وأخيرا تكاليف التدريب. تتمتع شركات التقنية العملاقة بالفعل بالميزة الثالثة، لأنها الوحيدة القادرة على تحمل تكاليف تدريب وتشغيل نموذج لغوي تأسيسي بهذه الأحجام الهائلة. هناك بدائل سابقة مفتوحة المصدر لنموذج "GPT-3″، مثل نموذج "بلوم" (BLOOM)، (4) لكن لا يمكن الوصول إليها عمليا للمنظمات والشركات الناشئة التي لا تملك أموالا طائلة، ولا تستطيع شراء أو استئجار الآلاف من وحدات معالجة الرسوميات القوية باهظة الثمن. ومع ذلك، لكي تبني الشركات الخندقين الأول والثاني حول قلاعها، دفعت هذا المجال باتجاه السرية ومزيد من الغموض ومشاركة أقل قدر من المعلومات حول ما تملكه من تقنيات، لكن هذه الخنادق لا يبدو أنها قادرة على الصمود لفترة طويلة. https://www.aljazeera.net/wp-content...513&quality=80 يعتمد روبوت المحادثة "شات جي بي تي" على نموذج "GPT-4". (شترستوك) مع التطور السريع جدا في قدرات نماذج الذكاء الاصطناعي التوليدي مؤخرا، ظهر مصطلح "النموذج التأسيسي" (foundation model)، وهو مصطلح جديد نسبيا يُطرح في المجال، ولا يزال غامضا إلى حدٍّ ما. لكن يعرّفه البعض من خلال عدد المعاملات (parameters)، وبالتالي حجم الشبكة العصبية نفسها، بينما يعرّفه آخرون من خلال عدد المهام المميزة أو المتفردة والصعبة التي يمكن أن يؤديها هذا النموذج اللغوي. بختصار، يمكننا تعريف النموذج التأسيسي بأنه نموذج لغوي مُجهز مسبقا، يتدرب على الكثير من البيانات النصية المختلفة، ويُشكِّل الأساس الذي تعتمد عليه النماذج اللغوية الأصغر التي تُصمم وتُدرب لأداء مهام محددة، كالرد على الأسئلة مثلا. بهذه الطريقة يمكن بناء نماذج لغوية بدقة دون الحاجة إلى البدء من نقطة الصفر في كل مرة باستخدام النماذج التأسيسية الحالية، ومن أشهر أمثلتها نموذج "GPT-4″، الذي يعتمد عليه روبوت المحادثة "شات جي بي تي". (5) ثم في الثالث من مارس/آذار، تسرّب النموذج بالكامل على الإنترنت، وانتشر في أوساط المجال بكل تفاصيله التقنية، وهنا بدأت عمليات التعديل والتطوير السريعة للغاية. الأهم أن الباحثين تمكَّنوا من تخطي مشكلة الحجم الهائل، عبر تقنيات تُمكِّنهم من تشغيل النموذج على أجهزة بعتاد أقل، تصل إلى أجهزة حاسوب محمولة "ماك بوك" من أبل دون بطاقة رسومية، حتى إن البعض تمكَّن من تشغيله، بأقل إمكانيات للنموذج، على هاتف بكسل 6. الخلاصة، أصبح بإمكان أي شخص يملك جهاز حاسوب بعتاد قوي أن يدرب نموذجا لغويا شخصيا في غضون ساعات قليلة، وبتكلفة بسيطة، وهو أمر لم يكن متاحا إلا للمؤسسات البحثية الكبرى سابقا. نماذج مفتوحة المصدر يشير التقرير المُسرّب من غوغل إلى أهمية هذا التطور، الذي يُطلق عليه "التهيئة منخفضة الرتبة لنماذج اللغة الكبيرة" (Low-Rank Adaptation)، أو اختصارا (LoRA)، وهو التكنيك الذي مكَّن الباحثين من تهيئة النموذج وضبطه دون الحاجة إلى عتاد قوي وباهظ الثمن أو بطاقات رسومية ضخمة، وبتكلفة تصل إلى مئات الدولارات بدلا من الملايين، وفي غضون أيام قليلة، والأهم دون الحاجة إلى إعادة تدريبه بالكامل من جديد على المهمة المحددة التي يرغبون في تنفيذها. (7) يُستخدم هذا التكنيك في تعلم الآلة لتحسين دقة وكفاءة النموذج اللغوي الحالي ببيانات تدريب جديدة، وهذا في حال كانت تلك البيانات الجديدة محدودة. تكمن الفكرة الأساسية وراءه في تفكيك مصفوفة النموذج إلى مصفوفتين برتب منخفضة، يمكن استخدامهما لتمثيل البيانات الحالية والجديدة بصورة منفصلة. على سبيل المثال، لنفترض أنك تملك نموذجا مدربا مسبقا للتعرف على الصور، وتريد تحديثه لكي يتعرف على مجموعة جديدة من الصور. بدلا من إعادة تدريب النموذج بأكمله من البداية، يمكنك استخدام تكنيك "LoRA" لتفكيك مصفوفة النموذج إلى مصفوفتين برتب أقل، واحدة تُمثِّل الصور الموجودة بالفعل، والأخرى تُمثِّل الصور الجديدة. بعدها يمكنك تحديث النموذج عبر تعديل المصفوفة التي تخص الصور الجديدة فقط. ما يراه "سيرناو" في تقريره أن هناك فارقا في الجودة حتى الآن لصالح النماذج اللغوية هائلة الحجم، التي تملكها الشركات العملاقة، لكن النماذج الأبسط بدأت في الاقتراب من تحقيق تلك الجودة فعلا. وبالنسبة للتطبيقات العملية للذكاء الاصطناعي التوليدي، يرى أن نماذج غوغل أو "أوبن إيه آي" الهائلة لا تتمتع بميزة تنافسية قوية تبرر اختيارها للعملاء بدلا من نماذج منافسة ومجانية مفتوحة المصدر، خاصة عندما يتعلق الأمر بمهام صغيرة ومحددة مسبقا، مثل روبوت لخدمة العملاء، أو تلخيص المستندات الكبيرة، أو الترجمة الآلية، وغيرها من تلك المهام البسيطة. بعبارة أخرى، ما تستغرقه غوغل و"أوبن إيه آي" من بناء وتدريب نماذجها الهائلة على مدار شهور وسنوات ويكلف ملايين الدولارات، استغرق بضعة أيام من مجتمع البرمجيات مفتوحة المصدر، وكلف مئات الدولارات فقط في تحسين وتطوير تلك النماذج للاستفادة منها في مهام بسيطة ومحددة. https://www.aljazeera.net/wp-content...513&quality=80 بمقارنة النموذج مفتوح المصدر "ستيبل ديفيوجن" بالنموذج مغلق المصدر "دالي" نموذج مفتوح المصدر بالأخص قدم طفرة سريعة وواسعة في المجال. (شترستوك) ببساطة يرى "سيرناو" أن حركة السوق بدأت تتحول من التركيز على الحجم الهائل إلى البحث عن النماذج اللغوية الأبسط والأرخص والقابلة للتعديل والتخصيص بسهولة ودون الحاجة إلى عتاد وإمكانيات ضخمة. وهو ما أكده سام ألتمان، الرئيس التنفيذي لشركة "أوبن إيه آي"، مُشيرا إلى أن عصر النماذج الهائلة بات على وشك الانتهاء، وأن إستراتيجية تطوير مثل هذه النماذج قد انتهت، وستتطلب الخطوات المستقبلية في تطوير الذكاء الاصطناعي طرح أفكار جديدة. يستشهد التقرير بالمقارنة بين نماذج توليد الصور بالذكاء الاصطناعي، ويذكر تحديدا النموذج مفتوح المصدر "ستيبل ديفيوجن" (Stable Diffusion)، الذي طرحته الشركة الناشئة "ستابيليتي إيه آي" (Stability AI)، المتخصصة في الذكاء الاصطناعي، للجمهور مجانا في أغسطس/آب من العام الماضي، ويقارنه بالنموذج مغلق المصدر "دالي" الذي تطوره شركة "أوبن إيه آي" وطرحته قبلها بعام ونصف، تحديدا في يناير/كانون الثاني عام 2021. هذا النموذج مفتوح المصدر بالأخص قدم طفرة سريعة وواسعة في المجال، إذ كان بمنزلة ملجأ لكل مَن يرغب في تطوير تطبيقه أو نموذجه الخاص لتعديل وإنشاء الصور بالذكاء الاصطناعي على مدار العام الماضي. في النهاية، يستنتج "سيرناو" أن الفائز من هذا الأمر هي شركة "ميتا"، نظرا لأن كل هذه التطورات والتعديلات تحدث على نموذجها الخاص، وبهذا يعمل لديها مئات الباحثين والمبرمجين مجانا، ولا يوجد ما يمنعها من أن تدمج كل هذا في منتجاتها الخاصة بالذكاء الاصطناعي. لهذا ينصح شركته غوغل بتغيير تفكيرها الحالي في هذا المجال، والاتجاه لتبني نماذج الذكاء الاصطناعي مفتوحة المصدر، وإتاحة منصاتها العملاقة للمجتمع التقني، مثلما تفعل في منصات التشغيل الخاصة بها، مثل أندرويد وكروم، والانخراط في هذا النقاش الجاري. بهذا يمكنها أن تحجز مكانة رائدة، وتضع بنفسها توجهات المجال وتطوراته الجديدة مستقبلا، لأنها ستملك منصات تشغيله الأساسية. المزيد من الغموض https://www.aljazeera.net/wp-content...513&quality=80 جيف دين أخبر الموظفين بتحوُّل جديد في سياسة الشركة، وأنهم لن يشاركوا أبحاثهم مع العالم الخارجي، حتى تملك غوغل منتجا حقيقيا من الذكاء الاصطناعي يمكنها بيعه. (مواقع التواصل) لا يُعَدُّ التقرير إستراتيجية رسمية من داخل شركة غوغل، ومثل هذه الأنواع من التقارير الداخلية تُنشر عادة بصورة روتينية بين الموظفين، وهي غالبا آراء شخصية مبنية على تحليل الوضع القائم. لكن ما يُظهره هذا التقرير تحديدا هو وجود خلاف عميق داخل شركة غوغل حول إستراتيجيتها الحالية في مجال الذكاء الاصطناعي التوليدي. حتى هذه اللحظة، وكما شاهدنا في مؤتمرها السنوي غوغل I/O، كان تركيز الشركة في الأساس على محاولة منافسة مايكروسوفت، التي أدخلت تقنيات الذكاء الاصطناعي التوليدي إلى متصفحها "بينغ"، بجانب برامج أوفيس ونظام التشغيل ويندوز 11. (9) أدى هذا التركيز على المنافسة الحالية إلى تحوُّل غوغل بالكامل إلى نظام مغلق أكثر، وهو ما يخالف إستراتيجيتها سابقا بمشاركة أبحاث الذكاء الاصطناعي مع العالم التقني. وهو ما أكده تقرير من صحيفة واشنطن بوست، ذكر أن جيف دين، رئيس قسم الذكاء الاصطناعي في الشركة، أخبر الموظفين بتحوُّل جديد في سياستها، وأنهم لن يشاركوا أبحاثهم مع العالم الخارجي، على الأقل حتى تملك غوغل منتجا حقيقيا من الذكاء الاصطناعي يمكنها بيعه. (10) لسنوات مضت، كان جيف دين يدير قسم الذكاء الاصطناعي في غوغل مثل الجامعة، وكان يشجع الباحثين على نشر الأوراق العلمية الأكاديمية بغزارة، حتى إن الشركة نشرت أوراقا بحثية منذ عام 2017 ساهمت في بدء ثورة الذكاء الاصطناعي التوليدي الحالية. وهذا ما أشار إليه المهندس لوك سيرناو في تقريره الداخلي، منتقدا سياسة غوغل الجديدة لمحاولتها الحفاظ على سرية التقنيات الخاصة بها، في حين يمكن لموظفي الشركة أن يغادروا بسهولة وينتقلوا إلى المنافسين وينقلوا معهم معرفتهم ومعلوماتهم حول تقنيات الشركة التي ترى أنها سرية. هذا هو التكتيك نفسه الذي تتبعه شركة "أوبن إيه آي" في أبحاثها الخاصة، حين تحججت بالمنافسة لتبرير سبب عدم كشفها عن أي معلومات أو تفاصيل تخص بيانات التدريب لنموذجها اللغوي الجديد "GPT-4″، أو حتى كيفية تطويره. في مقابلة مع موقع "The Verge" أوضح إيليا سوتسكيفر، رئيس الباحثين في الشركة، أن هذا كان بهدف الحفاظ على الميزة التنافسية لهم في السوق، وعندما سُئل عن تغيُّر توجُّه الشركة وعدم اتباعها للنموذج مفتوح المصدر، أكد أنهم كانوا "مخطئين" سابقا بمشاركة ما لديهم من أبحاث، وأن تلك الأبحاث في مجال الذكاء الاصطناعي يجب ألا تكون مفتوحة المصدر. تظل أكبر عقبة أمام النماذج مفتوحة المصدر هي الأموال بالطبع، فلكي تصبح هذه الأنظمة مربحة ومستدامة فإنها تتطلب عشرات الملايين من الدولارات لتشغيلها وإدارتها بالصورة الصحيحة. هذا الرقم قد يُمثِّل جزءا بسيطا مما تستثمره الشركات العملاقة، لكنه رقم ضخم بالنسبة للشركات الناشئة مثل شركة "ستابيليتي إيه آي"، إذ أشار تقرير جديد من منصة "سيمافور" إلى أن الشركة تنفق أموالا طائلة، وصلت إلى 100 مليون دولار كانت قد جمعتها في جولة تمويل العام الماضي، مع تباطؤ في تحقيق الإيرادات. لكن لماذا ينبغي أن يُطرح كل هذا النقاش هنا والآن؟ نقاش مهم https://www.aljazeera.net/wp-content...513&quality=80 (شترستوك) إذا استبعدنا كل تلك الضجة والمصطلحات التسويقية، فإن الشيء المثير حقا حول تلك الأجيال الجديدة من نماذج الذكاء الاصطناعي التوليدي هو أنها ستغير جذريا الطريقة التي نتعامل بها مع أجهزة الحاسوب ومع البيانات والمعلومات. ويبدو أننا دخلنا الآن مرحلة حرجة من مراحل تطوير تلك النماذج، سنحتاج معها إلى أن نفتح نقطة نقاش مهمة: مَن يمكنه بناء وامتلاك وتقديم هذه النماذج القوية؟ وما الذي يعنيه ذلك؟ من المنطقي قطعا أن نفترض أن مَن سيتحكم في نماذج الذكاء الاصطناعي هي الشركات العملاقة، التي تتحكم فعلا في معظم خدمات شبكة الإنترنت في عصرنا الحالي. وبسبب تلك الأسئلة الأخلاقية المرتبطة بالذكاء الاصطناعي، بدأت الدعوات إلى إصدار نماذج تأسيسية مفتوحة المصدر تكتسب زخما في أرجاء الصناعة، هذا على الأقل ما ذكرته شركة "ميتا" من وراء إصدارها لنموذجها اللغوي الأخير وإتاحته لمزيد من الأبحاث في المجال. لكن بناء مثل تلك النماذج القوية ليس بالأمر الهيّن أو الرخيص كما ذكرنا، لأنها تتطلب عشرات الآلاف من الوحدات المتطورة لمعالجة الرسوميات، واستئجار خدمات سحابية في أكبر مراكز للبيانات، ومجهودات العديد من علماء ومهندسي تعلم الآلة ذوي الخبرة. لم يكن الوصول إلى تلك القلعة الحصينة، من بناء مثل هذه النماذج القوية، متاحا إلا لحفنة من عمالقة التقنية، مثل غوغل وميتا، أو الشركات الناشئة الممولة ببذخ، مثل "أوبن إيه آي"، التي تملك ما يشبه صندوقَ حرب ضخما بمئات الملايين من الدولارات. المشكلة أن تلك النماذج الخاصة بهذه الشركات العملاقة هي نماذج مغلقة المصدر، وهو ما يمنحها قدرا هائلا من القوة والتحكم في اتخاذ القرارات التي ستحدد غالبا شكل مستقبلنا ومستقبل أعمالنا. مثلا، إن كنا نخشى من أن الذكاء الاصطناعي سيستبدل وظائفنا، فإن مَن سيتحكم في هذا القرار هي تلك الشركات العملاقة بكل بساطة. من المرجح أن يكون الذكاء الاصطناعي محركا رئيسيا للكيفية التي ينظم بها المجتمع البشري نفسه في العقود المستقبلية القادمة. قد لا نعتقد بإلزام الضرورة الأخلاقية لاستمرار إتاحة الأبحاث والنماذج مفتوحة المصدر في هذا المجال، ولكن في النهاية، من الناحية العملية على الأقل، من المهم جدا أن يكون هناك أشخاص يطورون وينتجون أبحاثا علمية حول هذه التقنيات من أجل العلم وتراكم المعرفة، أشخاص ممن لا يستثمرون ماليا في نجاح تلك التقنيات التجاري، لأنه ببساطة هكذا يعمل العلم والتطور التقني، وهذه الثورة في مجال الذكاء الاصطناعي التوليدي نفسه بدأت واستمرت ووصلت إلى هذا القدر من النجاح بفضل إتاحة تلك الأبحاث والبرمجيات مفتوحة المصدر للجميع، بمشاركة غوغل و"أوبن إيه آي" أنفسهم. _________________________________________ المصدر : الجزيرة نت - محمد يوسف |
|
|
|
الساعة الآن 07:20 PM |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd. TranZ By
Almuhajir