تتطرق نايلة الصليبي في "النشرة الرقمية" إلى إطلاق شركة "غوغل" لنموذج اللغة العريضة LLM متعدد الوسائط Gemini، الذي تصفه "غوغل" بطراز الذكاء الاصطناعي "الأكبر والأكثر قدرة"، والذي سيدمج في نموذج الذكاء الاصطناعي للمحادثة باللغة الطبيعية Google Bard.
غوغل تتحدى أوبن إي آي وتطلق Gemini
ينطلق من جديد، وبقوة، السباق للسيطرة على سوق الذكاء الاصطناعي التوليدي مع إطلاق غوغل لنموذج اللغة العريضة Large Laguage Model،Gemini، لمنافسة شات جي بي تي بنسخته الرابعة.
نموذج Geminiهو وليد عملية دمج مختبرات البحوث الأساسية في غوغل، Deepmind وBrain، واعتمادًا على نوع المهام، يوفر نموذج اللغة العريضة هذا إداءً يساوي أو أكثر من أداء GPT-4.
حسب المعلومات التي قدمتها غوغل دُرِبَ نموذج اللغة العريضة Gemini باستخدام معالجات Tensor Processing Units (TPU) الخاصة بشركة غوغل، التي تقلل من الاعتماد على الرقائق من شركة Nvidia، وهي الشركة الأمريكية المسيطرة على سوق الرقائق وتتحكم بشكل كبير في توفير الرقائق لتدريب نماذج الذكاء الاصطناعي التوليدي والتي تؤثر بشكل كبيرعلى تقدم بحوث وتطوير الشركات والمختبرات في العالم لنماذج الذكاء الاصطناعي التوليدي.
ميزات ومهام نموذج اللغة العريضة Gemini
قدم الرئيس التنفيذي لشركة غوغل سوندار بيشاي وديميس هاسابيس مديرمختبر Google Deepmind خلال مؤتمرهما الصحافي Gemini على أنه من "أقوى نماذج اللغة العريضة multimodal "أي الذكاء الاصطناعي القادر على تحليل مصادر المعلومات والتعرف إلى أنواع مختلفة من المعلومات وفهمها مثل النص، ورموز البرمجة، والصوت، والصورة، والفيديو في نفس الوقت.
عُرِض خلال المؤتمر الصحفي، مقطع فيديو يُظهِر نموذج Gemini بأنه قادر على التعرف على الأشياء، كأن جسم ما مصنوع من البلاستيك، و يمكنه فهم و لعب Bonneteau بتفوق، وهي لُعْبَة قمار تُعرف بخدعة البطاقات الثلاث، وأيضا يمكن لـGemini فهمَ عرض مسرحي لدمى الظل، وتحليل ما يحدث في فيديو ما، وإيجاد النقاط المشتركة بين الأشياء.
أحجام مختلفة لمهام مختلفة
يأتي الإصدار الأول من Gemini بثلاثة أحجام:
ما سيتيح للمستخدمين تحقيق مهام فائقة كقدرة تطبيق مسجل الصوت على كتابة نسخة مكتوبة من الملاحظات المسجلة (مقابلة، محاضرة، وما إلى ذلك)، وأيضًا القدرة على إنشاء ملخص، دون الاتصال بالإنترنت. وبات بإمكان مطور تطبيقات أندرويد طلب الوصول إلىGemini Nano
تقول غوغل إن Gemini Ultra هو أول نموذج للذكاء الاصطناعي "يمكنه التفوق على الخبراء البشريين" في المعرفة ولديه قدرات حل المشكلات عبر 57 موضوعًا، من بينها الرياضيات، الطب، التاريخ، والأخلاق.
كما يمكن لـ Gemini أيضًا فهم وإنشاء الكود أو الرموز في لغات البرمجة مثل بايثون وجافا و++C.
فقط باللغة الانجليزية
هذا وسيعتمد نموذج الذكاء الاصطناعي للمحادثة باللغة الطبيعية Google Bard على نموذج اللغة العريضة Gemini Pro، ما يتيح تزويد مستخدمي الإنترنت الناطقين باللغة الإنجليزية بإجابات أكثر ثراءً ودقة في أكثر من 170 دولة وإقليمًا، وتخطط غوغل للتوسع ودعم لغات أخرى ومواقع جديدة، اعتبارًا من بداية العام المقبل 2024
الحماية من الاستخدام السيئ أو الهلوسة
توضح غوغل ان مختبراتها تجري حاليًا عمليات تحقق معمقة من سلامة النموذج". ولحمايته من الاستخدام السيئ أو الهلوسة قالت غوغل "إنها تضيف الحماية الفائقة لـGemini بسبب القدرات المتعددة الوسائط Multimodal، وتختبر المخاطر المحتملة في أثناء التطوير، بما في ذلك التحيز والمحتوى العنيف والقوالب النمطية السلبية".
فقد كان من المقرر إطلاق Gemini مع ضجة إعلامية كبيرة في ديسمبر 2023من خلال عدة مؤتمرات صحفية في الولايات المتحدة. ولكن هذه الخطط قُلِصَت عندما وجد خبراء DeepMind وBrain أن أداء نموذج اللغة العريضة LLM Gemini لم يكن مرضيًا بدرجة كافية خاصة في لغات أخرى غير الإنجليزية. لذا علينا انتظار العام الجديد.
كانت غوغل الرائدة في البحوث الأساسية في مجال الذكاء الاصطناعي وهي ترغب بالبقاء حسب سوندار بيشاي شركة "جريئتا ولكن مسؤولةً" وتجد نفسها اليوم في موقع منافس ضد تحالف Microsoft - Open AI
يمكن الاستماع لـ "بودكاست النشرة الرقمية" على مختلف منصات البودكاست. الرابط للبودكاست على منصة أبل
للتواصل مع #نايلةالصليبي عبر صفحة برنامَج"النشرة الرقمية"من مونت كارلو الدولية على لينكد إن وعلى تويتر salibi@ وعلى ماستودون وعبر موقع مونت كارلو الدولية مع تحيات نايلة الصليبي