أطلقت مجموعة من المهندسين والباحثين في الإمارات بالتعاون مع إحدى شركات التقنية في وادي السيليكون أول نموذج لغوي كبير للغة العربية يمكن له أن يكون أساسًا لتطبيقات الذكاء الاصطناعي، ليكون الأول من نوعه في العالم.
النموذج اللغوي الكبير أطلق عليه اسم "جيس"، وهو يتكون من 13 مليار مؤشر صُمم بواسطة مجموعات كبيرة من البيانات باللغتين العربية والإنجليزية، وقد كان الدافع الأساسي للعمل على النموذج يتمثل، وفقًا للعاملين عليه، بوجود عدد قليل من النماذج ثنائية اللغة.
أنشئ النموذج اللغوي الجديد باستخدام أجهزة الكمبيوتر فائقة يطلق عليها اسم "كوندور جالكسي" أنتجتها شركة سيريبراس سيستمز التي يقع مقرها في وادي السيليكون، والتي تصمم كذلك رقائق صغيرة الحجم تنافس تلك التي تنتجها شركة نفيديا.
كما أطلقت المجموعة على النموذج الجديد اسم "جيس"، تيمنًا بأعلى قمة جبلية في الإمارات، وقد أنجز في مشروع مشترك بين كل من سيريبراس سيستمز، وجامعة محمد بن زايد للذكاء الاصطناعي، وشركة جي 42، وهي إحدى الشركات التابعة لشركة إنسبشن التي يقع مقرها في مدينة أبو ظبي ويمتلكها الشيخ طحنون بن زايد آل نهيان، والمعروفة بشراكاتها مع شركات إسرائيلية عديدة للعمل على مشاريع تكنولوجية، كما أنها كانت أول شركة إماراتية تفتتح مكتبًا لها في دولة الاحتلال بعيد توقيع اتفاقية التطبيع بين الإمارات وإسرائيل عام 2020.
النموذج اللغوي الكبير أطلق عليه اسم "جيس"، وهو يتكون من 13 مليار مؤشر صُمم بواسطة مجموعات كبيرة من البيانات باللغتين العربية والإنجليزية.
تم تدريب نموذج جيس على رموز بيانات باللغة الإنجليزية خاصة بالمنطق، وذلك نظرًا لقلة البيانات العربية من هذا النوع، وفقًا للأستاذ تيموثي بالدوين من جامعة محمد بن زايد للذكاء الاصطناعي. كما يقول مبتكرو النموذج إنه صمم ليمتلك فهمًا أدق للثقافة العربية والسياق السائد في المنطقة، على خلاف النماذج المصنعة في الولايات المتحدة.
ويضيف بالدوين أنه جرى إخضاع النموذج قبل إطلاقه لاختبارات مكثفة بهدف استبعاد المحتوى "الضار والحساس"، وكذلك "المخرجات العدائية أو غير الملائمة التي لا تمثل قيم المؤسسات المعنية في تطوير النموذج."
يأتي الإعلان عن النموذج الجديد في الوقت الذي تشيع فيه الأنباء عن شراء كل من الإمارات والسعودية لآلاف الرقاقات عالية الأداء من شركة نفيديا، والتي تعد ضرورية لإنتاج برامج الذكاء الاصطناعي، في ظل تسابق عالمي محموم للحصول على المواد الضرورية اللازمة لتطوير تقنيات الذكاء الاصطناعي.
وكانت الإمارات قد طورت سابقًا نموذجًا لغويًا كبيرًا مفتوح المصدر أطلق عليه اسم فالكون، وكان قد أنتجه معهد الابتكار التكنولوجي في مدينة مصدر المملوك للدولة باستخدام أكثر من 300 رقاقة من إنتاج نفيديا.
كما أنه في مطلع العام الجاري عقدت شركة سيريبراس سيستمز صفقة بقيمة 100 مليون دولار مقابل تزويد شركة جي 42 بتسعة كمبيوترات فائقة، في صفقة اعتبرت من بين الأضخم من هذا النوع عالميًا.