علماء رياضيات اختبروا الذكاء الاصطناعي.. فكيف كانت النتائج؟
9 فبراير 2026
في وقت يتصاعد فيه الجدل العالمي حول قدرة الذكاء الاصطناعي على إزاحة البشر من مجالات معرفية معقدة، يطرح عدد من أبرز علماء الرياضيات سؤالًا جوهريًا: إلى أي حد يمكن فعلًا لنماذج الذكاء الاصطناعي أن تنافس العقل البشري في البحث الرياضي المتقدم؟
هذا السؤال كان جوهر رسالة بعث بها طالب ثانوي شغوف بالرياضيات إلى عالم الرياضيات الشهير مارتن هايرر، عبّر فيها عن قلقه من أن التطور المتسارع للذكاء الاصطناعي قد يجعل علماء الرياضيات "عديمي الفائدة". وتساءل الطالب: "إذا امتلكنا آلة أفضل منا بكثير في حل المشكلات، ألا تفقد الرياضيات جزءًا من سحرها؟"
وحسب تقرير لصحيفة "نيويورك تايمز" فإن هايرر، الحائز على "ميدالية فيلدز" عام 2014، وهي أرفع جائزة في عالم الرياضيات، و"جائزة الاختراق" عام 2021، ردّ على هذا القلق بنبرة هادئة، مؤكدًا أن الرياضيات ما تزال مجالًا "آمنًا" نسبيًا أمام زحف الذكاء الاصطناعي. وأوضح أن نماذج اللغة الكبيرة، التي تقوم عليها روبوتات الدردشة، باتت ماهرة في حل مسائل "مصطنعة"، لكنها لم تُظهر حتى الآن قدرة حقيقية على ابتكار أفكار أو مفاهيم جديدة.
تجربة علمية لاختبار القدرات الحقيقية
هذا النقاش كان مدخلًا للحديث عن ورقة بحثية جديدة بعنوان "First Proof" شارك هايرر في إعدادها مع نخبة من علماء الرياضيات، من بينهم محمد أبو زيد من جامعة ستانفورد، ولورين ويليامز من جامعة هارفارد، وتامارا كولدا، مديرة مؤسسة MathSci.ai الاستشارية في سان فرانسيسكو.
هدفت الورقة إلى إطلاق تجربة غير مسبوقة لاختبار قدرات الذكاء الاصطناعي في التعامل مع مسائل رياضية حقيقية على مستوى البحث العلمي، وليس مع مسائل معيارية أو مبسّطة. ولهذا الغرض، جمع الباحثون أسئلة مستمدة مباشرة من أبحاثهم غير المنشورة، في محاولة لتقديم مقياس واقعي وموضوعي لأداء الذكاء الاصطناعي في هذا المجال.
ويأمل القائمون على المشروع أن تسهم هذه المبادرة في تهدئة الخطاب المبالغ فيه الذي يتحدث عن "حلّ الرياضيات" بواسطة الذكاء الاصطناعي، لما لهذا الخطاب من آثار سلبية، مثل إحباط الطلاب الجدد أو عزوف جهات التمويل عن دعم البحث العلمي.
انتقاد لآليات التقييم التجارية
يشير الباحثون إلى أن شركات الذكاء الاصطناعي تعتمد غالبًا على مشكلات "مصطنعة أو مقيّدة" عند تقييم نماذجها، وهي لا تعكس طبيعة البحث الرياضي الحقيقي. وفي بعض الأحيان، يُطلب من علماء رياضيات إعداد مثل هذه الأسئلة مقابل مبالغ مالية، إلا أن فريق "First Proof" شدد على استقلاليته الكاملة وعدم وجود أي ارتباط له مع شركات الذكاء الاصطناعي.
ويقول محمد أبو زيد إنه رفض المشاركة في أحد هذه التقييمات التجارية، معتبرًا أن هناك حاجة إلى جهد عام ومستقل، واصفًا مشروع "First Proof" بأنه "محاولة أولى" في هذا الاتجاه.
نتائج أولية مخيبة للآمال
في المرحلة الأولى من التجربة، اختبر الفريق أداء نماذج متقدمة مثل ChatGPT-5.2 Pro وGemini 3.0 Deep Think. ووفقًا للنتائج الأولية، واجهت هذه الأنظمة صعوبة كبيرة في الإجابة عن العديد من الأسئلة، حتى عند منحها فرصة واحدة فقط للإجابة.
لورين ويليامز أشارت إلى أن أحد النماذج دخل في حلقة لا نهائية من التعديلات، معلنًا في كل مرة أنه وصل إلى "الحل النهائي"، قبل أن يتراجع مجددًا. وفي حالات أخرى، قدّم النموذج إجابات صحيحة لمسائل مختلفة تمامًا عن السؤال المطروح.
أما تامارا كولدا، فوصفت النتائج بأنها "مخيبة"، مشيرة إلى أن الذكاء الاصطناعي تجاهل معلومات أساسية وكان غير متسق في تحليله، ما دفعها إلى إعادة صياغة سؤالها لمنح النموذج فرصة أفضل في الجولة المقبلة.
ذكاء بلا صرامة
من جانبه، لاحظ هايرر أن النماذج تميل إلى الإسهاب في شرح النقاط السهلة، بينما تختصر أو تتجاهل جوهر البرهان الرياضي. وشبّه بعض الإجابات بأوراق كتبها طلاب ضعفاء، "يعرفون من أين يبدأون وإلى أين يريدون الوصول، لكنهم لا يعرفون كيف يصلون"، على حد تعبيره.
ورغم ذلك، لم يُخفِ هايرر إعجابه أحيانًا بقدرة الذكاء الاصطناعي على تجميع حجج معروفة وإجراء حسابات صحيحة، لكنه شدد على أن المشكلة الأساسية تكمن في غياب الموثوقية، إذ يظهر النموذج ثقة مطلقة حتى عندما يكون مخطئًا.
مخاوف تتجاوز الرياضيات
يتجاوز القلق الذي يطرحه المشروع حدود الأداء التقني، ليصل إلى تأثير الذكاء الاصطناعي على تطور العلم نفسه. كولدا حذّرت من أن تصوير الذكاء الاصطناعي كـ"زميل علمي" أمر مضلل، لأن الآلة لا تمتلك وجهة نظر مستقلة ولا تخوض جدلًا فكريًا حقيقيًا.
كما عبّرت عن خشيتها من أن يؤدي ترسيخ آراء علمية معينة داخل أنظمة الذكاء الاصطناعي إلى إبطاء تطور الأفكار الجديدة، في إشارة إلى المقولة الشهيرة لماكس بلانك بأن "العلم يتقدم جنازةً بعد أخرى".
خطوة أولى لا أكثر
اختار الفريق نشر ورقته بالتزامن مع "يوم أويلر"، نسبةً إلى عالم الرياضيات السويسري ليونهارد أويلر، في إشارة رمزية إلى العلاقة العميقة بين الرياضيات الكلاسيكية وتقنيات الذكاء الاصطناعي الحديثة.
يعتبر الذكاء الاصطناعي أداة قوية ومفيدة، لكنه حتى الآن بعيد عن أن يكون بديلًا حقيقيًا للإبداع البشري في الرياضيات
ومع نشر الدفعة الأولى من الأسئلة، دعا الباحثون المجتمع الرياضي العالمي إلى المشاركة والتفاعل، على أن تُطلق جولة ثانية أكثر تنظيمًا خلال الأشهر المقبلة.
الرسالة الأساسية التي يخرج بها المشروع واضحة: الذكاء الاصطناعي أداة قوية ومفيدة، لكنه حتى الآن بعيد عن أن يكون بديلًا حقيقيًا للإبداع البشري في الرياضيات، المجال الذي لا يزال سحره قائمًا على الفكرة الجديدة، لا على الحساب وحده.