Arabic - Measuring Intelligence — The Role of Benchmarks in Evaluating AGI

Source article: Measuring Intelligence — The Role of Benchmarks in Evaluating AGI | by SingularityNet | SingularityNET
Translation by: $cardano_class
Dework task link: https://app.dework.xyz/singularitynet-ambas/test-38287?taskId=2623dab7-f728-44f5-8283-79ac3e040b27
Community review: Please leave comments below about translation quality or like this post if it is well translated

قياس الذكاء – دور المعايير في تقييم الذكاء الاصطناعي العام

أيها السينجولاريتيون الأعزاء،

يمثل تطوير الذكاء العام الاصطناعي (AGI) أحد الأهداف النهائية لأبحاث الذكاء الاصطناعي. في حين أن التعريف أو التوصيف الدقيق للذكاء الاصطناعي العام لم يتم الاتفاق عليه على نطاق واسع، فإن مصطلح “الذكاء العام الاصطناعي” له معاني متعددة وثيقة الصلة، تشير إلى قدرة النظام الهندسي على:

  • إظهار نفس النوع الخام من الذكاء العام الذي يتمتع به البشر؛
  • عرض الذكاء غير المرتبط بمجموعة محددة للغاية من المهام؛
  • تعميم ما تعلمته، بما في ذلك التعميم على السياقات نوعيا
  • مختلفة تمامًا عن تلك التي رأتها من قبل؛
  • اتخاذ نظرة واسعة، وتفسير المهام المطروحة بمرونة في سياق
  • العالم أجمع وعلاقته به.

إن تحقيق هذا الإنجاز لا يتطلب أساليب قوية لتطوير الذكاء الاصطناعي العام فحسب، بل يتطلب أيضًا الوسائل التي يمكننا من خلالها قياس وتقييم تقدم الذكاء الاصطناعي العام. وبما أن الباحثين في جميع أنحاء العالم يخطوون خطوات واسعة باستمرار في هذا المجال، فإن دور المعايير يصبح متزايد الأهمية كلما اقتربنا من ظهور الذكاء العام.

في هذه المقالة، سنستكشف أهمية المعايير في تقييم الذكاء الاصطناعي العام، ودراسة كيف يمكن لبعض الاختبارات الموحدة أن تزودنا بمقياس واضح وموضوعي لرحلة الآلة نحو الذكاء الحقيقي الشبيه بالإنسان.

بدأ كل شيء باختبار تورينج

يعد اختبار تورينج، الذي اقترحه آلان تورينج في عام 1950، هو المعيار الأكثر شهرة للذكاء الاصطناعي. وهي تتضمن ثلاث محطات: واحدة يتحكم فيها الكمبيوتر واثنتان يتحكم فيهما البشر.

يقوم أحد البشر بدور السائل، بينما يقوم الإنسان الآخر والكمبيوتر بالإجابة. يجب على السائل تحديد المجيب الذي هو الجهاز.

يجتاز الكمبيوتر الاختبار إذا لم يتمكن السائل من تمييزه بشكل موثوق عن الإنسان. في البداية، كان هذا الاختبار مقبولًا فقط لأجهزة الكمبيوتر التي لديها أسئلة بسيطة بنعم/لا. ومع ذلك، يصبح الأمر أكثر صعوبة بشكل ملحوظ مع الاستفسارات التحادثية أو التوضيحية.

اختبار طالب كلية الروبوت

في عام 2012، تم اقتراح اختبار “Robot College Student” من قبل الدكتور بن جورتزل. وله منطق بسيط: إذا كان الذكاء الاصطناعي قادرًا على الحصول على درجة علمية بنفس الطريقة التي يحصل بها الإنسان، فيجب اعتباره واعيًا. يقيم هذا الاختبار قدرة الذكاء الاصطناعي على التعلم والتكيف وتطبيق المعرفة في بيئة أكاديمية.

ربما كانت فكرة الدكتور بن جورتزل، التي تمثل بديلاً معقولاً لـ “اختبار تورينج” الشهير، ستظل تجربة فكرية لولا نجاحات العديد من أنظمة الذكاء الاصطناعي. وأبرزها GPT-3، وهو نموذج اللغة الذي أنشأه مختبر أبحاث OpenAI. ومع ذلك، كان Bina48، وهو روبوت يعمل بالذكاء الاصطناعي، أول من أكمل فصلًا جامعيًا في جامعة نوتردام دي نامور في عام 2017. ومثال آخر هو الروبوت AI-MATHS، الذي أكمل نسختين من امتحان الرياضيات في الصين. على الرغم من قدرتها على إكمال الفصول الدراسية والامتحانات الجامعية، لا يزال أمام أنظمة الذكاء الاصطناعي هذه طريق طويل لتقطعه حتى تتمتع بالوعي والذكاء العام الحقيقي.

اختبار القهوة

يتضمن اختبار القهوة، الذي اقترحه أيضًا الدكتور بن جورتزل وأقره ستيف وزنياك، المؤسس المشارك لشركة Apple، تطبيقًا للذكاء الاصطناعي لإعداد القهوة في بيئة منزلية. يجب على الذكاء الاصطناعي العثور على المكونات والمعدات في أي مطبخ وتنفيذ المهمة البسيطة المتمثلة في إعداد القهوة. يقيّم هذا الاختبار قدرة الذكاء الاصطناعي على فهم بيئة جديدة والتنقل فيها، والتعرف على الأشياء، وتنفيذ سلسلة معقدة من الإجراءات، مما يعكس ذكائه العملي.

اختبارات موحدة أخرى تُستخدم لتقييم معايير الذكاء الاصطناعي المختلفة

إن تقييم ما إذا كان الذكاء الاصطناعي على الطريق إلى التحول إلى الذكاء الاصطناعي العام ينطوي على تقييم قدراته عبر أوسع نطاق ممكن من المهام المعرفية، حيث يتعين عليه إثبات التنوع والتعميم والقدرة على التكيف على غرار الذكاء البشري.

فيما يلي بعض المعايير والمعايير الرئيسية التي يتم أخذها في الاعتبار غالبًا:

· التعلم والتكيف

· المنطق السليم

· الإبداع والابتكار

· التنوع في حل المشكلات

· فهم اللغة الطبيعية (والجيل)

· الإدراك والتفاعل

· التعميم

· المنطق الأخلاقي والمعنوي

ولتقييم هذه المعايير، يعد الجمع بين الاختبارات الموحدة وتحديات العالم الحقيقي والتقييم المستمر عبر مجالات متعددة أمرًا ضروريًا.

وفيما يلي بعض أطر التقييم المقترحة الحالية:

· تحدي الذكاء الاصطناعي 2 (ARC) عبارة عن مجموعة بيانات مرجعية أنشأها معهد ألين للذكاء الاصطناعي (AI2) مصممة لتقييم قدرات الذكاء الاصطناعي المنطقية على المنطق. هناك مجموعتان من الأسئلة التي يجب على الذكاء الاصطناعي اجتيازها، واحدة بها أسئلة سهلة على المستوى السطحي، وأخرى بها مجموعة من الأسئلة التي تتطلب تفكيرًا معقدًا وتكامل مصادر متعددة للمعرفة للعثور على الإجابة الصحيحة. هدفها الرئيسي هو تجاوز حدود ما يمكن للآلة فهمه وعقله.

· معيار تقييم فهم اللغة العامة (GLUE) عبارة عن مجموعة من المهام المتنوعة لفهم اللغة الطبيعية (NLU). ومن المثير للاهتمام أنه يتألف من مجموعات مختلفة من المهام، مثل تحليل المشاعر (على سبيل المثال، هل يتم التعبير عن مشاعر معينة في جزء من النص؟)، والاستلزام النصي (تحديد ما إذا كانت جملة واحدة تتبع منطقيًا أخرى)، وحتى الدلالات الدلالية. التشابه (كما هو الحال في، ما مدى التشابه بين جملتين مختلفتين في المعنى؟) تم تصميم GLUE لتقييم وتعزيز التقدم في تطوير أنظمة الذكاء الاصطناعي التي يمكنها فهم وتوليد اللغة البشرية.

· تحدي مخطط فينوغراد هو اختبار مصمم لتقييم قدرة الذكاء الاصطناعي على فهم السياق وحل الغموض في اللغة الطبيعية، مع التركيز بشكل خاص على إزالة غموض الضمائر. ويهدف إلى اختبار الفهم الأعمق لأنظمة الذكاء الاصطناعي للغة والسياق، وهو أمر يتجاوز مجرد التعرف على الأنماط الإحصائية ليشمل المعرفة والتفكير في العالم الحقيقي. إذا كان الذكاء الاصطناعي “ناجحًا” في تحدي مخطط فينوغراد، فهذا يعني أنه قادر على إصدار أحكام مناسبة للسياق، وبالتالي، فإنه يُظهر فهمًا أكثر إنسانية للغة.

كيف يمكننا إنشاء معيار AGI فعال؟

يعد إنشاء معايير فعالة للذكاء الاصطناعي العام مشكلة معقدة ومليئة بالتحديات ومتعددة الأوجه.

ويبدأ الأمر أولاً بتعريف الذكاء، فهو يتضمن مراعاة مجموعة واسعة من القدرات المعرفية مثل التفكير وحل المشكلات والتعلم والإدراك والفهم العاطفي، مما يجعل إنشاء معايير شاملة أمرًا صعبًا للغاية.

من المتوقع أن يتفوق الذكاء الاصطناعي العام في مهام متنوعة، بدءًا من العمليات الحسابية البسيطة وحتى اتخاذ القرارات المعقدة والتفكير الإبداعي، وبطبيعة الحال، يزيد هذا من تعقيد تصميم المعايير لتقييم مثل هذا النطاق الواسع من القدرات.

وبما أن الذكاء البشري يتطور مع الخبرة والتعلم، فإن معايير الذكاء الاصطناعي العام يجب أن تأخذ في الاعتبار هذه الطبيعة الديناميكية، وتقييم الأداء الثابت والقدرة على التكيف مع مرور الوقت.

مع كل ما قيل، من الآمن أن نقول إن المعايير تلعب دورًا كبيرًا في تقييم التطور والتقدم نحو الذكاء الاصطناعي العام، لأنها ستزودنا بوسائل موضوعية موحدة لقياس هذا التقدم.

ومع ذلك، لا يزال أمامنا طريق طويل لنقطعه حتى يتم إنشاء معيار فعال بسبب الحجم الهائل والتعقيد الذي ينطوي عليه الأمر. ومع تقدم الأبحاث في الذكاء الاصطناعي العام، يتطور أيضًا تعقيد وشمولية معاييرنا، مما يجعلنا أقرب إلى هدف تحقيق الذكاء العام الاصطناعي الحقيقي.

حول سينجولاريتي نت

SingularityNET عبارة عن منصة لامركزية للذكاء الاصطناعي وسوق لخدمات الذكاء الاصطناعي (AI). مهمتنا هي إنشاء ذكاء اصطناعي عام لامركزي وديمقراطي وشامل ومفيد، مما يضفي طابعًا ديمقراطيًا على الوصول إلى تقنيات الذكاء الاصطناعي والذكاء الاصطناعي العام من خلال:

  • منصتنا، حيث يمكن لأي شخص تطوير ومشاركة واستثمار خوارزميات الذكاء الاصطناعي ونماذجه وبياناته.
  • سيكون OpenCog Hyperon ، إطار عمل AGI الرائد للرمز العصبي، بمثابة خدمة أساسية للموجة التالية من ابتكارات الذكاء الاصطناعي.
  • نظامنا البيئي ، يعمل على تطوير حلول الذكاء الاصطناعي المتقدمة عبر قطاعات السوق لإحداث ثورة في الصناعات.

ابق على اطلاع بآخر الأخبار، تابعنا على:

رابط تقويم أحداث مجتمع SingularityNET - ابق مطلعًا على أحداث المجتمع والسفير وأحداث التمويل العميق!