مفاجأة.. الذكاء الاصطناعي يفشل في "مهمة بسيطة" يؤديها البشر

يمكن للذكاء الاصطناعي إنتاج صور واقعية ، وكتابة روايات ، وأداء مهام المدرسة الخاصة بك ، وحتى تقدير بنية البروتينات.

ومع ذلك ، كشف بحث جديد أنه غالبًا ما فشل في مهمة أساسية بسيطة للغاية: الوقت المحدد.

اختبر الباحثون في جامعة إدنبرة قدرة نوع من أنواع الذكاء الاصطناعي التي يمكن أن تشرح وتخلق أنواعًا مختلفة من الوسائط – النماذج اللغوية اللغوية المتعددة الوسائط السبع – النماذج اللغوية المعروفة – المعروفة بالإجابة على أسئلة الوقت بناءً على صور مختلفة للساعات أو التقويمات.

وأظهر العمل الذي يتعين نشره في أبريل ، وفقًا للتقرير ، أن النماذج اللغوية الكبيرة تواجه صعوبات في هذه المهام الأساسية.Gizmodoخبير أخبار التكنولوجيا.

في الدراسة ، كتب الباحثون أن القدرة على شرح المدخلات المرئية والتفكير فيها على أساس المدخلات المرئية مهمة للغاية بالنسبة للعديد من العوالم الحقيقية من البرنامج إلى الأنظمة المستقلة عن البرنامج.

على الرغم من التقدم في النماذج اللغوية متعددة الوسائط العظيمة ، تركز معظم الأبحاث على اكتشاف شيء ما ، أو شرح الصور ، أو فهم الجمهور ، وهذا يترك المنطق دون اكتشاف ما يكفي.

ما هو العمل؟

اختبر الباحثون النماذج “GPT-4Oو “و”GPT-O1“” AI Open “و”التوأم 2.0من Google Depp Mind وكلود 3.5 السوناتة“من” الإنسان “LAMA 3.2-11B-Vision-In-In-In-In-In-In-INSWمن “meta” و “Qwen2-VL7B-ICULT“علي بابا” و “minicpm-v-2.6“من”نموذج“.

بالإضافة إلى صور التقييم لمدة عشر سنوات ، قام الباحثون بتغذية الأرقام الرومانية ، وبعض الأرقام الرومانية ، والألوان المختلفة ، وألوان مختلفة ، وصور مختلفة حتى مفقود العقرب الثاني.

فيما يتعلق بصور المراقبة ، سأل الباحثون النماذج: ما هو الوقت الموضح في ذلك الوقت في الصورة؟ أما بالنسبة لصور التقويم ، طرح الباحثون أسئلة بسيطة على النحو التالي: ما هو يوم رأس السنة؟ وأسئلة أكثر تعقيدًا مثل ما يلي: ما هو 153 يومًا في السنة؟

بشكل عام ، لم يكن أداء أنظمة الذكاء الاصطناعي جيدًا. قرأته بشكل صحيح في الأوقات التناظرية أقل من 25 ٪ من الحالات.

وفقًا للباحثين ، جعلت Al -Dennamdad من الصعب حمل الساعات المتدفقة والساعات التي تحمل عقرب بطلاقة وعقرب متدفق.

وحصلت على نموذج “التوأم 2.0“أعلى درجة في الفريق.”GPT-O1“80 ٪ من مهمة التقويم بشكل صحيح ، أفضل بكثير من المنافسين. ولكن حتى في هذه الحالة ، فإن النماذج اللغوية الأكثر نجاحًا لديها ما يقرب من 20 ٪ من التقويم.

أوضح الباحثون أن قراءة الساعة التناظرية وفهم التقويم تتطلب خطوات معرفية معقدة لأنها تتطلب وعيًا بصريًا دقيقًا مثل مناطق الساعة ويتطلبون تفكيرًا عدديًا معقدًا (مثل حساب الاختلافات في الأيام).

اسأل بوكسنل

مفاجأة.. الذكاء الاصطناعي يفشل في “مهمة بسيطة” يؤديها البشر

اترك تعليقاً

متى موعد عيد الفطر 2025 في العراق

دليل نافس الذي أعده الشؤون بتعليم جدة عربي النصوص ثالث متوسط

صديقتي كل عام وانتي بخير عيد الاضحى 2025

عبارات تهنئه بعيد الاضحى المبارك 2025 – 1446

بطاقة تهنئة عيد الاضحى وزارة الصحة 1446

ثيمات عيد الاضحى 2025

حالات عيد الاضحى للواتس اب 2025

أمثلة على قاعدة as soon as when في الإنجليزي؟

اترك تعليقاً