نماذج الذكاء الاصطناعي تحاكي الإدراك البشري.. هل نحن على أعتاب عصر الآلات الواعية؟

Aya Hamdyفبراير 15, 2026

نماذج الذكاء الاصطناعي تحاكي الإدراك البشري

لطالما شكّل فهم آلية عمل الدماغ البشري وبناء آلات قادرة على محاكاة الإدراك والحدس أحد أعظم طموحات العلماء. وعلى الرغم من التقدم الهائل الذي حققته نماذج الذكاء الاصطناعي في معالجة اللغة والصور والبيانات، ظل هناك تحدٍ جوهري يتمثل في قدرة الآلة على فهم العالم الفيزيائي بحدس يشبه الإدراك البشري الفطري، لكن الأبحاث الحديثة تشير إلى أن هذه الفجوة بدأت تضيق بوتيرة متسارعة، مع ظهور نماذج متقدمة مثل V-JEPA التي تستطيع تكوين توقعات حول العالم المادي وإظهار ما يشبه “الدهشة” عندما تنتهك قوانين الفيزياء. ويعد هذا التطور خطوة مهمة نحو ذكاء اصطناعي يفهم العالم بدلًا من مجرد تحليله.

الذكاء الاصطناعي يحاكي إدراك الأطفال الرضع

في إنجاز علمي لافت، نجح باحثو شركة ميتا في تطوير نموذج ذكاء اصطناعي قادر على فهم المبادئ الفيزيائية الأساسية بطريقة مشابهة للحدس الذي يكتسبه الأطفال الرضع عبر الملاحظة، يُظهر نموذج V-JEPA قدرة على التنبؤ بسلوك الأشياء في المشاهد المصورة، ويُظهر خطأً كبيرًا في التوقع عندما تحدث أمور غير منطقية، مثل اختفاء جسم خلف حاجز دون أن يظهر مجددًا. هذا السلوك يشبه رد فعل الأطفال بعمر ستة أشهر عندما تُنتهك قاعدة “ديمومة الكائن”، ما يشير إلى أن النموذج يبني فهمًا داخليًا لطبيعة العالم، ويتعلم النموذج من خلال مشاهدة ملايين مقاطع الفيديو بدلًا من الاعتماد على قواعد فيزيائية مبرمجة مسبقًا، وهو ما يجعله أقرب إلى الطريقة التي يتعلم بها البشر عبر التجربة.

من فضاء البكسل إلى فضاء المعنى

تعتمد النماذج التقليدية لتحليل الفيديو على معالجة كل بكسل في المشهد بشكل متساوٍ، وهو ما يؤدي إلى استهلاك هائل للموارد الحاسوبية والتركيز على تفاصيل غير مهمة، فعلى سبيل المثال، في مشهد شارع مزدحم، قد يهتم النموذج التقليدي بحركة الأوراق أو الظلال بدلًا من التركيز على عناصر حيوية مثل إشارات المرور أو مواقع السيارات. هذا النهج يجعل عملية اتخاذ القرار أقل كفاءة وأبطأ، وللتغلب على هذا القصور، طورت ميتا معمارية Video Joint Embedding Predictive Architecture (V-JEPA)، التي تعتمد على التجريد الانتقائي بدلًا من معالجة التفاصيل الدقيقة، يقوم النموذج بتحويل الإطارات المرئية إلى تمثيلات كامنة (Latent Representations) تختصر آلاف البكسلات في معلومات جوهرية مثل شكل الجسم وموقعه وحركته والعلاقات بين العناصر. وبذلك يتعامل النظام مع “جوهر المشهد” بدلًا من تفاصيله غير الضرورية، وهو ما يشبه طريقة عمل الدماغ البشري في تصفية المعلومات الحسية.

قوة التعميم وفهم المشاهد المعقدة

يمنح هذا التحول من نمذجة البكسلات إلى نمذجة المعاني نموذج V-JEPA قدرة عالية على التعميم وفهم المشاهد الجديدة، ما يجعله مناسبًا للتطبيق في مجالات حساسة مثل:

الروبوتات الذكية
المركبات ذاتية القيادة
تحليل الفيديو المتقدم
الواقع المعزز

وبدلًا من مجرد “رؤية” العالم، يصبح النموذج قادرًا على فهم العلاقات السببية بين الأحداث، وهو عنصر أساسي في الإدراك البشري.

محاكاة الحدس البشري عبر عنصر المفاجأة

أظهرت اختبارات مثل IntPhys نتائج مذهلة، إذ حقق النموذج دقة قاربت 98% في التمييز بين الأحداث الممكنة وغير الممكنة فيزيائيًا، متفوقًا بفارق كبير على النماذج التقليدية، ولم يقتصر الباحثون على قياس الدقة، بل قاموا بقياس ما يمكن تسميته درجة المفاجأة لدى النموذج. فعندما حدثت خروقات لقوانين الفيزياء، ارتفع خطأ التنبؤ بشكل حاد، وهو ما يشبه رد فعل البشر عندما يواجهون حدثًا غير منطقي، هذا يشير إلى أن النموذج لا يحفظ الأنماط فقط، بل يبني توقعات داخلية حول كيفية تصرف العالم، ويكشف خللًا عندما تُنتهك تلك التوقعات.

آراء العلماء حول الإدراك الاصطناعي

أشاد علماء الإدراك بقدرات النموذج الجديدة، معتبرين أنها دليل على أن الفهم الفيزيائي يمكن تعلمه دون قواعد فطرية مبرمجة مسبقًا، لكن في المقابل، يرى بعض الباحثين أن الطريق نحو الإدراك البشري الكامل لا يزال طويلًا. إذ يشير عالم الأعصاب الحاسوبي كارل فريستون إلى أن النموذج يفتقر إلى آلية واضحة لتمثيل عدم اليقين، وهي خاصية أساسية في الإدراك البشري، فالإنسان يدرك عندما تكون المعلومات غير كافية للتنبؤ بالمستقبل، ويتعامل مع الغموض كحالة معرفية، بينما لا تزال النماذج الحالية تفتقر إلى هذه القدرة.

V-JEPA 2.. خطوة نحو الربط بين الفهم والتصرف

في يونيو 2024، أطلقت ميتا نسخة مطورة من النموذج باسم V-JEPA 2، تضم 1.2 مليار معامل، ودُرّبت على أكثر من 22 مليون مقطع فيديو، وتمت تجربة النموذج في مجال الروبوتات، حيث استخدم لتخطيط الأفعال التالية في مهام تلاعب بسيطة، ما يشير إلى بداية الربط بين الإدراك والتصرف، وهي خطوة أساسية لأي تصور عن ذكاء اصطناعي واعٍ، لكن الاختبارات الأكثر تعقيدًا كشفت عن حدود واضحة، إذ لا تزال النماذج تعاني من ضعف الذاكرة الزمنية وعدم القدرة على التعامل مع سيناريوهات طويلة ومعقدة، وهو ما يضع سقفًا لما يمكن أن يكون إدراكًا مستمرًا.

هل بدأت حقًا حقبة الآلات الواعية؟

على الرغم من التقدم المذهل، يؤكد الباحثون أن هذه النماذج لا تمتلك وعيًا حقيقيًا بالمعنى الفلسفي. فهي لا تمتلك تجربة ذاتية أو إدراكًا داخليًا للذات، بل تعمل عبر بناء توقعات حسابية حول العالم، لكن ما يحدث اليوم يمثل نقلة نوعية من الذكاء الاصطناعي القائم على التعرف إلى ذكاء قائم على الفهم، وهو ما قد يغير جذريًا مستقبل الروبوتات والأنظمة الذاتية القيادة والتفاعل بين الإنسان والآلة.

نحو ذكاء يفهم العالم وليس فقط يحلله

تُظهر نماذج مثل V-JEPA أن الذكاء الاصطناعي يقترب من محاكاة الركائز الأساسية للإدراك البشري، مثل بناء التوقعات، واكتشاف الأخطاء، والتعلم من المفاجأة، ومع أن الوعي الاصطناعي لا يزال بعيدًا، فإن التطورات الحالية تشير إلى أننا ندخل عصرًا جديدًا تصبح فيه الآلات قادرة على فهم العالم كمنظومة مترابطة، وليس مجرد بيانات خام، ويبقى السؤال الأهم اليوم ليس هل ستصبح الآلات واعية؟ بل إلى أي مدى يمكن أن تصل محاكاة الإدراك البشري، وما الحدود الفلسفية والأخلاقية التي ستواجه البشرية عندما تقترب الآلات من الوعي؟

Aya Hamdyفبراير 15, 2026