معاناتي في البحث مع الذكاء الاصطناعي 🤖

زائد: ماذا تفعل بالأفكار المرفوضة؟

لو خطرت على بالك فكرة، واجتهدت عليها، لكن لم تُقبَل، ماذا تفعل بها؟

ادفنها في مقبرة الأفكار!

قبل أن تتحسَّس من فكرة الدفن، اعلم أنَّ هذا ما يفعله الصحفيون في فريق الإيكونومست.

في هذه التدوينة من مدونة فريق التحقيقات البيانية على سبستاك، يشارك الصحفيون أفكارهم الميتة رغم اجتهادهم عليها، ولأسباب عدة: 

  • الفكرة مثيرة للاهتمام لكن حجمها الحقيقي تغريدة وليس تقريرًا مطولًا.

  • اكتراثك لأسعار تأجير الغرف في إيرلندا حيث قضيت الصيف الماضي، لا يعني أنَّ قارئ المجلة سيكترث لها. (يعني تجربتك الشخصية لا تعني بالضرورة أنها تجربة عالمية.)

  • أحدهم سبقك إلى نشر الفكرة بينما أنت منهمك في تصميم الرسم البياني المرافق.

  • التقرير لا يعتمد فحسب على الأرقام والمعادلات البيانية، بل يحتاج إلى سرد قصصي عن الناس.


تتعدد الأسباب، وموت الفكرة واحد! 🤷🏻‍♀️

إيمان أسعد


رسم: الفنان عمران
رسم: الفنان عمران

معاناتي في البحث مع الذكاء الاصطناعي 🤖

حسن الحسين

في أثناء عملي على إحدى المقالات، كنت أبحث عن إجابة سؤال محدد: كم يحتاج الدماغ من وقت ليستعيد تركيزه الكامل على مهمة أساسية بعد أن تقاطعها مكالمة طارئة أو تنبيهٌ عابر؟

وانطلقت في رحلة بحثي المعتادة عن الإجابات. في غضون ثوانٍ فقط، بدت الإجابة محسومة؛ مئات المقالات تُجمِع على رقم واحد: «ثلاث وعشرون دقيقة وخمس عشرة ثانية». يبدو أن الرقم كبير ومغرٍ لأنْ أكتب عبارة مثل هذه: «تخيَّل أنك تحتاج إلى أكثر من ثلاث وعشرين دقيقة لاستعادة تركيزك الذهني الكامل بعد أن يقاطعك إشعار من جوالك!».

لكن مثل أي باحث متشكِّك في مدى وثاقة هذه المعلومة، قررت أن أتوثَّق منها بنفسي. سألت «جي بي تي» وأكَّد لي المعلومة بكل ثقة، وقال إن المعلومة مذكورة في مصادر كثيرة. ثم سألت كلاود وأعاد تدوير الإجابة نفسها بسياق مختلف. ثم لجأت إلى بيربلكستي الذي يُفترض أن يكون أفضل وأكثر دقة في البحث، فأعطاني نفس الإجابة. كلهم أجمعوا على أن هذا الرقم مذكور في مقالاتٍ كثيرة على الإنترنت، لذا طلبت من كل واحدٍ منهم أن يأتيني بالمصدر. أعطوني روابط لمقالاتٍ مختلفة تذكر هذا الرقم فعلًا، لكن المقالات لا تذكر مصدر الرقم ولا مدى وثاقته ولا سياقه ولا من أين أتى!

هنا قررت الرجوع خطوة إلى الوراء والعودة إلى الطريقة العلمية في التوثق من أي معلومة. تقصَّيت أكثر في البحث إلى أن وصلت إلى اسم العالمة التي يُنسَب إليها هذا الرقم: قلوريا مارك، واسم الورقة العلمية المزعومة: «كلفة العمل المتقطع: سرعة أكبر وضغط أكثر» (The Cost of Interrupted Work: More Speed and Stress). قرأتها كلمةً كلمة، قلَّبت جداولها وإحصائياتها. وهنا الصدمة! لا وجود لهذا الرقم أصلًا في هذه الدراسة.

أصابتني حالة من الذهول! كيف لآلاف المقالات، بل ولخوارزميات الذكاء الاصطناعي الأكثر تطورًا، أن تبني حقيقتها على وهم؟

هنا قررت أن أتبع مقاربة مختلفة قليلًا.

رفعت الدراسة في ملف «بي دي إف» على جيمناي، وسألته هذا السؤال: هل تذكر هذه الدراسة الرقم ثلاثًا وعشرين دقيقة وخمس عشرة ثانية؟ وأجابني بـ«لا». وقال إن الدراسة تذكر حقيقة مغايرة تمامًا: الموظفون يكملون مهامهم في وقت «أسرع» (بنحو عشرين دقيقة) عند مقاطعتهم، لكن ذلك يأتي بكلفة نفسية باهظة من التوتر والجهد لتعويض الوقت الضائع. ثم سألني بعدها: هل تود أن أبحث في دراسات أخرى لنفس الباحثة قد تكون ذكرت فيها هذا الرقم؟ وأجبته بـ«نعم».

أتاني بهذه الدراسة: «لا تترك مهمة خلفك؟ دراسة طبيعة العمل المتشتت» (No Task Left Behind? Examining the Nature of Fragmented Work). قرأتُ البحث كاملًا مرة أخرى، ثم وجدتها! وجدت ضالَّتي أخيرًا. تذكر الدراسة هذا النص: «عندما يعود الأشخاص للعمل على المهمة في اليوم نفسه، فإنهم يستغرقون في المتوسط خمسًا وعشرين دقيقة وستًّا وعشرين ثانية للعودة إليها». هذه هي إذن؛ الإجابة التي قضيت ساعات طويلة لأجدها!

ونادى الصوت في رأسي في لحظة استيعاب متأخرة: لا، ليس هذا الرقم الذي أبحث عنه. هنا تجلَّت الحقيقة المُرَّة؛ لم يكن الخلل في ذِكر المعلومة فحسب، بل في تفسيرها وتداولها. الرقم موجود بفارق دقيقتين، لكنه لا يصف «وقت استعادة التركيز الذهني»، بل يصف «الوقت الفيزيائي» الذي يستغرقه الموظف ليعود بجسده ويفتح الملف الذي كان يعمل عليه بعد سلسلة من النشاطات الأخرى.

لذا قررت أخيرًا ألَّا أستخدم هذا الرقم ولا أي دراسة مذكورة هنا في مقالتي، لأنها لا تجيب عن السؤال الأصلي الذي كنت أبحث عن إجابته.

هذه التجربة تفتح علينا ثلاث زوايا حرجة في تعاملنا مع المعرفة في وقتنا الراهن:

  1. مشكلة «تدوير البيانات» لا «الهلوسة»

إن الذي حصل هنا لم يكن «هلوسة ذكاء اصطناعي» (AI Hallucination) بالمعنى التقني، وإنما وقوعًا في فخ «ديمقراطية الخطأ». بمعنى أن النماذج اللغوية الكبيرة (LLMs) تعتمد على «التنبؤ التسلسلي» بناءً على البيانات الشائعة. أي إنها تتوقع الكلمة المناسبة القادمة، لا أن لديها تسلسلًا وترابطًا معرفيًّا ومنطقيًّا للمعلومات. وعندما تُكرِّر آلاف المقالات البشرية خطأً علميًّا، يتحول هذا الخطأ إلى «حقيقة إحصائية» لدى الآلة، فتصبح مجرد مرآة وفيَّة لركام الإنترنت بجهله الجماعي.

  1. «تدهور المصدر» (Source Decay)

إننا نعيش في زمن تنتشر فيه النتائج العلمية بعيدًا عن سياقها الأصلي. دراسة قلوريا مارك كانت تلاحظ سلوكًا بشريًّا (Observation)، ولم تقِس موجات الدماغ أو التركيز الكيميائي. لكن في رحلة انتقال المعلومة من الورقة العلمية إلى المقال الصحفي ثم إلى قاعدة بيانات الذكاء الاصطناعي، يضيع السياق ويبقى الرقم خاليًا من معناه، ومضلِّلًا في دلالته.

  1. غَلَبة المتوسط الحسابي

يميل الذكاء الاصطناعي إلى تقديم الإجابة التي تمثل نقطة الاتزان في بياناته. وبما أن الإنترنت يضجُّ بالمعلومات المبسطة، فإن النموذج يختار «الإجماع الرقمي» حتى لو نافى الحقيقة الدقيقة. إن الآلة تبرع في «محاكاة المنطق» لضمان تدفق النص، وهذا يحوِّل المغالطة إلى «حقيقة لسانية» تغري الباحث بالثقة العمياء.

أنا هنا لا ألوم الآلة على برودها، في النهاية هي نتاج ما نضخُّه فيها من بيانات. بل يقع اللوم على كسلنا المعرفي الذي يجعلنا نسلِّم مفاتيح عقولنا إلى خوارزمياتٍ تردد أصداء أخطائنا.

انتهت رحلتي بيقين جديد: يبرع الذكاء الاصطناعي في «محاكاة المعرفة» لا في «صناعتها»، يجمع فتات الإنترنت ليصنع لنا خبزًا قد يبدو شهيًّا، لكنه مسموم بالمعلومات المغلوطة. في هذا العصر الرقمي المتسارع، تبدو العودة إلى المصدر الأصلي ليست مجرد ممارسة أكاديمية، بل أداة المقاومة المعرفية الأخيرة والوحيدة المتبقية لنا -نحن البشر- أمام طغيان الآلة.



عندك فكرة وتبيها تُسمع؟ 🎧

«معمل الصوت» في «المشتل» بالتعاون مع بروفة، مساحة مجهزة للتسجيل والإنتاج، مع فريق مختص يساعدك على أن تبني هويتك الصوتية من الفكرة إلى النشر 🎙️.


نشرة أها!
نشرة أها!
يومية، من الأحد إلى الخميس منثمانيةثمانية

نشرة يومية تصاحب كوب قهوتك الصباحي. تغنيك عن التصفّح العشوائي لشبكات التواصل، وتختار لك من عوالم الإنترنت؛ لتبقيك قريبًا من المستجدات، بعيدًا عن جوالك بقية اليوم.

+90 متابع في آخر 7 أيام