كيف تنحاز الإحصاءات؟
لا تمر علينا أخبار ومعلومات هذه الأيام إلا وتكون مصحوبة ببعض الإحصاءات من أجل تدعيم الخبر أو الفكرة التي طرحت. بعكس قراءة الكلام والخوض في التفاصيل فإن...
لا تمر علينا أخبار ومعلومات هذه الأيام إلا وتكون مصحوبة ببعض الإحصاءات من أجل تدعيم الخبر أو الفكرة التي طرحت. بعكس قراءة الكلام والخوض في التفاصيل فإن ذكر الإحصائية يعطي للخبر نوعًا من المصداقية السريعة لدى الناس، ووجود عنوان براق مثل “إحصائية: 98% من الناس يمتلكون هواتف أندرويد”، هو كفيل بزرع فكرة أن هواتف الأندرويد هي الأكثر شعبية على وجه البسيطة.
المشكلة هي أن الإحصائيات رغم صحة نتائجها قد تعطي صورة لا تمت بصلة إلى الواقع، وأقرب مثال لذلك هو نتائج الانتخابات الأميركيّة الأخيرة. بالرغم من أن جميع القنوات والصحف كانت تشير إلى فوز كلينتون إلا أن ترمب هو من فاز، فكيف حدث هذا مع أن جميع الإحصائيات كانت تشير إلى العكس؟
مثل هذه الأخطاء قد تحدث بسبب الطريقة التي استخدمت للحصول على النتائج قد ينتج عنها تحيز لجانب دون الآخر. وفي بعض الأحيان تسعى بعض الجهات والقنوات الإخبارية التي تبتغي إحداث نوع من البلبلة أو تغيير الرأي العام عبر التلاعب بالاحصائيات.
الانحياز التأكيدي والعينة المريحة
توجد العديد من الطرق التي تستخدم من أجل الحصول على إحصائيات تدعم نظريتنا. فعلى سبيل المثال هناك ما يسمى بالانحياز التأكيدي، وفي هذا النوع من النتائج يصل الباحث إلى نتيجة الإحصائية بناء على شريحة محددة لا تمثل غالبية الفئة المستهدفة. فلو افترضنا أن النساء يصرفن جُل أموالهن في الثياب وأردنا إثبات ذلك، سوف نذهب لسؤال النساء اللاتي يذهبن إلى محلات الثياب الغالية عن مقدار المال الذي ينفقنه في الشراء، سوف نحصل في النهاية على نتيجة لا تمثل عامة النساء ولكن مع ذلك تظل هذه النتيجة صحيحة.
قد تأتي النتائج أيضًا مما يسمى بالعينة المريحة، التي تقتصر الإحصائية فيها على الفئة التي يسهل الوصول إليها، على سبيل المثال أننا سألنا زوار الموقع عن علامة الهاتف الذكي الذي يستخدمونه ووجدنا أن الغالبية منهم يملكون iPhone وبناءً على هذه النتيجة قلنا أن غالبية الناس تمتلك iPhone، في هذه الحالة نحنا اقتصرنا على سؤال فئة يسهل علينا الوصول متجاهلين شريحة كبيرة لا تتصفح الموقع وبالتالي هي لاتعكس واقع جميع الناس.
تستخدم الكثير من طرق جمع العينات المعيوبة والتي تستخدم من أجل الوصول إلى نتائج معينة. الطرق المذكورة أعلاه تعبر من أشهرها.
المتوسط لا يعني شيئًا
حين تتحدث الإحصائيات عن المتوسط وغيرها من الأمور دون الخوض في التفاصيل فقد يكون من الأفضل التعامل مع هذه البيانات بنوع من الحذر.
يمكن أن تكون نتائج الإحصاءات مختلفة كليا، لكن حين تقوم بقياس متوسط القيم والفروقات بين نتائجها ستظن أنها متطابقة، وهو أمر ممكن عملياً أثبته الإحصائي الإنجليزي فرانك ان-كومب عبر الرباعية التي تحمل اسمه.
تتكون رباعية ان-كومب من أربع مجموعات من البيانات، وحين يتم رسمها سوف ترى أنها لا تتشابه على الإطلاق، ولكن حين تقوم بحساب متوسط القيم لكل من سين وصاد، سوف تفاجئ بأنها متساوية. لذا ينصح الخبراء بأن يتم إضافة رسوم بيانية مع الإحصائيات لتوضح الأمور بشكل أكبر والمتلقي على تكوين صورة واضحة بدل الاعتماد على الكلام الذي يتحدث عن المتوسطات والذي قد لايكشف لك الصورة الكاملة، ويستخدم لتضليلك.
استخدام المتوسط هو شيء شائع، فكم من مرة سمعنا عن متوسط الدخل للفرد في دولة معينة؟ لكن هل نعرف كيف تم الوصول إلى هذا الرقم؟ لأن مثل هذه الإحصائيات قد تشتمل متوسطي الدخل والأثرياء أصحاب الدخول العالية. هؤلاء سوف يفسدون العينة بشكل كبير ويساعدون في رفع المتوسط، فلو افترضنا أن لدينا 3 أشخاص رواتبهم كالتالي (300 – 370 – 3500) متوسط دخل هذه العينة هو 1390 وهو أبعد مايكون عن الواقع ويمثل 1/3 من الناس فقط.
دقق في التفاصيل
قد يصعب علينا في الكثير من الأحيان معرفة مدى دقة بعض الإحصائيات لأن من قام بها لن يفصح عن جميع التفاصيل. حين نتحدث نتائج الاستفتاءات عن ميول رياضية مثلاً علينا أن نعرف أين تمت الإحصائية وفي أي حي وما هي أعمار الأشخاص وحتى مستويات الدخل، لأن كل هذه الأمور تساعد على تكوين صورة أوضح. فلو أخبرتك أن أغلب الناس هم من مشجعي برشلونة ومن ثم اكتشفت أنني قمت بالإحصائية في مدينة برشلونة فسوف تعرف أنني أريد التلاعب بك.
يجب أن تكون الاحصائيات قابلة للتمحيص والتثبت من معلوماتها، خصوصًا تلك التي تساعد في بناء سياسات الدول وتكوين الرأي العام، وحين لا نقدر على القيام بذلك فإن هذا يجعلها أقرب للأرقام الوهمية والآراء فقط.