كيف تتجنب التضليل في المعلومات الإحصائية؟

كيف تتجنب التضليل في المعلومات الإحصائية؟

[email protected]

تحدثنا في المقال السابق عن المعلومات الإحصائية المتداولة في وسائل الإعلام المختلفة، وما يعتري المتلقي من شكوك حولها بسبب الإحساس بعدم تمثيلها للواقع، وفي هذا المقال سنتحدث عن الأسباب التي تؤدي إلى النتائج الإحصائية المضللة.
يأتي سوء اختيار عينة الدراسة على رأس هذه الأسباب، فالباحث، (خاصة في الدراسات الاجتماعية)، ونظراً لصعوبة دراسة المجتمع بشكل كامل، يعتمد في الغالب على عينة فقط من المجتمع بغرض دراسة ظاهرة ما. وهذا في الحقيقة هو مكمن الخلل في معظم الدراسات الإحصائية غير الدقيقة، وذلك حين لا تكون العينة ممثلة لمجتمع الدراسة، وبالتالي فإن تعميم النتائج على المجتمع فيه تضليل.
لنعد إلى إحصائية التدخين بين فتيات مدينة جدة، فلو كان حجم العينة التي أخذناها صغيراً (30 طالبة مثلاً)، وكانت 10 منهن بالصدفة من المدخنات، فإن الباحث سيستنتج أن 33 في المائة من الفتيات في مجتمع التعليم في جدة مدخنات، وبالتالي فإن النتائج قد لا تكون انعكاساً للمجتمع الفعلي، لذا كلما زاد حجم العينة قلّ تأثير الصدفة وتم تمثيل المجتمع بشكل أدق.
وسبب آخر لظهور النتائج المضللة هو الانحياز لفئة ما عند اختيار العينة، فما هي النتائج المتوقعة للمدخنات في المدارس إذا قام الباحث بالتركيز على مدارس معينة أو أحياء معينة يقل فيها الوعي بأضرار التدخين؟ ولك أن تتصور الإحصائيات حول انتشار مرض فقر الدم المنجلي في المملكة حين تكون عينة الدراسة من المنطقة الشرقية فقط، حيث ينتشرالمرض، في حين يتم عرض النتائج على أنها تمثل المجتمع السعودي بأكمله. كما أن طريقة بناء الأسئلة قد تلعب دوراً في توجيه الشخص نحو إجابة ما قد يرغب الباحث في سماعها.
وقد يحدث التضليل حينما نستخدم الترتيب، فمصداقية عبارة "البنك الفلاني يحرز المركز الأول في خدمة العملاء" تظل محل تساؤل ما دمنا لا نعرف كيف تمّ اختيار العينة، وكم نسبة عملاء هذا البنك مقارنة بعملاء البنوك بشكل عام، فقد تكون حصة هذا البنك واحد في المائة من إجمالي عملاء البنوك، ولذلك استطاع توفير خدمة جيدة لهم.
قد تشاهد إحصائية تقول إن 50 في المائة من الحوادث المرورية حدثت بسبب استخدام الهاتف الجوال أثناء القيادة. إن ذلك غير كافٍ لبناء العلاقة بين استخدام الهاتف والحوادث، إذ لا بد أن نطّلع على معدل الكيلومترات التي قطعها السائقون الآخرون والذين يستخدمون الهاتف أثناء القيادة ولم يرتكبوا حوادث إلى الكيلومترات التي قطعها مرتكبو الحوادث، حتى نستطيع بناء استنتاج حول علاقة الجوال بوقوع الحوادث. فقد تكون معدلات القيادة وبمسافات طويلة أثناء استخدام الجوال لم تثبت هذه العلاقة.
من الأخطاء الإحصائية الشائعة أيضاً الاعتقاد بأن وجود العلاقة يعني السببية، ففي إحدى الصحف كانت العبارة التالية "الكهرباء: أبراج الضغط العالي لا تسبب السرطان"، وكان الأصح هو قولهم: إن الدراسات لم تُثبت أن أبراج الضغط العالي تسبب السرطان. فحتى الآن لا يوجد ما يثبت أو ينفي بيولوجياً أنّ خطوط الضغط العالي تسبب سرطان الدم. فالعلاقة لا تعني السببية إطلاقاً، فالسببية تتطلب أبحاثاً وطرقاً أخرى. فمثلاً وحتى نقول إنها السبب، فإن علينا أن نفهم كيف تؤدي الحقول المغناطيسية إلى إحداث تغير في مكونات الـحامض النووي DNA، وبالتالي التكاثر غير المنضبط أو السرطان.
وختاماً فإن وسائل التضليل كثيرة ولا يتسع المجال لذكرها في هذا المقال، وفي اعتقادي أنه ما لم تُتَح لنا هذه البيانات، وتوضح لنا الطرق التي عُملت بها هذه الإحصائيات، فإن علينا أن ندرك أنها قد لا تمثل الواقع، وأن نتوقع أن الإحصائيات مختارة بعناية لتعكس وجهة نظر معديها، خصوصاً عندما تكون الإحصائيات صادرة من جهة أو مجموعة لها أجندة مسبقة، سواءً سياسية أو اقتصادية أو اجتماعية.

* دكتوراه في المعلوماتية الحيوية وحوسبة الأحياء

الأكثر قراءة