قد يضيف مشرفو نموذج الذكاء الاصطناعي بعض التحيزات الاجتماعية الخاصة بهم إلى النموذج الذي يعملون على تدريبه.

تُعد نماذج الذكاء الاصطناعي مرآة تعكس البيانات التي غُذيت بها، ولكن هناك جندي مجهول في هذه العملية يلعب دوراً محورياً في تشكيل “شخصية” النموذج وقيمه: إنه المشرف البشري.

بينما قد نتخيل أن الذكاء الاصطناعي يعمل بمعادلات رياضية بحتة، إلا أن الحقيقة هي أن التدخل البشري في مراحل الضبط الدقيق (Fine-tuning) يفتح باباً واسعاً لتسلل التحيزات الشخصية والاجتماعية إلى صلب الخوارزميات.

كيف يضع المشرف بصمته على النموذج؟
تتم عملية تدريب النماذج الحديثة غالباً عبر تقنية تُسمى “التعلم التعزيزي من التغذية الراجعة البشرية” (RLHF). في هذه المرحلة، يقوم المشرفون بمراجعة إجابات النموذج وتصنيفها بناءً على جودتها، وهنا تبدأ التحديات:

1. تأثير الخلفية الثقافية والجغرافية
يعتمد تقييم المشرف لما هو “صحيح” أو “لائق” بشكل كبير على بيئته. فالمشرف الذي يعيش في ثقافة ليبرالية قد يصنف إجابة معينة على أنها منفتحة وإيجابية، بينما قد يراها مشرف من ثقافة محافظه كإجابة غير ملائمة. هذا التباين يجعل النموذج يتبنى وجهة نظر العالم التي يراها المشرفون فقط، متجاهلاً التنوع الثقافي العالمي.

2. التحيزات الضمنية (Implicit Biases)
يمتلك كل إنسان تحيزات غير واعية تتعلق بالعرق، أو الجنس، أو الدين، أو الطبقة الاجتماعية. عندما يُطلب من المشرف اختيار الإجابة “الأكثر أدباً” أو “الأكثر ثقة”، فإنه قد يميل دون قصد إلى تفضيل الأنماط اللغوية التي تشبهه أو التي تتوافق مع الصور النمطية المترسخة في ذهنه.

3. ضغوط “الأمان” وتجنب الجدل
في محاولة المشرفين لجعل النموذج آمناً، قد يفرطون في فرض قيود تعكس وجهات نظرهم السياسية أو الاجتماعية الخاصة حول ما يعتبر “مثيراً للجدل”. هذا يؤدي أحياناً إلى نموذج “متحيز للصمت” أو يرفض الإجابة عن مواضيع مشروعة لمجرد أن المشرف يجدها حساسة بناءً على قناعاته الشخصية.

مخاطر تسلل هذه التحيزات
تكمن الخطورة في أن المستخدمين غالباً ما يثقون في حيادية الآلة. عندما يتبنى النموذج تحيزاً أضافه المشرف، فإنه:

يعزز الصور النمطية: بدلاً من كسر التمييز، قد يعيد إنتاجه بلغة واثقة.
يقصي وجهات النظر البديلة: يصبح النموذج صوتاً أحادياً يمثل فئة المشرفين فقط.
يؤثر على القرارات: إذا استُخدم النموذج في مجالات مثل التوظيف أو القضاء، فإن تحيزات المشرفين قد تتحول إلى ظلم واقعي يطال فئات معينة.

الاجابة : صواب.

نحو تدريب أكثر عدلاً
للحد من هذه الظاهرة، تسعى شركات التكنولوجيا حالياً إلى تنويع فرق الإشراف البشري لتشمل أعراقاً وثقافات ولغات مختلفة، بالإضافة إلى وضع معايير صارمة وواضحة (Guidelines) تقلل من مساحة التقدير الشخصي للمشرف.

في النهاية، يظل الذكاء الاصطناعي أداة بشرية الصنع؛ وكلما زاد وعينا بأن خلف كل إجابة ذكية تكمن لمسة بشرية (بكل عيوبها)، أصبحنا أكثر قدرة على استخدام هذه التقنية بحذر ونقد بناء.