مقر شركة فيسبوك (أرشيف)
مقر شركة فيسبوك (أرشيف)
الثلاثاء 26 أكتوبر 2021 / 23:15

مراكز بحوث فرنسية: فيسبوك تفشل في دعم مضامين الاعتدال باللغة العربية

سلّطت وثائق داخلية مُسرّبة من شركة فيسبوك قامت مراكز بحوث ودراسات ووسائل إعلام فرنسية بتحليلها، عن جمود وفشل الشركة في دعم محتوى الاعتدال والترويج له باللغة العربية، وذلك بسبب افتقار موظفيها إلى إتقان اللغة الثالثة الأكثر تداولاً في الشبكة الاجتماعية الشهيرة.

وتكشف تلك الوثائق عن انتشار محتوى خطاب التشدّد والكراهية مقابل تغييب غير مقصود لمفاهيم الاعتدال والتسامح بسبب أخطاء بشرية وحاسوبية، حيث يُخفق المُراقبون وتقنيات الذكاء الاصطناعي في فهم اللهجات المحلية والسياقات الثقافية على نحوٍ كافٍ يسمح بإدراك المعنى وتمييز المقصود بدقة.

ودأبت فيسبوك على تقديم اعتذاراتها للمُستخدم العربي في مناسبات كثيرة بعد أن قامت بعمليات إزالة محتوى فاشلة باللغة العربية نتيجة قصور في فهم المعنى المُراد، لكنّ الشركة العالمية بالمُقابل لم تفعل شيئاً يُذكر لمعالجة الخلل وتدارك الأخطاء المُستقبلية، مُكتفية بالقول إنها تُجري أبحاثاً لتطوير عملها مُستقبلاً مُشيرة بشكل دائم لصعوبة لغة الضّاد.

وتساءلت الصحافة الفرنسية في هذا الصدد، عن أسباب تصنيف العديد من المنشورات خلال شهري رمضان 2019 و2020، على أنها تحمل مضامين عُنف وإرهاب على فيسبوك وإنستغرام وماسينجر، على الرغم من أنها بعيدة عن ذلك تماماً.

واكتشف موظفو فيسبوك هذه الظاهرة الإحصائية في ست دول ذات غالبية مسلمة، منها ثلاث دول عربية، حيث تمّ استحضار فرضيات دينية بكثرة في مُنتديات داخلية خاصة، وهي الكلمات التي ارتبطت تلقائيًا بخوارزميات فيسبوك للعنف أو بتعليقات إرهابية، بينما لا تعكس في الواقع إلا تطبيق نظام سيئ المعايرة يتخذ قرارات خاطئة، وفقاً لما كشفه فرانسيس هوغن، المسؤول الذي غادر شركة فيسبوك في مايو 2021، وهو ما نقله مصدر برلماني أمريكي إلى العديد من وسائل الإعلام، بما في ذلك "لو موند" و "فيغارو" الفرنسية، حيث يتجلّى بوضوح أوجه القصور في شبكات التواصل الاجتماعي من حيث تقييم الاعتدال في المحتوى باللغة العربية.

وتُعدّ البلدان الناطقة بالعربية في شمال إفريقيا والشرق الأوسط سوقاً رئيساً لفيسبوك، مع نحو 240 مليون مستخدم نشط في نهاية عام 2020 - ما يزيد عن نصف سكان المنطقة - مما يجعل اللغة العربية هي اللغة الثالثة في التداول على شبكة التواصل الاجتماعي التي ما زالت بعيدة عن ضمان أمن مُستخدميها على نحوٍ صحيح.

ولا تقتصر أخطاء الشركة العالمية على اللغة العربية، إذ لا يُمكن لمستخدم أفغاني على سبيل المثال الإبلاغ عن محتوى يحض على الكراهية على فيسبوك لإزالته؟ فالمهمة ليست سهلة، لأنّ واجهة الموقع مترجمة بشكل سيئ للغاية إلى الباشتو والداري، وهما لغتان مهمتان من بين الثلاثين لغة المنطوقة في البلاد.

وحول ذلك يُعرب أحد موظفي الشبكة الاجتماعية الشهيرة عن أسفه، بقوله "في بلد مثل أفغانستان، حيث تكون نسبة السكان الذين يفهمون اللغة الإنجليزية قليلة للغاية، فإنّ ضمان أنّ النظام لا تشوبه شائبة في الترجمة، على الأقل، يبدو ضرورة ملحة"، وهو ما يُساهم في ازدهار لغة التحريض في أفغانستان.

وتُشكّل لغة الضّاد تحدّيات خاصة لخوارزميات فيسبوك الآلية والخبراء البشريين على حدّ سواء، حيث من الصعوبة فهم اللهجات المحلية العامية التي تتعدد في الدول العربية، فضلاً عن مرجعية مفرداتها لمضامين ثقافية مختلفة.

قالت إحدى الوثائق المُسرّبة إنّ موظفي فيسبوك غالباً ما يضيعون في ترجمة 30 لهجة عربية غريبة بالنسبة لهم، حيث يُخطؤون في الإشارة إلى المنشورات العربية غير المسيئة على أنها محتوى إرهابي بنسبة حوالي 78%.

بالمقابل، وبهدف التحايل على رقابة فيسبوك على خطاب الكراهية، لجأ مُستخدمون لأسلوب ذكي غايته خداع البرامج الحاسوبية، وذلك عبر استخدام أسلوب كتابة قديم عمره قرون، تمثّل في كلمات ونصوص بدون نقاط وعلامات تمييز، وذلك لإيصال ما يُريدونه دون حذف.

وجاء في تقرير داخلي لفيسبوك، إنّه "مع الحجم الكبير لقاعدة المستخدمين العرب، فإنّ الضرورة تقتضي بالتأكيد، تخصيص المزيد من الموارد بهدف تحسين أنظمة اللغة العربية الحاسوبية"، فيما أعربت الشركة عن أسفها لعدم وجود استراتيجية واضحة بهذا الشأن.

على صعيدٍ آخر، تُكثّف شركة غوغل حالياً جهودها لتطوير لوغاريتمات بحث صحيحة باللغة العربية بهدف تحسين دقة ونوعية النتائج، ومواكبة تغيّر سلوك وأنماط البحث، مُجدّدة الدعوة لضرورة التبليغ عن المحتويات الخاطئة أو المضللة لتحسين جودة نتائج البحث بلغة الضّاد، وكانت غوغل، قد أطلقت مؤخراً دليلا خاصا عن "أساسيات الذكاء الاصطناعي" باللغة العربية بالتعاون مع معهد أكسفورد للإنترنت.

يتحدث باللغة العربية اليوم، حوالي 450 مليون شخص، وهي اللغة الرسمية لـِ 22 دولة في قارتي آسيا وأفريقيا، وتُعتبر من حيث مُعدّل الانتشار والاستخدام اللغة الخامسة عالمياً.

وتمتاز لغة الضّاد بالبلاغة وبقدرتها على التعبير بشكل أكبر وأعمق من أيّ لغة أخرى، حيث يتجاوز عدد كلماتها أكثر من 12300000، وهو 20 ضعف عدد كلمات اللغة الإنجليزية التي تتكون من حوالي 600 ألف كلمة.

ومع ذلك، تُعاني اللغة العربية من نقص التمثيل والتواجد الإلكتروني بشكل واضح، إذ يُمثّل المحتوى الرقمي باللغة العربية أقل من 2% فقط من إجمالي المحتوى على الإنترنت.