الرأي

التحليل الآلي لمحتوى الانترنت ومواقع التواصل الاجتماعي

جبريل العريشي
مع الانتشار الهائل للانترنت ولمواقع التواصل الاجتماعي، أصبح هناك ملايين الصفحات - في الفضاء السيبراني - التي تتضمن حجما ضخما من المعلومات في المجالات كافة.

ولقد اهتمت رؤية المملكة 2030 في أكثر من موضع بدعم المرونة ورفع الفاعلية والكفاءة من خلال تسريع عملية اتخاذ القرار. ومن ثم فقد أصبح من الضروري أن تقوم كل مؤسسة - كل في مجاله - ببذل جهود لرصد وفرز المعلومات ما يختص بعملها من هذه المعلومات السيبرانية، ثم تصنيفها وتلخيصها وعرض محتوياتها في تقارير معلوماتية ملائمة على مستويات الإدارة العليا، بحيث تظهر متكاملة وملخصة ونظيفة (أي لا تتضمن تكرارات أو تشابهات أو إعلانات أو مواد تسويقية).

ويوجد الآن في الأسواق عشرات البرامج والتطبيقات المتخصصة - التي تعتمد على تقنيات الذكاء الاصطناعي - تقوم بجمع البيانات من الانترنت ووسائل التواصل الاجتماعي وتحليلها، واستخراج المؤشرات منها بشكل فوري وآلي عبر محركات تحليل النصوص text analytic engines.

وفي الوقت نفسه، تطور العديد من المؤسسات في العالم نظما متكاملة تجمع بين بعض هذه البرامج التجارية وبين التطبيقات الخاصة التي يتم تطويرها لخدمة جهودها في مجالات البحوث التسويقية أو العلمية، أو في المجالات الأمنية. وهو ما ينطوي على جهد بحثي مستدام.

ويجري تطوير هذه النظم المتكاملة بحيث تعمل بصورة آلية، فترصد الصفحات محل الاهتمام حسب الكلمات الدلالية الموجودة فيها، ثم تصنيفها بناء على شجرة موضوعات تتضمن خيارات للتصنيف، بحسب أسماء الأشخاص أو الدول أو الموضوعات أو غير ذلك. كما تحلل أنماط البيانات طبقا لعديد من المتغيرات مثل أعمار الأشخاص وجنسياتهم، أو جغرافيا الأماكن، أو التوجهات الأيديولوجية، ويتم كل ذلك في الزمن الحقيقي على مدار الساعة، حيث إن وقت الحصول على نتائج التحليل يعتبر من الأمور الضرورية لمتخذي القرار.

وتتيح تلك النظم إنتاج الملخصات التلقائية لمحتوى الصفحات، ووضعها في تقارير - الكترونية أو مطبوعة - على شكل فقرات أو جمل من المحتوى الأصلي، تتضمن الكلمات المفتاحية محل الاهتمام. كما تتيح بناء أرشيف يتضمن ما تم جمعه من معلومات، بحيث يمكن البحث فيه لاحقا بالكلمات المفتاحية والدلالية محل الاهتمام.

وتتضمن هذه النظم المتكاملة واجهة للإدارة تسمح بالتحكم في العمليات والخدمات التي تقدمها بواسطة من له الصلاحيات اللازمة لذلك. فيمكن من خلالها - على سبيل المثال - تحديد الأسماء أو الموضوعات محل الاهتمام، أو تحديد الكلمات الدلالية، أو تحديد نسبة التلخيص (10%- 20%- ..)، أو تحديد دورية التنقيب عن البيانات، أو دورية إصدار التقارير.

ولكن على الرغم من التقدم الذي تم إحرازه في هذا الشأن، إلا أن تعدد اللهجات وشيوع استخدام مفردات الفرانكو آراب واللغة العامية والإشارات غير اللفظية والصور، هي صعوبات مستمرة تواجه عمليات التحليل الدلالي للمحتوى العربي، وتحتاج إلى جهود بحثية مستدامة للتغلب عليها.

jarishee@yahoo.com