تشكيل النصوص الرقمية العربية والذكاء الاصطناعي
وأنا أبحث عن مادة لمقال هذا الأسبوع أخصصها لعيد اللغة العربية الذي يصادف في 18 ديسمبر من كل عام، وقع ناظري على مقال علمي ثري في الصحافة العالمية المختصة بتغطية أهم الاختراعات الأكاديمية.
وفي متن المقال يرد أن علماء من جامعة الشارقة ابتكروا نظام ذكاء اصطناعي له المقدرة على التشكيل الآلي للنصوص الرقمية باللغة العربية وبدقة متناهية وسرعة فائقة.
وتزين التغطية الأجنبية للابتكار صور ورسوم إيضاحية تظهر كيف يعمل برنامج الذكاء الاصطناعي الذي ابتكره علماء جامعة الشارقة، حيث ما على المرء إلا استنساخ النص الرقمي في الحاسوب ولصقه في خانة من جهة اليمين وإذا به يظهر بتشكيل متكامل في جهة اليسار.
وفورا ألقيت نظرة سريعة على النص مع التشكيل الذي ولّده الذكاء الاصطناعي محاولا إيجاد ثغرة فيه، مستخدما ما أملكه من ناصية متواضعة للغة الضاد وقواعدها وصرفها، بيد أنني لم أفلح في العثور حتى على خطأ واحد.
ومع ذلك ساورتني الشكوك، لأن التشكيل الصحيح بالعربية ليس أمرا يسيرا أبدا ولا يتقنه إلا المتضلعون بنحو وصرف هذه اللغة. والأنكى، فإن غياب التشكيل مشكلة عويصة ليس للذين يدرسون العربية من غير الناطقين بها من أمثالي بل حتى لدى الناطقين بها من الذين تعد لهم اللغة الأم ودرسوها بإسهاب في المدارس والجامعات.
ولكن سرعان ما تبددت ريبتي حيث تستند التغطية الإعلامية الغربية لهذا الابتكار على بحث علمي نشره العلماء العرب الأجلاء من جامعة الشارقة في واحدة من أمهات المجلات العلمية، التي تعنى في النشر العلمي الخاص بالنظم والتطبيقات الحاسوبية وهي مجلة Expert Systems with Applications .
والتشكيل ما هو إلا علامات صوتية مميزة يطلق عليها النحويون العرب "الحركات". والحروف التي تتألف منها الأبجدية في العربية حروف ساكنة في الظاهر ولكنها حروف تتلاعب بها الحركات من الضم والكسر والفتح والسكون والتنوين والشدّ بأنواعه.
هذه الحركات كل له موضعه الخاص به، منه من يوضع في أعلى الحرف أو في أسفله أو أحيانا بين الأحرف. من النادر أن يكون هناك حرفين ساكنين متعاقبين في اللغة العربية؛ حتى السكون ذاته علامة من علامات الحركات له أصوله وقواعده قد لا يتسع المجال هنا لشرحها.
فمثلا في الإنجليزية تشكل ظاهرة عناقيد الأحرف الساكنة، اثنان أو ثلاثة أو حتى أربعة في المفردة الواحدة، ظاهرة عادية، واللفظ في الإنجليزية يستند في مجمله إلى حركة الحروف الصائتة أو حروف العلة.
العربية لغة الحركات التي تربط الأحرف وتنساب بسلاسة ويتحكم في حركة آخر حرف في المفردة موقعها في الجملة، أو صرفها إن كانت مؤنثا أو مذكرا أو مفردا أم جمعا، ومن ثم الجمع أصناف لا حيز هنا للولوج فيه.
أتيت بهذه المعلومات المبسطة للتدليل على أن "التشكيل" باللغة العربية ليس أمرا يسيرا وإن ابتكار نظام يضيف الحركات آليا إلى أي نص رقمي وبإتقان كبير وسرعة مذهلة، فإن هذا لعمري اختراع تُرفع القبعة له.
وقرأت البحث بتمعن وترك في انطباعا طيبا حيث أتى نشره في الصحافة العالمية ربما صدفة والعرب يحتفون بعيد لغتهم. وخرجت بمحصلة أننا أمام اختراع مذهل لما كان في الإمكان الوصول إليه لولا تبحر الباحثين في علوم الرقمنة والذكاء الاصطناعي، حيث يصفون ابتكارهم بأنه أحدث ما توصلت إليه التكنولوجيا الحديثة في هذا المضمار.
أن يكون لدينا نظاما آليا ذكيا لتشكيل النصوص الرقمية بهذه الدرجة من الدقة والسرعة أراه خبرا سارا. التشكيل ليس مجرد إضافة الحركات. تحريك الأحرف بالعربية له دور حيوي لا يؤثر في اللفظ والنطق الصحيح وحسب بل في ظلال المعاني عدا وظائفه النحوية والصرفية.
وأطلق الباحثون اسم "سكون" على ابتكارهم تيمنا بحركة السكون الساحرة بالعربية وهم على أحر من الجمر في انتظار تبني مشروعهم من قبل شركة تطبيقات كي يصبح متاحا.
وحال إتاحة الابتكار صناعيا من خلال تطبيق خاص أو موقع إلكتروني متداول ومتوافر، فإنني أرى أن المشروع سيكون له أثر طيب وعميق في انتشار وتعزيز مكانة لسان الضاد وفي تعليم وتدريس العربية وأداة مساعدة لنطقها وفهمها بصورة سليمة، كما أنه سيساعد كثيرا في تحسين الترجمة من العربية وإليها ويسهم في اكتساب المهارات اللغوية من قبل المعاقين، وأخيرا سيكون مادة بحثية متاحة للعلماء لإجراء الأبحاث اللغوية الخاصة بالعربية والدراسات المقارنة.