مقالات في اللسانيات الحاسوبية

المحللات والمولدات الصرفية الآلية

د. عبدالعزيز بن عبدالله المهيوبي

أولاً: المحللات الصرفية:

وقع اختيارنا على مجموعة من المحللات الصرفية الحاسوبية، عُرِضَ بعضها في اجتماع خبراء المحللات الصرفية الحاسوبية للغة العربية، والذي أقيم في دمشق بالتعاون بين مجمع اللغة العربية، والمنظمة العربية للتربية والثقافة والعلوم (الإلكسو)، ومدينة الملك عبد العزيز للعلوم والتقنية (2009م)[1].

1- المحلل الصرفي للغة العربية لمخبر “ميراكل” أ.د عبد المجيد بن حمادو ولمياء هدريش بلغيث ونهى شعبان، صفاقس، الجمهورية التونسية.

يقوم نظام التحليل الصرفي لمخبر “ميراكل” بالوظائف التالية:

– التعرّف على السوابق واللواحق.

– التحليل الزوائدي للكلمة بعد فصل السوابق واللواحق.

– استخراج الخصائص النحوية الصرفية الممكنة للكلمة.

2- محلل صرفي عربي موجَّه بالتطبيقات، رياض سنبل ود. ندى غنيم ود. محمد سعيد دسوقي، المعهد العالي للعلوم التطبيقية والتكنولوجيا[2]، دمشق، سوريا.

تمَّ إنجاز نظام تحليل صرفي يتمتع بمرونة كبيرة تسمح باستخدامه في مجالات متنوعة المتطلبات. وتكمن قوة النظام في عدم اعتماده على التخزين في الوصول للحلول، وإنَّما اعتمد على خوارزمية كشف الأحرف الأصلية للنظام أساساً.

3- محلل صرفي للغة العربية باستخدام تقانات الذكاء الاصطناعي، د.فاضل سكر ود.سمير معطي، سوريا.

اسْتُخْدِمَت لغة البرمجة Visual Prolog[3] في بناء نظام المحلل الصرفي؛ حيث تختلف عن اللغات التقليدية الأخرى بأنها الأكثر قرباً من لغة الإنسان.

يقوم المحلل الصرفي بتحليل الكلمات صرفياً بعد تمثيل القواعد الصرفية لهذه الأوزان على شكل جمل منطقية، ويعتمد المحلل على تجريد الكلمات من السوابق واللواحق، وتحديد أوزانها المُقابلة عن طريق استدعاء الهيكل البنيوي الملائم لكل كلمة من بُنى المعطيات.

4- محلل صرفي للكلمات العربية، عزّ الدين مزروعي وآخرون، جامعة محمد الأول، كلّية العلوم، شعبة الرياضيات والإعلاميات، مختبر الأبحاث في الإعلاميات،فريق المعالجة الآلية للغات الطبيعية.

يقوم هذا النظام بتحليل الكلمة العربية بالاعتماد على سياقها في الجملة. ويعمل على معالجة الجملة العربية من خلال مستويين؛ يُعنى المستوى الأول من المعالجة بتحليل كل كلمة من الجملة على حدة، بغض النظر عن الكلمات المجاورة لها. وفي هذا المستوى يقوم البرنامج بتقطيع الكلمة إلى لبناتها الصرفية الأساسية من سابق وجذع ولاحق، بغية تحديد مجموعة من المعلومات الصرفية المحتملة للكلمة. أمّا المستوى الثاني من التحليل فيُعنى باختيار الحل الأنسب لكل كلمة بالنظر إلى سياقها في الجملة.

5- محلل صرفي مصدري عربي للتطبيقات العامة، مبادرة الملك عبدالله للمحتوى العربي[4]، مدينة الملك عبد العزيز للعلوم والتقنية.

    يهدف المشروع إلى بناء محلل مصدري وليس صرفياً؛ يصل لمصدر الكلمة وليس لجذرها، ويحدد لواصقها، ويعتمد التشابه في الشكل الخارجي للمفردات المولدة على الميزان الصرفي نفسه، وباللواصق نفسها. ويتَّصف هذا المحلل بالسرعة؛ حيث لا يحتاج لجداول كثيرة وكبيرة. ويمكن استخدامه خطوةً أولى لتفكيك المفردة العربية قبل تحليلها صرفيا.

6- برنامج (مداد) للتحليل الصرفي للكلمات العربية، محمود محمد صابر وعبد المنعم فريد عبد المنعم، شركة مداد لتقنية المعلومات.

يهدف هذا المشروع إلى تصميم محلل صرفي للغة العربية ليكون قادراً على تفكيك النصوص العربية إلى كلمات، وتحليلها، وذلك بهدف التعرف على الكلمة المدخلة إليه وتحديد نوعها، ثم تحديد الزوائد من سوابق ولواحق وحروف مزيدة، ثمّ الوصول إلى الجذر، مع عرض كافة التشكيلات الممكنة للكلمة. وليكون المحلل قادراً على التنافس أمام العديد من المحللات الأخرى، أخَذَ مصمموه في الاعتبار مجموع من الأسس. هي: الدقة، والسرعة، وصغر الحجم.

7- توظيف قواعد النحو والصرف في بناء محلل صرفي للغة العربية، مجدي صوالحة وإيرك أتول، جامعة ليدز، المملكة المتحدة.

طُوِّرَ المحلل الصرفي بالاعتماد على قوائم معدَّة  مسبقاً للزوائد والسوابق واللواحق والجذور والأوزان، استُخْرِجَتْ من كتب قواعد اللغة العربية، وكتب النحو والصرف، وقد تمَّ التحقق من هذه القوائم عن طريق فحصها ومقارنتها بكلمات الذخائر اللغوية العربية، مثل القرآن الكريم، ونصوص بعض المعاجم العربية. واحتوت قائمة السوابق على 215 سابقة، وقائمة اللواحق على 127 لاحقة. كما احتوت قائمة الأوزان على 2730 وزناً للأفعال، و390 وزناً للأسماء.

8- محلل الخليل الصرفي[5].

يُعدّ محلل الخليل الصرفي من أفضل المحللات الصرفية وأكثرها دقة ؛ فهو ثمرة تعاون بين المنظمة العربية للتربية والثقافة والعلوم، ومدينة الملك عبد العزيز للتقنية في المملكة العربية السعودية و جامعة محمد الأول بالمغرب ضمن إطار مبادرة الملك عبدالله للمحتوى العربي، ولعل أهم ما يميز البرنامج :

– برنامج مفتوح المصدر Open Source Program.

– برنامج مطور بلغة البرمجة جافا Java.

– إمكان استعماله في بيئة Windows  و Linux و Mac Os  وSolaris .

-كفاءة واجهات المحلِّل التفاعلية مع المستعمِل.

– استقلالية قواعد المعطيات عن البرنامج.

– إمكان تحديث قواعد المعطيات (إضافة، وحذف، وتعديل)

– يسمح البرنامج بمعالجة نصوص تتكون من آلاف الكلمات.

9- المحلل الصرفي مفتوح المصدر[6].

يعمل على إزالة أطول سابقة ولاحقة للكلمة، ثم يقوم بمقارنة ما تبقى من الكلمة بقائمة من أوزان الأسماء والأفعال لاستخراج جذر الكلمة. ويحتوي على قوائم علامات التشكيل، وعلامات الترقيم، والجذور الثلاثية والرباعية، وأدوات التعريف.[7]

[1] اجتماع خبراء المحلّلات الحاسوبية الصرفيّة للغة العربية، دمشق: 26-28 أبريل 2009 م، http://www.alecso.org.tn

[2] أنشئ المعهد في عام 1983م بهدف إعداد كوادر مؤهلة تأهيلاً عالياً من المهندسين والباحثين. وتُعد المعالجة الآلية للغة العربية من أهم محاور العمل في المعهد. ويضم المعهد مجموعة كبيرة من الباحثين المختصين باللغة العربية، وتقانة المعلومات. وقد أنجز المعهد مجموعة كبيرة من المشاريع في مجال المعالجة الآلية للنصوص العربية، والمعالجة الصوتية، وتركيب الكلام العربي.

[3] تطورت لغة برولوج في أواخر عقد السبعينيات في جامعة مارسيلي في فرنسا. وقد استخدمت في بداية تطورها لمعالجة اللغات الحيّة، لكنها سرعان ما أحرزت نجاحاً مرموقاً في تطبيقات مختلفة. وشاعت شهرة اللغة في أوائل الثمانينيات عندما اعتمدت اليابان لغة برولوج لغةً أساسية لحاسبات الجيل الخامس. (الحاسوب واللغة العربية: عبده العجيلي:ص24)

[4] تهدف مبادرة الملك عبدالله للمحتوى العربي إلى تسخير المحتوى الرقمي لدعم التنمية والتحول إلى مجتمع معرفي، مع ضمان حصول جميع شرائح المجتمع على المعلومات والفرص الإلكترونية. والحفاظ على الهوية العربية والإسلامية للمجتمع، وتعزيز المخزون الثقافي والحضاري الرقمي. كما تهدف إلى إنتاج محتوى إلكتروني عربي ثري لخدمة المجتمعات العربية والإسلامية.

[5] يُنظر: http://www.alecso.org.tn/index.php?option=com_content&task=view&id=1302&Itemid=956&lang=ar

[6] يُنظر: http://arabicmorphoanalyzer.appspot.com/main/#!

[7] المحلل الصرفي مفتوح المصدر من تطوير مجتمع لينكس العربي : http://www.linuxac.org

0 Reviews

Write a Review

مقالات ذات صلة

زر الذهاب إلى الأعلى