مقالات في اللسانيات الحاسوبية

المحللات الصرفية الحاسوبية للغة العربية

د. عبدالعزيز بن عبدالله المهيوبي

هو برنامج حاسوبي يقوم بتحليل بنية الكلمة من حيث تركيبها دون اعتبار موقعها، ويقوم المحلل الصرفي بتحليل الكلمة، وتفكيكها إلى مركباتها الصغيرة التي تتكون منها، مثل: الاسم والفعل والضمير والحرف، ويحدد السوابق واللواحق المرتبطة بها، ونوع هذه السوابق واللواحق، كأن تكون حروف جر، أو ضمائر وصل، أو حروف عطف، أو ما شابه، وبعد تحديد الكلمة يتم ربطها بالمعجم لمعرفة صفاتها (القبلان، 2004م، ص14).
ولتوضيح المقصود بتحليل بنية الكلمة، نُحلِّل كلمة (فباستخدامها):
1- السوابق: حرف العطف (ف) + حرف الجر (ب)
2- جذع الكلمة: المصدر (استخدام)
3- جذر الكلمة: (خ د م)
4- الصيغة الصرفية: (استفعال)
5- العلامة الإعرابية: (الكسرة).
6- اللواحق: ضمير متصل (ها)
فوائد المحلل الصرفي:
1- تُعدُّ مخرجات المحلل الصرفي مدخلات للمحلل النحوي، فلواحق الكلمة -مثلا- تبيّن للمحلِّل النحوي الإضافة والمفعولية.
2- يستطيع المحلل الصرفي فهرسة الألفاظ، وأوزانها في النصوص الكبيرة؛ حيث يقدم بذلك خدمة كبيرة لصانعي المعاجم.
3- يوفر الوقت على العاملين في الموسوعات.
4- يُستفاد من المحلل الصرفي في برامج تعليم مادة الصرف؛ فيزيد من فهم المتعلمين للمادة.
5- تعتمد محركات البحث الاشتقاقية على التحليل الصرفي الآلي، وذلك لتحديد جذور الكلمات بهدف الربط بين المشتقات الصرفية.
متطلبات بناء المحلل الصرفي الآلي:
أولاً- متطلبات لغوية:
1- تحديد جذور الكلمات العربية، لمعرفة أصول الكلمات التي تتشابه فيها البنية والضبط مع اختلاف الجذر.
2- تحديد الأعلام دون تحليلها إلى مستوى الجذر.
3- تحديد الكلمات الثابتة[i] التي لا تُشتق منها كلمات أخرى، وهي الكلمات التي تثبت كما هي دون حاجة للاشتقاق منها، مثل ( هؤلاء، ذلك ….).
4- تحديد الفروق الدقيقة بين الكلمات الملبسة.
5- بناء قاعدة معطيات للأوزان القياسية للأسماء، والأفعال المشتقة من كل جذر.
6 – بناء قاعدة معطيات للسوابق، واللواحق، والزوائد، التي يمكن أن تأتي في بداية كل كلمة أو نهايتها.
7- بناء قاعدة بيانات لتخزين نتائج التحليل الصرفي للكلمات.
ثانياً- متطلبات تقنية ( برمجية ):
1- بناء قواعد المعطيات، وبرامج إدخال المواد اللغوية وبرامج تعديلها بعد الإدخال.
2- بناء برنامج التحليل الصرفي الآلي باستخدام إحدى لغات البرمجة.
3- بناء برنامج لربط الجذور بمشتقاتها المختلفة الموجودة في قواعد المعطيات.
4- بناء برنامج للتشكيل الآلي للكلمات.
5- بناء برنامج للتصحيح الإملائي[ii].
أهمية المحللات الصرفية:
     تبرز أهمية المحلل الصرفي عند التعامل مع النصوص الكبيرة، مثل القرآن الكريم، والحديث الشريف، والموسوعات، وشبكة الإنترنت؛ فيكفي أن تستخدم للبحث في شبكة الإنترنت فعلاً مثل (كتب) فيستدعي محرك البحث المزوَّد بمحلل صرفي جميع النصوص التي وردت بها مشتقات تنتمي إلى جذر هذا الفعل مثل : (كاتب، استكتب، كُتُب، كِتاب، مكتبة، مكتب … إلخ). كما تمكِّن المحللات الصرفية الحاسوبية المتعلمين، والباحثين من استعمال المحلل في تعليم الصرف العربي، والبحث فيه من خلال التعرف على الجذوع، وما يلحقها من سوابق ولواحق.
     “وتُعدُّ المحللات الصرفية الآلية للغة العربية بمثابة اللُّب للتقنيات، والتطبيقات العربية الأخرى، حيث تستفيد منها بشكل أو بآخر، لكنها تصبح أساسية بالنسبة لتقنيات البحث والفهرسة، بحيث يمكن اعتبارها تطبيقاً مباشراً لها، وتشتمل تقنيات التحليل الصرفي إعادة الكلمة المشتقة إلى جذرها، أو اشتقاق جميع الكلمات الممكنة من جذر معين، أو تحليل الكلمة إلى عناصرها الأولية، أو الفصل بين جذور الكلمات وسوابقها ولواحقها، أو تجريدها من صورها الصرفية، وهو أساس للعديد من المنتجات والتطبيقات والحلول التي تتطلب معالجة ذكية للغة العربية، كمحرك البحث في الإنترنت” (حمادة2، 2009م، ص5)
      وللمحللات الصرفية أثر كبير في بناء قاعدة معطيات المعجم الحاسوبي؛ حيث يمكن عن طريقها اختزال كلمات قاعدة المعطيات إلى عدد محدود من الكلمات، ثم يقوم المحلل الصرفي بالتعامل مع الكلمات الفرعية التي تُشتق من كلمات قاعدة المعطيات.
     كما أن للمحللات الصرفية الحاسوبية أثراً في بناء محركات البحث على شبكة الإنترنت، فالجهود العربية متميزة لبناء محركات البحث، ولكنها لا ترقى إلى مواصفات محركات البحث العالمية، وتعاني من مشاكل لغوية كثيرة. “إن الشروع في إعداد محركات بحث عربية هو ضرورة تقنية، وأمنية، واقتصادية؛ فمحركات البحث تلعب دوراً محورياً في تحسين معدل ظهور المحتوى الرقمي على الشبكة، ومن ثَمَّ تساهم في وضع العالم العربي على الخريطة العالمية للمعرفة والمعلوماتية. ومما لا شك فيه أنَّ عدم وجود محرك بحث عربي فعّال يقلل في فاعلية وجدوى استخدام الإنترنت، كما يحدُّ من فرص المستخدم العربي في الحصول على المعلومات المطلوبة”. (زكار، 2003م، ص27). إنَّ العرب في حاجة إلى بناء محرك عربي جديد، حيث إنَّ معظم محركات البحث تمَّ بناؤها انطلاقاً من احتياجات لغات أخرى، حيث إنَّ اللغة العربية لها خصائص تتطلب بناء فهارس تناسبها منذ البداية (الكاملي، 2009م)
مراحل التحليل:
1- الدخل: دخل المحلل الصرفي كلمة مفردة أو جملة أو نص، فإذا كان الدخل جملة أو نصاً حلَّل النظام كلماتها تباعاً، وأعطى كل كلمة تحليلاً مستقلاً عن السياق.
2- التحليل: لا تعدو الكلمة في اللغة العربية أن تكون فعلاً، أو اسماً، أو حرفاً:
– تحليل الفعل: يفترض المحلل الصرفي الآلي أن الكلمة المعالجة فعل، فيُحللها، ويعطي في نتائجه: سابقة الفعل، ولاحقته، وصيغته، وتجرده أو زيادته، ووزنه، وجذره، وإسناده، وبناءه للمعلوم أو المجهول، وعلامات البناء أو الإعراب، ويضبط الفعل بالشكل.
 – تحليل الاسم: يفترض المحلل الصرفي أن الكلمة المعالجة اسم، ويُعطي في مخرجاته سابقة الاسم ولاحقته، ووزنه، وجذره، ونوعه من جهة التصرف وعدمه، ومن جهة التذكير والتأنيث، ومن جهة الإفراد والتثنية والجمع، ومن جهة النسبة والتصغير، وعلامات البناء أو الإعراب، ويضبط الاسم بالشكل.
– تحليل الحرف: يفترض المحلل أن الكلمة المعالجة حرف، فيُحللها، ويُعطي في نتائجه سابقة الحرف ولاحقته، وعلامات البناء.
3- المخرجات ( النتائج): تتضمن مخرجات المحلل الصرفي الآلي جميع الوجوه الممكنة للكلمة المعالجة.
طرق التحليل الصرفي:
     وقد أجملتْ الدكتورة سلوى السيد حمادة طرق التحليل الصرفي الآلي فقالت:” اتَّبعتْ الأبحاث التي تناولت حلَّ مشاكل الصرف العربي في مجال التحليل الصرفي طرقاً مختلفة لمعالجة الكلمات صرفياً، وهذه الأبحاث مقسمة إلى أربعة أقسام:
1- طريقة قوائم الكلمات المخزنة:
     حيث تُخزَّن جميع الكلمات العربية في قوائم مع مكوناتها الصرفية على شكل جدول كبير، ويتم تحليل الكلمة بالبحث عنها في هذا الجدول، ومن ثمَّ معرفة جذرها ببساطة، ويمكن تطبيق هذه الطريقة على نصوص معينة، مثل القرآن الكريم، أو موسوعة الحديث الشريف، أو كتب محددة.
2- الطريقة اللغوية:
     ويكون ذلك بتحويل قواعد اللغة العربية الصرفية المعروفة إلى خوارزميات حاسوبية، وذلك بمحاكاة عمل اللغوي عند تصريف الكلمات واشتقاقها.
3- الطريقة الرياضية:
     ويتم ذلك بتحليل الكلمة بشكل آلي بطريقة التجربة والخطأ والتصحيح، وذلك باعتبار الكلمة مجموعة من الحروف، حيث يتم أخذ ثلاثة أحرف منها ومقارنتها بقائمة من الجذور، فإذا لم يوجد في القائمة أُخذَتْ ثلاثة أحرف أخرى… إلى أن يتم إيجاد الجذر الأقرب إلى الصواب.
4- طريقة الأوزان:
     وذلك بتوليد مجموعة كبيرة من القواعد النَّصيَّة الآلية عن طريق المقارنة بين قائمة كبيرة من الكلمات، مع ما يقابلها من مصادر، ويتم استخدام هذه القواعد لمعرفة مصدر الكلمة، فإذا انطبقت على الكلمة أكثر من قاعدة واحدة يتم ترجيح أكثر القواعد تكراراً” (حمادة2، 2009م، ص6)
5- المحلل الصرفي متعدد الأطوار:
     يتكون المحلل الصرفي متعدد الأطوار من أربع معالجات ثانوية، تعمل بصورة متكاملة لتحقيق الغاية التي تهدف إليها عملية تحليل النصوص العربية. وهو ذو فائدة كبيرة عند البحث في نصوص الموسوعات الكبيرة، حيث يتصف بكفاءة أداء جيدة، وسرعة كبيرة:
أ- المعالج الصرف نحوي:
     يزيل المعالج الصرف نحوي كل ما يتصل بالكلمة من سوابق ولواحق. ويعيد التعديلات الصوتية التي تمت على عناصر بنية الكلمة الصرفية إلى أصلها.
ب- المعالج الاشتقاقي:
     يستخلص المعالج الاشتقاقي الجذور والصيغة الصرفية من الكلمة التي قام بتحليلها المعالج الصرف نحوي.
جـ- المعالج الإعرابي:
     يعمد المعالج الإعرابي إلى تمييز الحالة الإعرابية للكلمة.
د- معالج التشكيل:
     يعمد معالج التشكيل إلى إعادة تركيب عناصر الكلمة، لغرض مقارنتها بالكلمة المدخلة في المحلل الآلي، وذلك للتأكد من التحليل الصرفي لبنيتها (مظفر، 2008م).
     وقد قَدَّم الدكتور نبيل علي[iii] إطاراً عاماً لمعالجة الصرف العربي آلياً، وأورد عدة نماذج للتحليل الصرفي الآلي بوجه عام، مبيناً مدى ملاءمتها لمطالب الصرف العربي. وتبعاً لهذا قام بعرض نموذج وضعه لمعالجة الكلمات العربية صرفياً في أطوار التشكيل المختلفة، وهو نموذج التحليل بالتركيب.  (نبيل، 1988م)
خطوات عمل المحلل الصرفي:
أولاً: يبحث المحلل عن الكلمة في قوائم الكلمات الجامدة، فإذا وجدها انتهى عمله، وإذا لم يجدها يذهب إلى الخطوة التالية.
ثانياً: يحذف المحلِّل اللَّواصق والزوائد، وذلك بالعودة إلى قوائم السوابق واللواحق والزوائد.
ثالثاً: يختار الوزن المناسب للكلمة من قائمة الأوزان.
رابعاً: يختار الجذر المناسب للكلمة من قائمة الجذور.
خامساً: إذا وجد المحلِّل الجذر، فالكلمة إذن صحيحة، وإن لم يجده ففي الكلمة المدخلة خطأ إملائي.
أسباب أخطاء المحلل الصرفي:
– “عدم مراعاة قواعد الصرف، وخاصة الإعلال والإبدال والإدغام والقلب والحذف.
– عدم مراعاة قواعد الاشتقاق.
– عدم الرجوع للمعجم للتأكد من صحة الكلمات.
– عدم اشتمال قواعد معطيات المحلل على جميع المفردات.
– نقص في المعارف الصرفية للمعجم من جهة توصيف المفردات.” (البوّاب، 2009م، ص8)
المحللات الصرفية الحاسوبية للغة العربية:
1- المحلل الصرفي للغة العربية لمخبر “ميراكل” أ.د عبد المجيد بن حمادو، ولمياء هدريش بلغيث، ونهى شعبان، صفاقس، الجمهورية التونسية.
2- محلل صرفي عربي موجَّه بالتطبيقات، رياض سنبل ود. ندى غنيم ود. محمد سعيد دسوقي، المعهد العالي للعلوم التطبيقية والتكنولوجيا[iv]، دمشق، سوريا.
3- محلل صرفي للغة العربية باستخدام تقانات الذكاء الاصطناعي، د.فاضل سكر ود.سمير معطي، سوريا.
4- محلل صرفي للكلمات العربية، عزّ الدين مزروعي وآخرون، جامعة محمد الأول، كلّية العلوم، شعبة الرياضيات والإعلاميات، مختبر الأبحاث في الإعلاميات، فريق المعالجة الآلية للغات الطبيعية.
5- محلل صرفي مصدري عربي للتطبيقات العامة، مبادرة الملك عبدالله للمحتوى العربي[v]، مدينة الملك عبد العزيز للعلوم والتقنية.
6- برنامج (مداد) للتحليل الصرفي للكلمات العربية، محمود محمد صابر وعبد المنعم فريد عبد المنعم، شركة مداد لتقنية المعلومات.
7- محلل الخليل الصرفي[vi].
8- المحلل الصرفي مفتوح المصدر[vii].
     “إنَّ هذا العدد غير القليل من المحللات الصرفية يدل دلالة واضحة على بلوغنا الغاية في اهتمامنا الشديد بمعالجة اللغة العربية حاسوبياً، وحرصنا الأكيد على الإسراع في تنفيذها وتحقيقها، وهذا يُبشر بمستقبل واعد نتخطّى فيه جميع العقبات والعراقيل التي تَحولُ دون الاستفادة من التقنيات الحديثة في هذا المضمار. إنَّ المشتغلين في المحللات الصرفية لا يعملون بسائق من ربح مُومَّل، وغُنم يُتَحصَّل، وإنما بسائق من حبهم الشديد لهذه اللغة الشريفة، وإخلاص في خدمتها، كما خدمها أجدادنا من قبل” (البوّاب، 2009م، ص1)
     إنَّ منتهى الغاية التي يجتهد مطورو المحللات الصرفية الحاسوبية للوصول إليها هي أن يوفروا لتلك المحللات كفاية لغوية تشبه ما يكون للإنسان، حيث يستقبل اللغة ويدركها، ويفهمها ثم يحللها، فيعرف الأبنية الصرفية للاسم والفعل، وما هو مشترك بينها، ويعرف أبنية اسم الفاعل والمفعول والزمان والمكان والسوابق واللواحق …إلخ.
[i] وتُسّمّى (كلمات التوقف أو الوقف)، وهي كلمات كثيرة الورود في النصوص، ولا تحمل معاني إذا فُصلتْ عن السياق، ولا تُكوِّنُ جملة مفيدة عند استخدامها وحدها، وهي حروف وأدوات لازمة لتركيب الكلام العربي، مثل: حروف الجر، والعطف، والاستفهام، والنفي، والتعجب، والنداء، والظروف، والضمائر …إلخ.
[ii] يقوم المدقق الإملائي باكتشاف الأخطاء الإملائية، واقتراح التصحيحات المناسبة البديلة لها. ويُعدُّ مدقق صخر واحداً من أوائل المدققات الإملائية التجارية العربية.
[iii] الدكتور نبيل علي -رحمه الله- رائد معالجة اللغة العربية حاسوبياً، وتعريب نظم المعلومات على المستوى العربي، حاصل على الدكتوراه في هندسة الطيران.
[iv] أنشئ المعهد في عام 1983م بهدف إعداد كوادر مؤهلة تأهيلاً عالياً من المهندسين والباحثين. وتُعد المعالجة الآلية للغة العربية من أهم محاور العمل في المعهد. ويضم المعهد مجموعة كبيرة من الباحثين المختصين باللغة العربية، وتقانة المعلومات. وقد أنجز المعهد مجموعة كبيرة من المشاريع في مجال المعالجة الآلية للنصوص العربية، والمعالجة الصوتية، وتركيب الكلام العربي.
[v] تهدف مبادرة الملك عبدالله للمحتوى العربي إلى تسخير المحتوى الرقمي لدعم التنمية والتحول إلى مجتمع معرفي، مع ضمان حصول جميع شرائح المجتمع على المعلومات والفرص الإلكترونية. والحفاظ على الهوية العربية والإسلامية للمجتمع، وتعزيز المخزون الثقافي والحضاري الرقمي. كما تهدف إلى إنتاج محتوى إلكتروني عربي ثري لخدمة المجتمعات العربية والإسلامية.
[vi] يُنظر: http://www.alecso.org.tn/index.php?option=com_content&task=view&id=1302&Itemid=956&lang=ar
[vii] يُنظر: http://arabicmorphoanalyzer.appspot.com/main/#!

0 Reviews

Write a Review

مقالات ذات صلة

زر الذهاب إلى الأعلى