مقالات في اللسانيات الحاسوبية

المدونات اللغوية المحوسبة

د. عبدالعزيز بن عبدالله المهيوبي

اللسانيات الحاسوبية هي أحد فروع اللسانيات التطبيقية التي تهتم بالإفادة من معطيات الحاسوب في دراسة قضايا اللسانيات المتعددة مثل رصد الظواهر اللغوية وفقا لمستوياتها الصوتية والصرفية والنحوية والبلاغية والعروضية، وتهدف كذلك إلى معالجة عمليات تحليل الظواهر اللغوية والنصوص التراثية وإجراء العمليات الإحصائية وصناعة المعاجم والترجمة الآلية وتعليم اللغات وإجراء التحاليل على السياقات اللغوية المتعددة إلى غير ذلك من العمليات الحاسوبية المتعلقة باللغات الطبيعية، واستعمال الحاسوب يكفل الدقة العلمية والسرعة وتوفير الجهد[1].

لسانيات المدونات:

تطورت لسانيات المدونات (Corpus Linguistics) في برامجها وأصبحت مادة مهمة تدرس في أقسام اللسانيات في عدد من الجامعات الغربية والعربية ومنها برنامج دكتوراه علم اللغة التطبيقي في معهد تعليم اللغة العربية بجامعة الإمام محمد بن سعود الإسلامية ، ويمكن تعريف المدونات بأنها “مجموعة ضخمة من النصوص اللغوية (منطوقة أو مكتوبة) مودعة في مخازن حاسوبية”[2]. وتستعمل العديد من البرامج لتحليل تلك النصوص كبرنامج الكشّاف السياقي concordance وذلك تبعاً لأهداف الدراسات المختلفة سواء أكانت دراسات صوتية أو معجمية أو صرفية أو تركيبية أو نصية أو غير ذلك من مستويات الدرس اللغوي بدءاً من الوحدة الصوتية وانتهاء بالوحدة النصية، حيث يُورد برنامج الكشاف السياقي الكلمة المطلوبة والكلمات السابقة واللاحقة لها في العبارة أو الجملة، هذا بالإضافة إلى إمكان الإفادة من المدونات في مجالات متعددة تتعلق بالدراسات النقدية والأسلوبية والدراسات النفسية والاجتماعية والإنثربوولجية وغير ذلك من أنواع الدراسات المختلفة .

المدونات اللغوية المحوسبة:

من المعروف في التوجهات الحديثة للتحليل اللغوي أن يستند العمل على المدونات اللغوية المحوسبة التي تمثل اللغة المطلوب تحليلها تمثيلا حقيقيا، لا افتراضيا . وتكمن أهمية المدونة في الخصائص التالية:

أ‌- الواقعية والتمثيل الحقيقي للغة .

ب‌- الشمول من حيث المصادر والتنوعات والاستعمالات اللغوية والأساليب والأجناس الأدبية والتخصصات العلمية والتقنية ، وذلك بشرط مراعاة ذلك عند إعداد المدونة.

ج- إمكانية إخضاعها للتحليل الإحصائي من جوانب مختلفة ولأغراض مختلفة، مثل التعرف على شيوع الكلمات، ومصاحباتها اللفظية، وسياقات استعمالها ( من خلال الكشافات السياقية ) وغير ذلك من أنواع التحليل الصرفي للغات الاشتقاقية كالعربية

د- التعرف على شيوع الكلمة وشيوع معانيها المختلفة ونسبة شيوع الكلمة مقارنة بمجموع الكلمات في المدونة، إضافة إلى شيوعها من عدمه في أنواع النصوص المختلفة، وهو ما يفيد في استخلاص المصطلحات الشائعة في كل تخصص من التخصصات العلمية والتقنية

هـ إمكانية التعرف على شيوع الأوزان والصيغ الصرفية المختلفة.

و- إمكانية إجراء أنواع من التحليل النحوي والتركيبي، مع توافر بعض المتطلبات اللازمة.

ز- إمكانية إجراء التحليل الصوتي ( بوصف الحروف تمثيلا للأصوات العربية من حيث شيوعها ومواقعها في الألفاظ إلى غير ذلك [3].

إن المدونة اللغوية ليست مكتبة إليكترونية لاستعراض وقراءة النصوص. وليست هي اللغة كلها بل هي نموذج ممثل للغة إذا أُحسن تصميمها مع اختلاف بين المهتمين والدارسين للمدونات اللغوية فيما إذا كان بإمكان المدونات أن تمثل اللغة وبالتالي فأنه يمكن من خلالها إصدار الأحكام أو بناء النماذج الحاسوبية للغة. فالمدونات في رأي البعض لا تمثل اللغة بل تمثل نفسها فقط وأن أي أحكام أو نماذج تبنى إنما هي صحيحة بالنسبة للمدونة. ولكن ما يهم في دراسة اللغة أو حتى في بناء النماذج الحاسوبية لها، هو الأنماط المتكررة على المستوى اللفظي أو النحوي أو الصرفي أو حتى الدلالي منها. هذه الأنماط يمكن أن توجد وأن تتضح صورها – إن كانت موجودة – في عينة من اللغة نفسها والتي هي المدونة اللغوية، وتزداد فرص ظهورها والقطعيةُ بحجية الاستدلال بها كلما زاد عدد كلمات المدونة وتنوعت أوعيتها وموضوعاتها. وهذا هو شأن العلوم التطبيقية التي تكتسب نتائج أبحاثها أهميتها من حجم عينات الدراسة وتنوعها والأنماط التي تظهر فيها.

الكشاف السياقي: concordance

هو كشاف لغوي لكل الكلمات أو للكلمات الرئيسية في المدونة، ويعطي ـ بصفة عامة ـ السياق الذي وردت فيه، أو بمعني آخر. هي الكشافات التي تهتم بجميع مفردات النص وربط المفردات بنصوصها أو بسياقها، ويمكن لهذا السياق أن يكون الفقرة أو الجملة أو العبارة أو السطر الذي ترد فيه الكلمة.

لقد ساهمت الكشافات السياقية في تطور علم اللغة، ولعل استخدامها في مجال اللغويات في العصر الحالي هو أبرز استخداماتها على الإطلاق، حيث إن معظم المقالات التي تتحدث عن الكشافات السياقية قد نشرت في مجلات تتخصص في اللغات.

وكان ظهور مجال لغويات الحاسب الآلي  Computational Linguistics- الذي يعنى بتطبيق تحليلات الحاسب على التركيبات والمعاني اللغوية -كان أحد العوامل التي جعلت التحليل الآلي للغة موضوعاً للبحوث الجادة في الخمسينيات في الغرب، وقد أصبحت الآن الكشافات السياقية جزءاً من ظاهرة عالمية تنمو سريعاً تسمى بالحاسب والإنسانيات Computer and Humanities ، التي تؤثر في كل ما يتعلق بعلم اللغويات ” .

إن برامج لسانيات المدونات  (Corpus Linguistics)المختلفة توفر جوانب مهمة لا غنى للعاملين في الدراسات اللغوية  عن استعمالها ، فمن أهم ما توفره تلك البرامج ما يلي:

1- إنجاز كشافات أو مسارد سياقية (concordances )  تأخذ المستفيد إلى مواضع كلمات بعينها في النص ،مع توفير السياق الذي تظهر به تلك الكلمات،  ويلاحظ أن الكشاف لا يضيف شيئاً إلى النص.

2- معرفة الطرق المختلفة لبداية الجمل ونهايتها في نص ما وذلك من خلال البحث عن علامة الترقيم – النقطة – داخل النص.

3- تجمع كل السياقات التي وردت الكلمةٌ فيها بالنص في مكان واحد؛ وهذا يجعل مقارنة فقرات النص ببعضها أمراً سهلا.

4- تجميع الوحدات، والتعبيرات والمصطلحات المترادفة، أو المتضادة في النص.

5_ إمكانية التأكد من صحة نصٍ ما أو دقة عبارة في النص.

6_ تساعد على الاستشهاد بعبارات أو نصوص معينة في النص.

7- دراسة استعمال المؤلفين لكلمات بعينها أو المقارنة بينهم وبين مؤلفين آخرين أو مقارنة أوجه الاختلاف والتشابه بين تلك الكلمات وبين غيرها في حقب زمنية قديمة وحديثة.

8- تحلـيل معاني الكلمات ومقارنة هذه المعـاني”[4]، كما يساعد على اكتشاف  الكلمات المترادفة والمتجانسة والفرق في استخدام كل منها.

9- الكشف عن المتواردات أو المتلازمات اللفظية تلك التي تستخدم في اللغة العربية للإشارة إلى كلمة يقترن استخدامها بكلمة أو كلمات أخرى، وتسمى بأسماء أخرى أيضا مثل المتصاحبات أو المتلازمات أو المقترنات أو المترافقات والتصاحب في اللغة العربية يكون بين كلمة أساسية  وأخرى مصاحبة، ويكون التصاحب بين:

أ- اسم وفعل ويناسبه مثل: (أقام الصلاة) و (قطع الطريق) و (خاض المعركة) .

ب- اسم واسم مثل: (إراقة الدماء) و ( الوفاء بالعهد).
ج-  فعل وفعل آخر مثل (أخذ يأكل) و (طفق يخصف) .
د- صفة واسم مثل (ثاقب الرأي) و (عديم الإحساس) .
هـ اسم وحرف مثل (يرغب في ….) (يرغب عن …).

10- تجميع الكلمات ذات الحقل الدلالي الواحد مع العثور على النصوص التي وردت بها هذه الكلمات.

11- البحث عن الكلمات ذات المعاني المتقاربة، وذلك مثل: (جلس، قعد، برك ) فيقوم البرنامج بالبحث عنها داخل النص، ويعرضها داخل سياقاتها.

12- تحليل الكلمات صرفياً، وتحليل دلالات الألفاظ ،وتطورها.

13- الكشف عن الاشتقاقات المختلفة لفعل استُخدِمَ في النص، وعرض تلك الاشتقاقات في سياقاتها.

14- عرض كلمات معينة، أو جميع كلمات النص وترتيبها ترتيبا ألفبائيا أو بشكل معاكس، أو حسب ترددها في ترتيب تصاعدي، أو تنازلي.

15- المساهمة في إنجاز المعاجم اللغوية – في مقدمتها المعجم التاريخي- ؛ وذلك بدراسة مــلايين الكلمـــات وتتبع تطورها تاريخياً، فتكون نتيجة الدراسة معلومات ذات قيمة لغوية عظيمة،و بواسطتها يستطيع معد المعجم أن يصل إلى استنتاجات حول معاني واستخدامات الكلمات من خلال نصوص ذات جنسيات متعددة.

16- “إرشاد معد المعجم إلى نصوص عامة شائعة تحتوي على كلمات بعينها، وإلى معظم التعبيرات التي تتردد كثيراً، بخلاف الأمثال ، والجمل المشهورة“[5]

17- مساعدة  المعجميين على تحديد معنى أو معاني كل كلمة وتحليلها بدقة .

18- إعطاء أولويات لألفاظ بعينها من خلال عدد مرات تكرارها في النصوص المختلفة.

تعليم اللغات-

19- إحصاء الكلمات والمصطلحات الواردة في نصٍ ما ، التي لم تعد تستعمل في الوقت الحاضر.

20- المساعدة في إعداد مناهج تعليم اللغات، واختيار التعبيرات اللغوية والنماذج النحوية المطلوب تدريسها للطلبة في صف دراسي معين ،مع استبعاد الكلمات ذات الاستخدامات غير المطلوبة لهذا الصف ،والتي يمكن البحث عنها في القواميس وكتب النحو.

21- “استخراج أكثر الكلمات وروداً في نصوص تتخصص في مجال موضوعي معين ليتم تدريسها كنماذج لغوية مهمة ، ويتم اختيار هذه الكلمات حسب أكثرها عدداً في مرات التكرار ، وقابليتها للتدريس لطلبة معينين في فصل دراسي معين  ، ومن ثم التوصل إلى معلومات ذات قيمة للمهتمين بالنحو وإعداد المعاجم”[6]

22- دراسة النصوص التي يكتبها دارسو اللغات كتطبيقات دراسية ، حيث تعد في شكل مقروء آلياً عن طريق برنامج كشافات النصوص ، لتصبح صالحة لدراسة ملامح وخصائص كتابات الدارسين حسب طبيعة النص، سواء أكان مقالة، أو رسالة تجارية، أو قصة000 إلخ[7] [1] مازن الوعر، دراسات لسانية تطبيقية، دار طلاس، دمشق، سوريا، الطبعة الأولى، 1989، ص25

[2] تطبيقات استعمال لسانيات المدونات في إصدار معجم تأريخي للغة العربية، د. جمعان عبدالكريم [3] د. محمود إسماعيل صالح ود. إبراهيم الخراشي : الجانب اللغوي للمعجم الحاسوبي للغة العربية ، ضمن البحوث المقدمة في اجتماع خبراء المعجم الحاسوبي التفاعلي   ص 2 على الموقع [4] الصوينع،علي السليمان.كشافات النصوص وتطبيقاتها في نصوص كشافات القرآن والحديث .- مجلة المكتبات والمعلومات العربية، س7،ع3(يوليو) .ص17. [5] Tribble, Chris, et al. Concordances in the Classroom: a Resource Book for Teachers.                                                                                                         London: Longman,1990. -p.21 [6] Levy, M. concordances & Teir integration into a word-processing Environment for Language Learners.-System,v.18,no.2(1990).-p.179 [7] Tribble, Chris, et al. Concordances in the Classroom: a Resource Book for Teachers.                                                                                                         London: Longman,1990. -p.22

0 Reviews

Write a Review

مقالات ذات صلة

زر الذهاب إلى الأعلى