الفجوة الرقمية في اللغة العربية
الأستاذ الدكتور عبد المجيد نصير
جامعة العلوم والتكنولوجيا الأردنية
عضو مجمع اللغة العربية الأردني
عمان- الأردن
الثلاثاء 3 جمادى الأولى 1427هـ- 30 أيار 2006م
تمهيـد
اللغة هي أوضح خصائص الجنس البشري المميزة له. تدل على طبيعته الفريدة، وتضعه في ذرى المخلوقات الحية. وقالوا إن اللغة مرآة العقل، وأداة الفكر، ووعاء المعرفة، وهي العمود الفقري للمجتمعات البشرية.
لا نبحث في هذه المحاضرة عن تاريخ اللغة، متى ظهرت، وما هي إرهاصاتها الأولى؟ ولا كيف نمت وتطورت عبر الأنواع والعصور؟ ونحيل المستزيد إلى كتاب الأستاذ الدكتور مايكل كورباليس M.C.Corballis() المترجم إلى العربية وعنوانه "في نشأة اللغة". فهو يتابع هذا التطور اللغوي من إشارة اليد إلى نطق الفم.
كما أننا لا ندخل في ميدان التميز البشري، وهل هو باللغة أم بشيء آخر؟ ونحيل الراغب في ذلك إلى الكتاب الأخاذ، وعنوانه "هل نحن بلا نظير؟ " للأستاذ الدكتور جيمس تريفل J. Trefil الذي يجادل عن أن الدماغ البشري هو المميز الأعظم للجنس البشري عن غيره من المخلوقات. يقارن هذا الدماغ مع أدمغة الحيوانات الأُخرى، ومع الحاسوب، ليصل إلى الفرق الشاسع المعقد درجة ونوعاً. بل إنَّ الحاسوب مهما تقدم لن يصل إلى مستوى هذا الدماغ البشري، بما فيه من كامل قدرة التفكير والإبداع. ()
ومع ذلك، فاللغة ظاهرة نفسية فسيولوجية معقدة، ونشاط اجتماعي. تسمو مع أهلها بسموهم. وتنحط بانحطاطهم. وهي ليست فقط تربيطات بين الكلمات. فاللغة تربط بين مفاهيم في الذهن، وتعمل من خلال استخدام قواعد، تحكم الأشكال الطبيعية من الكلام البشري، على مختلف لهجاته ومستوياته. () ولقد حيرت اللغة كنهاً وتعليماً العقل البشري منذ القدم. وفهم كثير من المسلمين قوله تعالى: "وعلم آدم الأسماء كلها" (البقرة 31) على أن اللغة هبة إلهية علمها آدم، وانتقلت إلى ذريته. ويعتبر القرن العشرون قرن الدراسات المعمقة للغة من جوانبها المختلفة. إذ توصل الباحثون إلى أن "ملكة اللغة البشرية تبدو مبرمجة بشكل حتمي في بنية أدمغتنا، أي أنها تكيف جسدي من قبل نوعنا للبيئة التي وجد أسلافنا أنفسهم فيها"(). ويجادل الأستاذ تريفل دفاعاً عن هذا الموقف بعدة ملاحظات منها:
(1) يبدأ الأطفال في العالم أجمع اكتساب اللغة عند العمر نفسه.
(2) يكتسب الأطفال اللغة في تسلسل محدد جداً.
(3) يكتسب الأطفال اللغة بشكل سريع جداً. ومع سن السادسة يتحدثون جملاً سليمة قواعدياً.
والفكرة أن اللغة البشرية تتألف من مستويين: عميق من قواعد مبرمجة بحتمية وراثية. وسطحي من اللغة المنطوقة أو المكتوبة. ويفترض الأستاذ نعوم تشومسكي “Naom Chomsky” أن كل اللغات البشرية تشترك في المجموعة العميقة نفسها من القواعد النحوية. وقوانين اللغة البشرية لا تتعلق بالأصوات أو الكلمات، بل بالطريقة التي تبنى بها اللغات. () "وقدرتنا على بناء الجمل وفهمها تعتمد على مهارة لافتة للنظر في استخدام القواعد. بل لعل الأجدر بالالتفات هو أننا نستخدم هذه القواعد من دون أن نعيها".() ويحب اللغويون أن يميزوا بين النحو والمعنى. فقد تكون جملة ما صائبة نحوياً، لكنها دون معنى. مثل عبارة تشومسكي الشهيرة "تنام الأفكار الخضراء بلا لون غاضبة".
Colorless green ideas sleep furiously
على أن الأمانة العلمية تقتضي أن نذكر أن نظرية تشومسكي وأعوانه في المشترك في لغات العالم قد تلقت ضربة موجعة أخيراً. فقد نشرت جريدة اندبندنت Independent (6-5-2006) ما وجده الأستاذ اللغوي دانيال ايفريت D. Everett، من جامعة مانشستر البريطانية، في لغة قوم معروفين في أَدغال الأمازون. فلغتهم مزيج من الصفير والطنين، ليس فيها مفهوم العدد. ولا توجد تعابير في لغتهم أو تمييز للألوان. ولغتهم هذه غير مكتوبة. ولا ذاكرة لها أبعد من جيلين. كما لا يدرك من اللغة إحساس بالزمن أو بمفاهيم مجردة، أو بصيغة الماضي. ()
على أي حال، ندع لغة هذه القبيلة البدائية وأمثالها، ونهتم باللغات البشرية الحية، لنجد أنّهَ لأي لغة آثار مهمة في جميع المجالات من تربوية وثقافية واقتصادية وسياسية، وعسكرية، وتكنولوجية، وأدبية، وإنسانية.
المواجهة بين اللغات وتكنولوجيا المعلومات
لغد فجّرت تكنولوجيا المعلومات إشكالية اللغة، بعد أن أظهرت المواجهة بينهما الحاجة الماسة إلى المراجعة الشاملة للمنظومة اللغوية، لتتهيأ اللغة للقاء هذه الآلة المثيرة المتحدية. وعلى جبهة الحاسوب، فقد كان عليه أن يتخلص من معماريته التقليدية، آلة فون نيومان، ذات الطابع المركزي الصارم لكي يتأهل للقاء حاسم مع اللغة. وهذا أدّى إلى إنشاء مراكز بحوث متخصصة في علاقة اللغة بتكنولوجيا المعلومات، في دول عالمية متقدمة عديدة.
هذه المراجعة الشاملة للغة أثارت أسئلة فلسفية قديمة من جديد. هل اللغة ظاهرة عشوائية اعتباطية؟ أو تحت تجلياتها الظاهرة يوجد نظام متسق تحكمه القواعد والمبادئ؟ هل اللغة سلسلة من الرموز الخطية، أم شبكة من العلاقات المتداخلة، أم هيكلية من مستويات متوازية متتالية؟ هل ندرس سلوكها الظاهر المحسوس أم نحاول استجلاء المعرفة اللاواعية التي تحكم آليات النطق والفهم؟ وما هي الوحدة الأساسية اللغوية؟ أهي اللفظ أم الجملة أم السياق؟ هل المُدخل لدراسة بنيتها الداخلية مباني تراكيبها، وأنماط فهمها، أو دلالة معانيها، وتجاوز استعاراتها؟ هل ندرس اللغة المنطوقة أم المكتوبة؟ هل نشغل أنفسنا باللغة كما هي في الحياة اليومية، أم كما يجب أن تكون؟
هذه وغيرها ظواهرها متعددة معقدة. هل اللغة، إذن، قابلة للخضوع لضوابط العلم المضبوط exact؟ هل للرياضيات والأحياء قدرة في معالجة هذا الكم الهائل من الظواهر المعقدة؟ وهل بإمكان آلة صماء أن تحاكي ملكة اللغة بمرونتها وترادفاتها، وبشحنة الانفعالات الكامنة وراء تعابيرها؟
هكذا، ظهر علم اللسانيات الحاسوبية Computational Linguistics، وهندسة اللغة Language Engineering فدخول اللغة مجال العلوم المضبوطة شرط أساسي لكي تتبعها في ذلك علوم الاجتماع والأدب والنقد، وعلم استرجاع المعلومات Information Revival. ()
خصائص منظومة اللغة العربية من منظور معلوماتي
تعتبر اللغة العربية أعقد اللغات في عائلتها (الجزرية – السامية سابقاً)، وأغناها صوتاً وصرفاًُ ومعجماً. ويهتم الدكتور نبيل علي بأهم خصائص منظومة اللغة العربية الآتية:
أ- التوسط اللغوي
تنحاز اللغة العربية إلى الشائع اللغوي، وتكرهُ الشاذّ والشارد، وتجمع بين كثير من الخصائص اللغوية المشتركة مع لغات أخرى. ونضرب بعض الأمثلة:
- أبجدية اللغة العربية ليست فونيمية صرفة كالإسبانية والفنلندية، أي لا يناظر كل حرف فونيما (صوتاً) واحداً. كما أنها ليست لغة مقاطع syllabic كاليابانية، حيث رموز أبجديتها مقاطع من صامت consonant وصائت. فالأبجدية الفونيمية في العربية هي الأغلب، وفيها مقطعيات مثل: لا، لأ، إ، آ، ؤ، ئي..
- حالات الإعراب في العربية (ثلاث) حالات إعراب، وليس كما في الروسية (ست حالات)، أو قصور تام كالإنجليزية.
- ترتيب الكلمات في الجمل تجمع العربية بين الجملتين الاسمية والفعلية.
- تطابق العربية بين الفعل والفاعل. بينما لا تطابق الإنجليزية إلا في حالة الفعل الحاضر مع الفاعل المفرد الغائب He goes. وفي الجورجية تطابق بين الفعل والفاعل والمفعول به.
- استخدام الأسماء الموصولة. تصل اللغة العربية المعرفة ولا تصل النكرة، بينما تصل الإنجليزية (والجرمانية) المعرفة والنكرة. وتسقط الصينية ظاهرة الصلة تماماً.
- العربية وسط في عدد الأفعال. ففيها (خمس عشرة) صيغة مزيدة، بينما هي قليلة في الإنجليزية، وتصل إلى (ثلاثين) صيغة في الإسبانية.
هذا التوسط اللغوي يفرض لزوم الاهتمام بالدراسات اللغوية المقارنة والتقابلية contrastive، لكي نصل إلى فهم معمق شامل للغتنا العربية. وكثير من الخصائص التي ادّعى بعض الباحثين أنها حكر على العربية، أظهرت الدراسات الحديثة لطوبوغرافية اللغات، وجودها في لغات أخرى. وهذا يستدعي ما يمكن أن يسمّى بنك معلومات لدعم البحث اللغوي الحديث. وتوسط اللغة العربية يعني أيضاً أنه بإمكاننا الاستفادة من البحوث الكثيرة المتوفرة من نظم اللغات الطبيعية الأخرى.
ب- حدة الخاصية الصرفية
تتميزُ اللغة العربية بالاطراد الصرفي شبه المنتظم، إضافة إلى وجود التعدد الصرفي كتعدد صيغ الجمع (كاتبون، كتبة، كُتّاب). مما يزيد في قابلية اللغة للمعالجة الحاسوبية. هذه المعالجة مُدخل طبيعي لمعالجة المنظومة الشاملة للغة العربية. وهنا يُعد معالج الصرف الآلي morphological processor مقوماً أساسياً في مكننة المعجم العربي، وتطوير نظم آلية للإعراب الآلي، والتشكيل التلقائي.
ج- المرونة النحوية
في لغتنا حرية نسبية في ترتيب الكلمات داخل الجملة، كالتقديم والتأخير والحذف والإبدال النحوي. هذه المرونة مصدر صعوبة وتحد في صياغة قواعد النحو لأغراض المعالجة الآلية، لأنها صممت أصلاً لتلائم واقع اللغة الإنجليزية التي تتسم بالصرامة في ترتيب الكلمات في الجمل. ويحتاج نحو الإنجليزية إلى ما يقرب من أَلف (1000) قاعدة رياضية، بينما وصل عدد أمثال هذه القواعد لنحو العربية غير المشكول إلى ما يزيد على اثنتي عشرة (12) ألف قاعدة، كما وجد الدكتور نبيل علي. ()
د- الانتظام الصوتي
تتميز القواعد الصوتية للعربية باطرادها. ويتسم نظام مقاطعها الصوتية ونبرها بالبساطة. إذ تبدأ بحرف صامت، ولا تتضمن أكثر من صامتين. ولهذه الخاصية أهمية كبيرة في توليد الكلام العربي Speech synthesis، وتمييزه Speech recognition. ويصير تطريز أنماط النبر المولد آلياً سهلاً ليبدو الصوت المولد كأنه طبيعي وليس ربوطياً robotic. وبهذا يسهل تمييز الكلمات المنطوقة آلياً، ومن ثمّ التعرف على بنية الكلمات المنطوقة.
هـ. حساسية السياق Contextual Sensitivity
ومعناه تآخي العناصر اللغوية مع ما يحيط بها، أو يرد معها من عناصر. ففي الكتابة، يتوقف شكل الحرف على موقعه في الكلمة. وعلى مستوى النحو نجد تطابقاً، مثلاً، بين الصفة والموصوف، والفعل والفاعل...إلخ. وهذا يعني أن المعالجة الآلية للعربية تزداد صعوبة وتعقيداً.
و- تعدد طرق الكتابة، وغياب عناصر التشكيل
يمكن كتابة العربية بطرق ثلاث: كتابة تامة التشكيل، وكتابة مشكولة جزئياً، وكتابة خالية من التشكيل. وقد نشأت لغتنا دون تشكيل؛ وشاع التغاضي عنه حتى صار انعدامه عادة مترسخة في الكتابة والقراءة. وهذا له أثر سلبي معلوماتي، إذ تكثر القراءات المحتملة (ومن ثم المعاني) لكل كلمة. (مثل كلمة وجد، هل الواو أصلية، أو أداة عطف؟ إضافة إلى القراءات الأخرى)، وفي العربية مواطن لبس أخرى (قد لا تنفرد بها)، كاللبس المعجمي في معنى "عين" واللبس التركيبـي في شبه الجملـة "شاعر النيل العظيم"، هل العظيـم صفة للنيل أم الشاعر؟ وهذا يؤدي إلى لبس مركب بأنواع متعددة معقدة المستويات multi-level ambiguity. لذلك، غياب التشكيل مشكلة معقدة أمام المعالج الآلي للنص العربي. ويمكن أن تجرب استرجاع كلمة "عِلم" (مفرد علوم) من نصوص مخزنة حاسوبياً، ليعطينا الاسترجاع جميع حالاتها الاسمية والمصدرية والفعلية. وهذا يستدعي تقديم وسيلة برمجة آلية لتشكيل النص تلقائياً. وقد استطاع د. نبيل علي على مدى خمس سنوات (1988-1993) تطوير نظام آلي لإعراب النصوص العربية. ()
ز- ثراء المعجم واعتماده على الجذر
يتصل تنظيم معجم أي لغة مع طبيعة عمليات تأليف كلماتها. لذلك من الطبيعي أن يجري تنظيم المعجم العربي على أساس الجذر، وهو أصل الكلمة، وليس على الترتيب الألفبائي. فشجرة المفردات العربية (مثل اللغات الجذرية الأخرى) قليلة الجذور، كثيرة الأوراق. فمن الأساس (ف ع ل) ينتج خمس عشرة (15) صيغة من مزيدات الأفعال، تنتج كل منها صيغاً مطردة وغير مطردة للمصادر وأسماء الأفعال والمفعول والمكان والزمان، وصيغ التفضيل والمبالغة والجموع. وهذا يعني أن المعجم العربي ليس مجرد قائمة مفردات، بل بنية معقدة من العلاقات التي تربط بين مشتقات الجذور وصيغ الأفراد والجموع والمترادفات وما شابه.
ح- التماسك القوي بين عناصر منظومة اللغة العربية
ويظهر هذا التماسك فيما يأتي:
(1) التداخل الشديد بين منظومتي الصرف والمعجم.
(2) العلاقة العضوية بين النحو والصرف.
(3) التداخل الشديد بين منظومتي الصرف (المورفولوجي) والصوتي (الفونيمي)، كما يتضح في الإبدال والإعلال عند تحديد بنية الكلمة.
(4) الصلة الوثيقة بين مباني الصيغ الصرفية ومعانيها. مثلاً، انفعل يفيد المطاوعة، وتفاعل يفيد المشاركة. أي أنه لا يوجد فصل بين المبنى والمعنى.
هذا التماسك مفيد في المنظور المعلوماتي، لكنه يزيد من صعوبة النظم الآلية. إذ يجعل من الصعب الفصل بين المعالجات الآلية للنحو الآلي عن المتعلقة بمعالجة صرفها ومعجمها. ويستدعي ذلك حواسيب ذات إمكانات كبيرة جداً لمعالجة اللغة العربية آلياً. والتماسك مفيد لنظم الفهم الاوتوماتي في غياب التشكيل. ()
العلاقة بين تكنولوجيا المعلومات واللغة العربية
بسبب الأساس الإنجليزي لتوجهات تكنولوجيا المعلومات، فإن المواجهة بينها وبين اللغة العربية، غير متكافئة. ومظاهر هذا التوجه نجدها في:
(1) تصميم أكثر لغات البرمجة بالإنجليزية.
(2) استخدام شفرات لتبادل البيانات مصممة أصلاً مع الأبجدية الإنجليزية.
(3) تصميم أساليب نظم تخزين المعلومات واسترجاعها هو على أساس أن اللغة الإنجليزية هي الهدف.
(4) القسم الأكبر من مكتبة البرامج الجاهزة هو في الإنجليزية.
(5) معظم الكتب والمراجع والبحوث ذات العلاقة مكتوبة بالإنجليزية.
هذا، إضافة إلى أزمة لغتنا الحادة كما تظهر في قصور التنظير بها، وقصور المعاجم العربية، وقصور أساليب تعليم اللغة، وثنائية الفصحى والعامية. وهي عوائق حقيقية أمام جهود معالجة اللغة العربية آلياً. () ولقد شهد العالم (الغربي بخاصة) على مدى النصف الثاني من القرن العشرين ثورة حقيقية في مجال اللسانيات، أدت إلى ظهور عدد من النماذج اللغوية، وضع بعضها لغويون، ووضع بعضها حاسوبيون. ذكر منها د. نبيل علي اثني عشر نموذجاً.
الوضع الحالي لتعريب المعلوماتية
حققت حوسبة اللغة العربية إنجازات مهمة في العقدين الأخيرين، بجهود عدة مؤسسات مثل صخر ومايكروسوفت. إلا أن الكثير بقي منتظراً للتحقق. وتظهر هذه الإنجازات فيما تحقق للحرف والكلمة والجملة.
فعلى صعيد الحرف، تم تطوير نظم تشغيل OS ثنائية اللغة (ع/E)، ابتداء من نظام صخر msx. كما تحققت إنجازات مهمة على مستوى العتاد hardware مثل وحدات الإدخال والإخراج I/O بما فيها لوحات المفاتيح والطابعات، وشاشات العرض، وبرامج تنسيق الكلمات WP، وقراءة النصوص آلياً باستخدام الماسحات الضوئية للحروف OCR.
وعلى مستوى الكلمة طُوِّر معالج صرفي آلي، قادر على تحليل الكلمة إلى عناصرها الاشتقاقية والتصريفية من لواحق وسوابق. مما يسر اكتشاف أخطاء التهجئة. كما طورت نظم بحث في النصوص العربية على أساس صرفي، وتم بناء قواعد بيانات معجمية (ق ب م LDB) مع معالج صرفي آلي يتعامل مع النص العربي على مستوى الجملة.
وعلى مستوى الجملة، طُور نظام آلي لإعراب الجملة العربية، مما سهّل تطوير نظام آلي لتشكيل الجملة تلقائياً. وهذا مكّن من تطوير برنامج تحويل النصوص العربية إلى مقابلها المنطوق Text to Speech (TTS).
ومع ذلك، يمكن أن نشير إلى بعض مناحي القصور في هذا الميدان، ومنها:
أ- محاولة استيعاب العربية في نطاق التقنيات المصممة أصلاً للغة الإنجليزية، وهذا خطأ جوهراً وشكلاً.
ب- معظم جهود التعريب هي خارج حدود الوطن العربي. أو من مؤسسات أجنبية.
ج- غياب البحوث الأساسية في مجال اللسانيات أو إنَّها دون الحد المطلوب.
تكنولوجيا المعلومات كأداة للغة العربية
منذ ظهور الحاسوب في أواخر الأربعينات من القرن الماضي، وصلته باللغة تتوقف وتزداد تأصيلاً في كلا الاتجاهين. فكون اللغة تجسيداً لما في الذهن البشري من نشاط، واتجاه الحاسوب لمحاكاة وظائف الإنسان وقدراته الذهنية فرض هذا اللقاء المتواصل، مع تفاعل علمي وتقني بصورة لا مثيل لها. وهذا أدى إلى الثالوث: "اللغة- الحاسوب- التطبيق". فقد تهيأت اللغة للمعالجة الآلية بدخولها مجالات التحليل الرياضي والمنطقي والإحصائي. وتهيأ الحاسوب للقائه مع اللغة بالسرعة الفائقة، وضخامة الذاكرة، وصغر الحجم، وأساليب الذكاء الاصطناعي، ولغات البرمجة الراقية. وأما التطبيق فقد شق السبيل إلى مجالات التعليم والإنسانيات والنظم الخبيرة.
ويمكن حصر ميادين تكنولوجيا المعلومات كأداة للغة العربية فيما يأتي:
أ- أداة للإحصاء اللغوي
وهذا يشمل مجالات عدة، نذكر منها:
(1) التقييم الكمي لبعض خصائص اللغة، مثل معدل استعمال الحروف والكلمات والصيغ المصرفية في النصوص المختلفة.
(2) التوصيف الكمي لبعض العلاقات اللغوية، أو علاقات النصوص، مثل العلاقات بين نوع المبتدأ، ونوع خبره، أو طول الجملة، أو يسر تعليمها.
(3) تفسير بعض الظواهر اللغوية، مثل ظاهرة القلب لدى الأطفال (جبذ محل جذب)..
ب- في معالجة الكتابة العربية
يمكن تطبيق الحوسبة في نظم قراءة آلية للنصوص المكتوبة طباعة أو باليد. أما إظهار النصوص وطباعتها، فقد قطع شوطاً متقدماً.
ج- أداة للصرف العربي
نعني بذلك معالجات آلية للصرف العربي، قادرة على القيام بعمليات التحليل والتركيب لمفردات اللغة. فالجزء التحليلي يفكك الكلمة إلى عناصرها الأولى من اشتقاقية وصرفية وإعرابية، وتبيان السوابق واللواحق. والجزء التركيبي هو عكس ذلك.
د- أداة للنحو العربي
هنا يقوم نظام النحو الآلي بتفكيك الجملة إلى عناصرها الأولية من أسماء وأفعال وحروف، ويحدد الوظيفة النحوية لكل عنصر (فاعل، مفعول،...) وقد قام د. نبيل علي بتطوير نظام تحليل نحوي للغة العربية، مشكولة وغير مشكولة. يعرب الجملة، ومن ثم يشكلها تلقائياً. ()
هـ - أداة في الفهم الأوتوماتي للسياق اللغوي
الهدف الأسمى لمعالجة اللغات الإنسانية آليا هو الوصول إلى نظام أوتوماتي يتيح فهم السياق اللغوي في صورته المنطوقة. وليس هذا سهلاً، فالمطلوب أولاً التصدي لمعضلة "المعنى في اللغة" على المستوى المعجمي والمنطقي والسياقي.
و- أداة لتحليل الإنتاج الأدبي وتحديد أساليب الكتّاب
جرى استخدام أساليب الإحصاء والتحليل اللغويين في تحليل الإنتاج الأدبي لتحقيق ما يأتي:
(1) تحقيق التراث، للتأكد (مثلاً) من تفرد هوميروس بتأليف الألياذة.
(2) التقييم الكمي لخصائص أساليب الكتّاب.
(3) التحديد الموضوعي لأثر السابقين على اللاحقين من كتاب وشعراء.
(4) فهرسة النصوص آلياً. (المعجم المفهرس لألفاظ القرآن الكريم).
(ز) أداة لمكننة المعجم العربي
يعاني المعجم العربي حالياً، من أزمة حادة مزمنة. من مظاهرها عزوف الناطقين بالعربية عن استعمال معاجم لغتهم، مع قصور حاد في المصطلحات. ومن أسباب ذلك:
(1) جمود النظر إلى آليات (وسائل) تكوين الكلمات word formation في العربية. وطغيان الاشتقاق على الآليات الأخرى كالتركيب والنحت.
(2) إهمال العلاقات بين المفردات والفصائل اللغوية مثل علاقات الترادف والتضاد والاشتراك اللفظي.
(3) إغفال البعد التاريخي في البحث المعجمي العربي. ولا توجد دراسات شاملة لتطور معاني الألفاظ.
(4) الانفصال الحاد بين مجامع اللغة وجماعاتها، وبخاصة في عمليات التحديث المعجمي والاستخدام الفعلي في المجالات المختلفة. ولقد خطا مجمع اللغة العربية الأردني خطوة واسعة رائدة في عمله في "معجم ألفاظ الحياة".
(5) ضمور عنصر الدلالة (المعنى) في الدراسات المعجمية.
(6) فوضى لغة تعريف مفردات المعجم، وعدم التزامها بأنماط محددة.
(7) إغفال الجهود الجارية للسانيات الحاسوبية في تحليل بنية المعجم، واستخدام تكنولوجيا المعلومات في مكننة المعاجم، ودعم جهود العمل المصطلحي.
وسنتحدث عن المعاجم وصناعتها لاحقاً في هذه المحاضرة.
ووجوب المكننة automation في المعجم العربي تحتمه بنية هذا المعجم، وغنى مفرداته، وتعقد علاقاته. ونقصد من وراء ذلك ما يأتي:
(1) توفير خدمة أفضل للمستخدم باستعمال أساليب متطورة لاسترجاع المعلومات وفرز المفردات، واستخراج قوائمها حسب معايير محددة.
(2) حصر التعابير المشكولة اصطلاحياً Idiomatic مثل " أجهش بالبكاء، الأمن الغذائي..."
(3) محاصرة ظاهرة الإزاحة الدلالية Semantic shift التي تطرأ على المفردات العربية كتحولها من وصف إلى اسم...
(4) تنميط لغة تعريف معاني المفردات.
(5) إمكان دمج المعجم الممكنن في النظم الآلية الأشمل مثل نظم الإعراب الآلي والفهم الأوتوماتي للنصوص، ومن ثم الترجمة الأوتوماتية.
ومن الجهود الخيّرة في هذا الميدان، ما قام به د. نبيل علي في تجهيز قاعدة لذخيرة النصوص العربية، ثم تحليلها صرفياً، باستخدام معالج صرفي آلي، وتحوي هذه الذخيرة على ما يزيد على (12) مليون كلمة. () وقد أخبرنا الدكتور مأمون حطاب أنهم خزنوا ما يربو على 50 مليون كلمة.
(ح) أداة لدعم العمل المصطلحي
يكاد يكون عمل المصطلحات الشغل الشاغل للمجامع العربية اللغوية، ومع ذلك نذكر عدداً من التحديات التي يواجهها عمل المصطلحات.
(1) ندرة التأليف والترجمة باللغة العربية، وبخاصة في المجالات العلمية، مما لا يعطي فرصة لتأصيل المصطلح، وزيادة استساغته، وشيوعه وتوحيده.
(2) المعارضة الشديدة لتعريب العلوم، وعلى عدة مستويات.
(3) ظاهرة الانفجار العلمي، مما يزيد في معدلات طلب المصطلحات زيادة تعجز عن تلبيتها الآليات الحديثة.
(4) إهمال الرصيد التراثي للعربية، وهو رصيد يمثل مخزوناً استراتيجياً للمصطلحات.
(5) عدم كفاية المعاجم المتخصصة الممهدة لدخول المصطلح المعجم العام.
(6) إغفال المجامع اللغوية ثورة اللسانيات والمعلومات.
(ط) أداة في مجال الترجمة الآلية.
من قضايا الترجمة الآلية الأساسية، نذكر:
(1) الاستعارة والمجاز، والأساليب البلاغية.
(2) نطاق المعلومات subject domain وشريحة اللغة sublanguage التي تتعامل معها نظم الترجمة الآلية. عموماً، تركز أكثر النظم على موضوع واحد أو نطاق ضيق لموضوعات متقاربة لغوياً ومعرفياً، لتقليص لبس معاني الكلمات.
(3) التباين بين اللغات، وبخاصة المندرجة تحت فصائل لغوية مختلفة، وهذا مشكلة أساسية في نظم الترجمة الآلية.
(4) ومعضلة أخرى، هي دقة الترجمة الآلية، وأسلوب تقييم نظمها المختلفة، مما يؤثر على حجم التدخل البشري المطلوب قبل ترجمة النص أو بعدها.
وعموماً، فالترجمة إلى العربية أبسط من الترجمة منها.
(ي) أداة لتعلم اللغة العربية وتعليمها.
من مشكلات ذلك حاسوبياً، نذكر:
(1) غياب عنصر الكلام المنطوق.
(2) صعوبة محاكاة المواقف الطبيعية للاستخدامات اللغوية.
(3) حاجة معظم البرامج إلى سعة تخزين هائلة لحفظ المادة التعليمية.
وتوجد محاولات مشجعة لاستخدام الحاسوب التعليمي لتدريس قواعد اللغة والأبجدية للصغار. وإتقان تهجئة الكلمات، وتمييز أقسام الكلام، وإعراب الجمل، واستخلاص الجذور، وتصريف الكلمات، وتكوين جمل قصيرة، والتدريب على استعمال المعجم العربي.
(ك) توليد الكلام العربي آلياً
وهذا تحد آخر أمام مختصي الذكاء الاصطناعي، لتطوير نظم قادرة على تمييز الكلام المنطوق، وفهمه آلياً، والتعرف على شخصية المتكلم، ومحاكاة النطق البشري، وحتى على مستوى الكلمات المنفردة. ()
بين يدي الفجوة الرقمية
مصطلح "الفجوة الرقمية" مصطلح جديد تفتق عنه أذهان خبراء التنمية، ويقصد به "الفجوة الفاصلة بين من يملك المعرفـة وأدوات استغلالهـا، وبين من لا يملكها وتنقصه أدواتها". ويعتبرها الأستاذان د. نبيل علي و د. نادية حجازي فجوة الفجوات أو الفجوة الأم كما جاء في مقدمة كتابهما الرائع "الفجوة الرقمية".() لأن وجود هذه الفجوة يؤدي إلى وجود الفجوات الأخرى: الفجوة العلمية والتكنولوجية، والفجوة التنظيمية والتشريعية، ثم فجوة الفقر وصولاً إلى فجوة البنى الأساسية التحتية؛ بسبب غياب السياسات وعدم توافر شبكات الاتصال، والقصور في تأهيل القوى البشرية. وأول ظهور لهذا المصطلح كان سنة 1995 في تقرير لوزارة التجارة الأمريكية.
والحاجة ماسة إلى خطاب جديد في الفجوة الرقمية يتجاوز حدود التكنولوجيا والاقتصاد ليتناول الأبعاد الاجتماعية والثقافية.
وتؤدي اللغة دوراً رئيساً في اقتصاد المعرفة المنتظر أن يتعاظم مع اتساع مجالات المعلوماتية كثيفة اللغة، مثل التطبيقات التعليمية edu-ware والتطبيقات الثقافية culture-ware.
إن وجود العدو الصهيوني غرب نهر الأردن، وتقدمه التكنولوجي الذي أدى إلى فجوة رقمية شاسعة بينه وبين العالم العربي، يفرض علينا ميداناً آخر للصراع. وفي عصر صارت المعلومة فيه أقوى من المدفع أثراً، لا يجوز لنا أن نتخلف عن الركب التقدمي العلمي والمعلوماتي. ونحيل المهتم إلى كتاب "الفجوة الرقمية" ليرى التفاصيل المذهلة المخيفة.
وقد أظهر المؤتمر الدولي حول الحوسبة وعلم المعلومات الذي عقد مؤخراً في تونس، أَن النوايا الطيبة لا تعوض العمل الجاد حسب خطة قويمة. كما أظهر أن قيادة الدول المتقدمة الغربية، ستظل بعالميتها على مدى المستقبل المنظور. لكنه أظهر أن دولاً أخرى تستطيع أن تلحق بهذا التقدم عتاداً وبرامج وبشرا، كما في الهند وغيرها.
والمؤسف، أننا في العالم العربي نحتاج إلى جهود مركزة موحدة لنلحق بالركب العالمي. ولم تقم الجامعة العربية أو غيرها من المؤسسات بإنشاء مركز عربي موحد، يستقطب الكفاءات، وينتج الأبحاث في كل ميادين المعلوماتية واللغة، ممهداً لإنتاج عتاد وبرامج تطبيقية على مستوى العالم العربي، لتكون ذا جدوى اقتصادية. ومن دون جهد عربي موحد منظم. فستبقى إنجازاتنا ضعيفة محدودة، أميل إلى الفردية، وعرضة للموت.
الفجوة الرقمية واللغة العربية
نتحدث هنا عن الفجوة في ميدانين، أحدها نظري تطبيقي عربي، وآخر تطبيقي عالمي. الميدان الأول هو الفجوة في استخدام اللغة العربية، وسنفصل النظر في ذلك في الفقرات الآتية. ولكن نتناول أولاً فجوة المحتوى الرقمي العربي.
فجوة المحتوى الرقمي
يعبر المحتوى عن وجود المعرفة بشكل رقمي digital على الحواسيب والشبكات الداخلية internet والشبكات الخارجية العالمية internet extranet. ويشمل المحتوى مجالات متنوعة، مثل النشر، والأعمال، والمكتبات والإدارة الحكومية e-gov، والعلم والتكنولوجيا، والصحة، والثقافة، والتراث، والسياحة، والتسلية، ومعلومات عامة عن المنظمات الحكومية وغير الحكومية والإقليمية، وغير ذلك.
وتوجد مؤشرات لقياس المحتوى في لغة من اللغات. منها عدد الصفحات بلغة ما (pages)، وعدد المواقع (sites)، ومدى استعمال هذه المواقع (hits)، وتقييس استعمال هذه اللغة (standards)، ووجود محركات بحث (search engines)، وأدلة (directories)، وكذلك عوائد الدعاية والإعلان.
وبما أن الاقتصاد هو المحرك الأساس للنشاط العالمي، فان المعرفة صارت أساساً له، وتتجسد بشكل رقمي في الحواسيب، من خلال قواعد البيانات وقواعد المعرفة، وعلى الشبكات. ومجمل ما يوجد من معلومات في لغة ما بشكل رقمي هو إما أَن يكون مخزوناً خارجياً offline أو داخلياً online. وتزداد أهمية المحتوى وعائداته مع ازدياد المستخدمين للإنترنت والحواسيب. وتقاس الفائدة بعدد المستخدمين المتكلمين للغة المحتوى المعني.
في سنة ألفين واثنين (2002) وصل عدد مستعملي الإنترنت عالمياً إلى خمسمئة وستين (560) مليون مستخدم، ونسبة متكلمي غير اللغة الإنجليزية منهم هي 59.8%. بما يدل على أهمية المحتوى بغير الإنجليزية. وقد وصل عدد الصفحات على الإنترنت web page في تموز 2002 إلى حوالي (313) بليون صفحة، نسبة اللغة الإنجليزية منها 68.4%. وتليها اليابانية فالألمانية فالصينية. وعلى الرغم من أن اللغة العربية هي في اللغات الست الأولى من حيث عدد المتكلمين، فإنها ليست في المراتب العشر الأولى على الإنترنت.
وان توفير المعرفة وتحويلها إلى معلومات جعل من تكنولوجيا المعلومات (ت م IT) أداة هائلة في وضع المعرفة في متناول البشرية. وسهولة نقلها وانتقالها يجعلها أداة تنمية اقتصادية وثقافية وأمنية. وللنجاح في ذلك، لا بد للدول العربية من اعتماد مبادرات على مستوى الدولة والقطاع الخاص لدعم البحوث والتطوير. وزيادة المحتوى الرقمي، كما أشرنا. سيعود بفوائد جمة اقتصادية واجتماعية وثقافية. وهو ضرورة ملحة لبناء الاقتصاد المعرفي، والتقدم العلمي. ()
فجوة استخدام اللغة العربية
تقاس فجوة الاستخدام اللغوي بمدى كفاءة توظيف اللغة على المستوى الفردي والجماعي، ومن هذه الوظائف: التهاتف والتراسل والتفاوض. والحوار عن بعد، والنشر الإلكتروني، والورقي، والبث الإعلاني، والبحث المعلوماتي، والتحليل الأسلوبي، ومدى التباين بين اللغة التصويرية المفترضة، واللغة الواقعية المستخدمة، وظاهرة تعدد اللهجات والتباين فيما بينها. مع اهتمام بأمرين هما: الازدواجية اللغوية، والثقافية اللغوية.
الازدواجية اللغوية Dyglossia
ويقصد بها ازدواجية استخدام الفصحى والعامية في المجالات المختلفة، لأسباب متنوعة، نذكر منها
(1) أسباب تاريخية، فبعض اللهجات موغل في القدم.
(2) أسباب سياسية، وتتمثل في اللهجة الشرسة على هوية الأمة وقيمها ولغتها.
(3) أسباب نابعة من اللغة نفسها، كالزعم بصعوبة الفحصى، وعدم تطورها، أو مواءمتها للعصر.
(4) أسباب تعود للناطقين بها... فقد فشل الجميع في حمايتها وتطويرها، من ساسة كان عليهم إصدار تشريعات تلزم بتنفيذ قرارات المجامع اللغوية، ومن أكاديميين لم يستعملوها كتابة وتأليفاً، ومن لسانيين لم يحدثوا حركة الإصلاح اللغوية نشطة مستدامة.
وتحول خطاب تناولنا لظاهرة الازدواجية إلى سجال عقيم بين الداعين إلى استبدال العامية بالفصحى، متهمين المتشبثين بالفصحى بالجمود والتخلف، وبين المتمسكين بالفصحى الذين اتهموا الفريق الآخر بالخيانة والتآمر والتنازل عن الهوية، والتخاذل العقلي أمام الغرب.
ويمكن الإشارة في ظاهرة ازدواجية اللغة إلى أربعة أمور أساسية هي:
(1) ازدواجية أم ازدواجية وتعددية. هل توجد فصحى واحدة، أم أكثر من فصحى؟ وهل ستؤدي العاميات إلى شرذمة الكيان العربي على ضعفه؟
(2)العامية، تطور أم انحطاط؟ فمن الخطأ قياس العاميات العربية على تطور العاميات الأوروبية، وتطورها اللغوي. فالعامية عندنا، عموماً، لغة بسيطة لا تستطيع التعبير عن التعابير المركبة؛ وهي غير قابلة للتطور عن طريق الاحتكاك. فالفصيحة تتطور وتثرى عن طريق الاحتكاك اللغوي، وعن طريق الترجمة، ويمكن متابعة تطور "فصيحة الإعلام" على مدى قرن. مقارنة "بعامية الإعلام" لنرى الفروق. فالعامية سطحية استهلاكية، حبيسة أنماط تركيبية محدودة، مع فقر في الرصيد اللغوي.
(3) الفصحى والعامية: انفراد أم تعايش؟ وهذه معركة لا لزوم لها، وليست معركة حسم لتقضي إحداهما على الأخرى. فكل منهما ستعيش في أفلاك خاصة بها. ويمكن أن تكون الفصيحة مركزاً تدور العاميات حوله.
(4) الازدواجية: تقارب أم تباعد؟ من المطلوب التقريب بين الفصحى والعامية عن طريق زيادة الاحتكاك اللغوي، بفعل المتغير المعلوماتي. والعوام يفهمون الفصحى عن طريق قراءة القرآن الكريم، والنصوص الدينية والأدبية التراثية والحديثة.
ويمكن أن تساهم تكنولوجيا المعلومات والاتصال (تصم) بدور مفيد فعال في تنفيذ هذا التقارب من خلال:
(أ) أقصى استغلال لأجهزة الإعلام الجماهيري.
(ب) استغلال (تصم) صد دائم للانحرافات بين الفصحى والعامية.
(ج) استغلال (تصم) في دراسات عميقة لتحديد القواسم المشتركة، وأوجه التباين بين اللهجات، وتصنيفها إلى صوتية وصرفية وتركيبية ومعجمية.
ومن واجبات الإصلاح اللغوي تضييق الفجوة بين العامية والفصيحة وتعمل، آنئذ، آليات الانتخاب الطبيعي، والترشيح الجماعي من خلال وسائل الإعلام لاصطفاء أدوات التعبير الملائمة الفعالة. ولنتذكر أن اللغة الفصيحة هي التي صمدت مع القرون، بعد أن رشحت من لهجات القبائل، وتأثيرات اللغات الأخرى.
ثنائية اللغة
هذه مشكلة أخرى صادفتنا في القرن العشرين. إذ وجدت اللغة العربية صداماً حاداً من قبل لغات أجنبية، من بقايا الاستعمار الأُوروبي. وها هي المشكلة تتفاقم مع العولمة والتغريب، وعدم تعريب العلوم، مع ضعف في منظومات التعليم الوطني بدعاوى واهية. وبما أن ثورة المعلومات هي ثورة حقيقية، نعيشها ولا يمكن تجاهلها، فالمفروض فينا أن نتمسك بالعربية كلغة قومية علمية تربوية، وأن نتمكن من الإنجليزية كلغة عالمية أخرى تحمل العلم والمعلومة والتكنولوجيا.
فجوة اللغة العربية: تعليماً وتعلماً
نتحدث أولاً عن فجوة تعليم العربية وتعلمها.
لا يماري عاقل في أهمية تعلم اللغة العربية وتعليمها، وبخاصة، مع دورها المتزايد في تنمية الفرد، وتنمية المجتمع. إضافة إلى أنها جسر التواصل المعرفي بين التخصصات المختلفة. وكون العربية لغتنا الأم، فإنها تكون ركيزة لتعلم اللغات الأجنبية.
وتعليم اللغة لا يترك على عواهنه ليكتسب سليقة، بل هو علم دقيق من أهم علوم المستقبل. تتداخل فيه مجالات معرفية متعددة متنوعة، منها علم النفس، وعلم الاجتماع، وعلوم المعرفة، وعلم الثقافة. وتقاس فجوة التعليم والتعليم بمستوى المناهج والمنهجيات الخاصة باكتساب مهارات التواصل اللغوية: تحدثاً واستماعاً وقراءة وكتابة، وكيفية تنمية الذائقة اللغوية، والقدرة على الإبداع اللغوي.
وأزمة تعليم العربية ظاهرة في كل عناصرها، وعلى جميع المستويات: في الطالب، والمعلم، والمنهج، والمنهجيات.
والفجوة الأخرى هي في التعليم والتعلم بالعربية.
وهي قضية في غاية الأهمية، أحس بها قادة عظام لأممهم أمثال غاندي وهوشي منه وبومدين ومحمد علي. وقد فشلت جهود تعريب التعليم الجامعي، على الرغم من دعم جهات مختلفة. ومع ثبات سورية، وانتقال السودان والعراق وليبيا إلى التعليم بالعربية، على المستوى الجامعي، فقد حصلت ردة في دول أخرى. إذ صارت تدرس التخصصات غير العلمية باللغة الإنجليزية.
وعلى مستوى التعليم دون الجامعي، فقد حصلت ردة أخرى، وصار التباهي بتدريس لغة أجنبية أو أكثر حتى على مستوى رياض الأطفال، جزءاً من دعاية المدارس الخاصة.
وكل ذلك لأسباب واهية. أضف إلى ذلك الجامعات المفتوحة، وجامعات الإنترنت وفروع الجامعات الأوروبية والأمريكية في بلادنا. مما يوضح قوة الهجوم الموجه إلى تعريب التعليم الجامعي.
فجوة المعجم
المعجمية قسمان: معجمية عامة تتعامل مع الوحدات المعجمية المستخدمة في عموم اللغة، ومعجمية خاصة تتعامل مع المصطلحات المستخدمة في المجالات المعرفية المختلفة. وكل من هذين القسمين يخضع للتقسيمات الآتية:
صناعة المعجم Lexicography
علم المعجم Lexicology
حوسبة المعجم Lexical Computation
صناعة المعجم
وتختص بإنتاج المعاجم الورقية والإلكترونية العامة والمتخصصة. ومهامها الرئيسة هي: تجميع المادة العلمية، وتوصيفها، وتحريرها.
علم المعجم
ويختص على المستوى المعجمية العامة بدراسة الجوانب النظرية لمنظومة المعجم، سواء من حيث البنية الصغرى Microstructure الخاصة بالمدخل المعجمي، أو البنية الكبرى Microstructure الخاصة بشبكة العلاقات التي تربط بين مدخلاته.
وتشمل البنية الصغرى دراسة المحتوى الدلالي لوحدة البناء الأساسية للمعجم، وسواء أكانت مفردة أَو مركبة (مثل إنسان العين، خط النار، يجر أذيال الخيبة) والعلاقات الدلالية التي تربط بين عناصر الوحدات المركبة، والعوامل التي تحدد سلوكها التركيبي.
وتسعى البنية الكبرى إلى كشف شبكة العلاقات المعجمية التي تربط بين مفردات المعجم (مثل علاقات الترادف والتضاد والتضمين والاشتراك اللفظي...)، ومن ثَمّ استخراج "النواة المعجمية" lexical Core، أي الحد الأدنى من المفردات الأساسية العامة التي تعرف بوساطتها المفردات الأكثر تخصصاً. وصغر النواة دليل كفاءة.
ويتناول علم المعجم دراسة ظاهرة المجاز، والإزاحة الدلالية Semantic Shift لتغير معاني الوحدات المعجمية، كتحول الصفات إلى أسماء. ويتناول علم المعجم أيضاً، علاقة المعجم بنظام التعقيد، والحدود الفاصلة بين المعرفة المعجمية والمعرفة الموسوعية, كما يشمل علم المصطلح (على صعيد المعجمية المختصة) منهجيات اختيار المصطلح، والتحليل المفهومي له، وآليات توليده.
فجوة المعجم العربي
يمكن تناول فجوات أربع فرعية هي:
فجوة صناعة المعجم، وفجوة التنظير المعجمي، وفجوة المصطلح، وفجوة حوسبة المعجم.
فجوة صناعة المعجم
وتتناول أساليب جمع المادة المعجمية، وصياغة محتوى المدخل المعجمي، وترتيب المداخل، ونطاق التغطية المعجمية.
ومن حيث أساليب جمع المادة المعجمية، نجد أن معاجمنا يتغذى بعضها على بعض، وتتبع أساليب تقليدية في جمع المادة المعجمية، معتمدة على حصيلة المعجميين، وذوقهم اللغوي، وانحيازهم المعرفي. ولا نزال بعيدين عن استخدام ذخائر النصوص Textual Corporaفي ملاحقة المعاني الجديدة للأَلفاظ.
ومن حيث المدخل المعجمي، اهتم السابقون بالخصائص الصرفية، وبخاصة الاشتقاق وأغفلوا أموراً أخرى، مثل ما يشير إلى مجال الاستخدام (مثلا أهو رسمي أم تجاري أم قانوني...). وغاب عن معاجمنا خصائص المدخل التركيبية، أو السياقات التركيبية التي يمكن أن يرد فيها اللفظ، من مثل نوعية المقالات النحوية المتعلقة بالفعل وما يشتق منه من صفات ومصادر.
هذا، بالإضافة إلى الفوضى في تعريف المعاني. فقد نجد تعريفات فارغة المضمون مثل (نوع من السمك)، أو تعريف العذراء بالبكر، والبكر بالعذراء. يجب أن تكون مادة المعجم قاعدة معارف يمكن للنظم الآلية أن تنفذ من خلالها إلى المضمون الآلي للألفاظ، وبنيتها المفهومية Conceptual Structure. ويمكن الاستعانة بالمعاجم الأجنبية لوضع التعريف المناسب، حيث يمكن.
وبالنسبة إلى ترتيب المداخل المعجمية، فإن أساس ترتيب المعجم العربي حائر بين الجذر Rootوساق الفعل Stem، أي الكلمة الأصلية التي استوفى مبناها مقوماته دون زوائد أو لواحق. ومعيار الترتيب هو سهولة الوصول إلى المدخل المعجمي المطلوب. وهو الجذع، أي جذع الفعل الماضي للمفرد المذكر فيما يخص الفعل (مثل ضرب، تغلغل). وجذع المفرد المذكر النكرة للأسماء والصفات.
وبالنسبة إلى نطاق التغطية المعجمية، فالشكوى عامة من نقص حاد في معاجم الترادف والتضاد، والتعابير الاصطلاحية، والاستخدام، والمراحل العمرية والدراسية، مثل معاجم الأطفال المصورة. وما زال المعجم التاريخي في مراحله الأولى منذ أكثر من ستين عاماً، وإِن كان اتحاد المجامع العربية، قد تحرك أخيراً للعمل فيه. وعندنا نقص في المعاجم الموضوعية، ومكانز المفاهيم (مثل مكنز روجر الشهير).
فجوة التنظير المعجمي
تخلو الساحة العربية، إلا قليلاً، من المنظرين المعجميين. وتوجد جهود متناثرة في مجلة المعجمية التونسية، ومن قبل بعض المعجميين التونسيين. على أننا سننظر في الأوجه الثلاثة لقصور التنظير المعجمي، وهي:
الدلالة المعجمية Lexical Semantics.
آليات تكوين الكلمات Word Formation Mechanisms.
علاقة المعجم بالنحو
فبالنسبة إلى الدلالة المعجمية، نجد أن أدوار المعاجم تتعاظم في النظريات النحوية الحديثة، وبخاصة نظرية المربط العاملي، والنحو الوظيفي المعجمي، إضافة إلى ما تتطلبه نظم الفهم الأُوتوماتي للنصوص من قواعد بيانات معجمية غنية، تستوفي البيانات الدلالية الخاصة بمعاني الألفاظ، والعلاقات التي تربط بينها. وتحتاج أقسام لدينا جميعاً، سواء الأفعال أو الأسماء أو الصفات أو الحروف إلى دعم كبير من بحوث الدلالة المعجمية. وكل منها يحتاج إلى معالجة نظرية خاصة، إِذ لا يوجد نموذج تنظيري موحد لجميع أقسام الكلم. ولكن يبقى الفعل أكثرها إثارة. وتحتاج الأفعال في العربية إلى تصنيف دلالي، وفقاً للتصنيف المشهور وهو:
أفعال الإِجراء action مثل جرى، تكلم، تناقش.
أفعال الحالة state مثل صمت، شبع، نام.
أفعال الإنجاز acheivement مثل اجتاز، استوعب.
أفعال الإنتاج accomplishment مثل شيّد، ألّف، صمّم.
أما توصيف المعاني، فقد ساد فيه توجهان: الأول تفكيكي Decompositional ومنحاه تحليلي، إذ تحدد معاني الكلمات في هيئة عناصرها الأولية. والآخر علاقي Relational . وينحو منحى جشتاليا، لا يقوم على أساس وجود بنية داخلية للكلمة. إذ يحدد معنى كلمة ما بدلالة العلاقات المعجمية التي تربط هذا المعنى بغيره، من معاني الكلمة ذاتها، أو معاني غيرها من الكلمات، مثل علاقات الترادف والتضمين والاحتواء. وتشمل قائمة العلاقات الترادف مثل عاب وانتقد، أو التضمين مثل كائن حي للنبات والحيوان، والاحتواء مثل احتواء السيارة على المحرك. وفي كلا التوجهين: التفكيكي والعلاقي، ما زالت مساهمة المعجميين العرب قليلة جداً.
آلية تكوين الكلمات
وهنا يظهر طغيان الاشتقاق على الآليات الأخرى كالتركيب والنحت. كما طغى الاشتقاق الثلاثي على غيره من جذور الرباعي والخماسي، التي نحتاج إليها للتعبير عن مفاهيم مركبة، مثل حوسبة، فذلك، رقمن. كما أهملت آليات تكوين الكلمات بإهمال دراسة العلاقات الدلالية بين أشكال التصاحب اللفظي المختلفة من أسماء مركبة. ( مثل كلمة حلقة، إِذ تربط بكلمات أخرى فتعطي معاني مختلفة، مثل حلقة وصل، حلقة زيت، حلقة ذكر...). ( وكان أجدادنا أجرأ منا في تكوين كلمات جديدة، مثل ماهية من ما هو، وهوية نسبة إلى هو، وفذلكة من فذلك...) ونحتاج إلى أسس نظرية للتمهيد لتطوير أدوات برمجية لاستظهار هذه العلاقات الضمنية، وهي أدوات لا غنى عنها في تصميم النظم الآلية، لتحليل مضمون النص وفرعه آلياً.
ويتعامل علم الدلالة المعجمية مع ظاهرة المجاز بأنواعه. وهذه مسألة تحتاج إلى توسع في الدراسات المعجمية المقارنة من منظور العموميات المعجمية.
فجوة المصطلح
وهذه فجوة يمكن أن نجعلها فرعاً من فروع الفجوة المعجمية. على الرغم من كل الجهود التي بذلت ولا تزال تبذل من جهات عدة، فالفجوة في المصطلح موجودة، ولها وجهان: الأول فجوة في أدوات توليد المصطلح، والثانية في توحيد المصطلح. ففي فجوة توليد المصطلح نعاني من قلة الإبداع في آلية توليد الكلمات. فقد أقرت المجامع اللغوية العربية أو بعضها صيغاً للدلالة على أمور معينة؛ وأقرت صيغة تمفعل كفعل مثل قولنا تمحور، وتمركز. وقد قام العلايلي بحصر المباني المصرفية المستساغة صوتياً وتحديد معانيها، ومدى تعلقها بالأصل الذي تفرعت عنه. وطبق ذلك فيما أنجزه من معجميه: المعجم والمرجع(). ومشكلة أخرى هي تبعية المصطلح، فنحن لا نولد العلم، ومن ثمّ لا نولد المصطلح، بل نضع المقابل العربي. وقد نقع في شرك المصطلح المولد خارجياً مع أنه في دلالته يخالف ما نؤمن به.
مثلاً نردد مستوطنات بدل مغتصبات، والجدار العازل، ومثلث الشر. ولا توجد آلية لاختيار التعريب على الترجمة. فأيهما نختار الجينوم، أم السفر الوراثي (مثلاً)؟ علماً بأن التعريب يسهل علينا اختيار ألفاظ أخرى منه مثل جينومي، ولا جينومي، وجينومية... الخ.
كما يجب الانتباه إلى تبديل قد يحصل في تعريف بعض المصطلحات مع الزمن. فمصطلح الخطاب كما ورد في تراثنا الثقافي وبخاصة في القرآن الكريم، يختلف معناه عن مصطلح الخطاب كما عرفه ميشيل فوكو. كذلك مصطلحا النص والتأويل مثلاً.
أما في فجوة توحيد المصطلح فلسنا في حاجة إلى توكيد أهمية ذلك، للتصدي للشرذمة الثقافية أو الفكرية أو العلمية. فكلمة telephone لها خمسة مقابلات (هاتف، مقول، مسرة، ارزيز، تلغراف ناطق)، إضافة إلى التعريف تلفون. وكلمة موبايل للهاتف عندنا خلوي وخليوي وجوال وموبايل وغيرها.
وتوحيد المصطلح يحتاج إلى إلزام والتزام. فعلى منشئي الوثائق الرسمية وغيرها الالتزام بالمصطلح الموجود، مع وجود هيئة تلزم بذلك.
علاقة المعجم بالنحو
علاقة المعجم بالنحو علاقة محورية في منظومة اللغة. ولم يعد المعجم كياناً سالباً وظيفته أن يمد النحو بالمفردات لتكوين الجمل. وجاء تشومسكي بما سماه "الفرضية المعجمية" التي أنهت مسؤولية النحو عن الصرف الذي أحيل بأجمعه إلى المعجم.
وقد تخلف التنظير للمعجم عن التنظير للنحو؛ ربما لقصور النحاة إلى المعجم على أنه تابع للنحو، أو بسبب جمود المعجميين باعتبار المعجم قائمة من المداخل. ويسعى حالياً علم المعجم للحاق بعلم النحو، سالكاً طريقاً مشابهاً لما سلكه النحو، وبخاصة عند تشومسكي. ويتوقع أن يشغل التنظير المعجمي بقضايا مشابهة انشغل النحو بها سابقاً من أمثال: العموميات المعجمية، وإبراز المقيدات التي تحد عمليات التركيب المعجمي، واقتصاديات استخدام الموارد الفسيولوجية في تنفيذها.
حوسبة المعجم
وتشمل الدعم الحاسوبي لإنتاج المعجم، والتنظير له، وبناء قواعد البيانات المعجمية. وتحليل المادة المعجمية، باستخدام أساليب هندسة المعرفة لتمثيل هذه المادة بصورة منهجية تسهل على النظم الآلية التعامل معها. كما تشمل بناء بنوك المصطلحا