هل يستطيع الحاسب فهم لغة البشر من خلال خورزمياته الحديثة

Please log in or register to like posts.
اخبار
عل يفهم الحاسوب العقل البشري

هل يستطيع الحاسب فهم لغة البشر تم تطوير مجموعة من الخوارزميات التي ستساعد في تعليم أجهزة الكمبيوتر معالجة وفهم اللغات البشرية. ستمكّن الخوارزميات الكمبيوتر من التصرف بنفس الطريقة التي يتصرف بها الإنسان عند مواجهته بكلمة غير معروفة. عندما يصادف الكمبيوتر كلمة لا يتعرف عليها أو يفهمها ، فإن الخوارزميات تعني أنه سيبحث عن الكلمة في قاموس (مثل WordNet) ، ويحاول تخمين الكلمات الأخرى التي يجب أن تظهر مع هذه الكلمة غير المعروفة في النص.

ناقشت في منشور سابق هدف فهم عالمنا من خلال عالم المرآة لوسائل التواصل الاجتماعي. وسائل التواصل الاجتماعي هي انعكاس لثقافتنا لأن العديد من المناقشات التي كانت تحدث وجهاً لوجه أو عبر الهاتف تحدث الآن على مواقع مثل Twitter و Facebook. يمكن قراءة هذه المحادثات الرقمية بواسطة أجهزة الكمبيوتر ، ولكن هل تستطيع أجهزة الكمبيوتر حقًا فهم ما يقرؤه؟ الجواب ، نوعا ما. تفهم أجهزة الكمبيوتر لغة الإنسان مثلما نفهم لغة أجنبية أو محادثة تجري في الغرفة المجاورة. يمكنك أن تتخيل صديقًا يستمع إلى مثل هذه المحادثة ويعيد الإبلاغ ، “لا أعرف بالضبط ما الذي كانوا يتحدثون عنه ، لكنه كان شيئًا عن Walmart وضمانًا ممتدًا.” تفهم أجهزة الكمبيوتر اللغة في هذا المستوى تقريبًا ، وسيشرح هذا المنشور كيف يتم ذلك ولماذا يكون مفيدًا.

فهم اللغة من خلال

الإطارات والأدوار يمكن لأجهزة الكمبيوتر أن تبدأ في فهم لغتنا باستخدام الإطارات. يمثل الإطار المفهوم والأدوار المرتبطة به. المثال الكلاسيكي للإطار هو حفلة عيد ميلاد للأطفال. تتبع حفلات أعياد الميلاد سيناريو يتم فيه تحويل الثروة (على شكل هدايا) من والدي الحاضرين إلى فتاة أو فتى عيد الميلاد. يحتوي إطار حفلة عيد الميلاد على أدوار لأجزائه المختلفة ، مثل المكان والترفيه ومصدر السكر. أسبوع واحد ، قد تأخذ طفلك إلى حفلة في المنزل حيث يوجد مهرج وكعك. في الأسبوع المقبل ، قد تجد نفسك في Chuck E. Cheese محاطًا بألعاب الفيديو والكعك. يمكن للكمبيوتر أن يفهم الكثير بمجرد التعرف على الإطار وتعيين أجزاء من الجملة إلى الأدوار.

اقرأ  ما الخطأ في تحسين محركات البحث بشأن تحديثات Google

يمكن زيادة فهم الكمبيوتر عن طريق التعرف على الكيانات المسماة. بدلاً من البحث عن أجزاء أكبر من المعنى تمثلها الإطارات ، يسعى التعرف على الكيانات المسماة إلى تحديد الكيانات المعروفة في ثقافتنا ، مثل جورج واشنطن. يبدأ التعرف على الكيان المُسمى بمصدر بيانات خارجي يسرد كل الأشياء المعروفة ، مثل إصدار قابل للقراءة آليًا من ويكيبيديا. ثم يقرأ برنامج الكمبيوتر تغريداتنا بحثًا عن أمثلة لتلك الكيانات المعروفة.

من خلال تطبيق كل من التعرف على الإطار والتعرف على الكيانات المسماة ، لم يفهم الكمبيوتر تمامًا تغريدتنا ، لكن الكمبيوتر حدد وجود مشكلة في شيء تم شراؤه في Walmart وأنه تم حلها. على الرغم من أن أجهزة الكمبيوتر لا تحقق سوى فهم ضحل عندما تقرأ ، إلا أنها تستطيع قراءة الكثير ، وهذا يسمح لها بالتعرف على الاتجاهات. على سبيل المثال ، يمكن لجهاز الكمبيوتر قراءة Twitter وقياس عدد المشكلات التي تم حلها لكل شركة للتعرف على الشركات التي تقدم خدمة عملاء ممتازة. أو يمكن لشركة معينة ، مثل Walmart ، تجربة خدمة ضمان جديدة ومعرفة ما إذا كانت تعمل بشكل أفضل أم أسوأ من سابقتها.

التغلب على الغموض مع التعلم الآلي يتطلب

كل من التعرف على الإطار والتعرف على الكيانات المسماة أكثر من مجرد البحث عن الكلمات الرئيسية في النص لأن معنى الكلمات يتم تحديده غالبًا من خلال سياقها. نعلم جميعًا أن الوقت يطير كالسهم وأن ذباب الفاكهة مثل الموز. تتغلب أجهزة الكمبيوتر على الغموض من خلال التعلم من الإحصائيات حول النص المحيط. يزيد التعلم الآلي في هذا الشكل من قوة فهم الكمبيوتر.

تذكر أنه تم تحديد إطار Commerce_buy على الرغم من أن كلمة “شراء” لم تظهر في التغريدة. يتم تحقيق ذلك جزئيًا عن طريق اشتقاق الكلمات (تعيين “اشترى” إلى الجذر “شراء”) وجزئيًا عن طريق الإدخال اليدوي للكلمات المحفزة الأخرى مثل “شراء” ، ولكن يتم تعزيز هذه العملية من خلال أنماط التعلم من البيانات المصنفة. التعلم الآلي مطلوب أيضًا للتعرف على الكيانات المسماة. فكر في تغريدة تذكر “واشنطن”. تستخدم أجهزة الكمبيوتر السياق لتحديد ما إذا كان المعنى المقصود هو الشخص أم الدولة أم العاصمة. إذا ظهرت كلمة “سياتل” في التغريدة ، فمن المحتمل أن تشير كلمة “واشنطن” إلى الولاية.

اقرأ  ما الخطأ في تحسين محركات البحث بشأن تحديثات Google

ما هو نوع الفهم هذا؟

من خلال الجمع بين التعلم الآلي والتعرف على الإطار والتعرف على الكيانات المسماة ، يمكن لأجهزة الكمبيوتر تعيين اللغة الطبيعية الإسفنجية للبشر لتمثيل قانوني ملموس. بالطبع ، لا تستطيع أجهزة الكمبيوتر سوى التقاط جزء بسيط من المعنى ، ولكن حتى لو تمكنت من التقاط كل ذلك ، فهل ستفهم أجهزة الكمبيوتر لغتنا بالطريقة التي نتعامل بها؟ لا ، المفاهيم المعبر عنها في FrameNet عالية جدًا. الأدوار المعبر عنها في Commerce_buy هي المشتري والبضائع. كيف يفترض بالكمبيوتر أن يفهم هذه الكلمات؟ والخبر السار هو أن هناك مصادر أخرى للمعنى يمكن قراءتها آليًا تسمى ConceptNet (http://conceptnet5.media.mit.edu/) و WordNet (http://wordnet.princeton.edu/) تحاول تعريف هذه المصطلحات وربطها بشكل هادف بمصطلحات أخرى. أحلم باليوم الذي نوحد فيه هذه الأطر في نظام فهم الكمبيوتر.

إذا تم توحيد هذه الأنظمة ، فقد لا تزال أجهزة الكمبيوتر لا تفهم اللغة البشرية بالطريقة التي نقوم بها لأن لديها شبكة من الرموز فقط. على النقيض من ذلك ، نحن نفهم معنى المصطلحات من خلال التفاعل المادي. نحن نعرف ما تعنيه كلمة “ثقيل” ليس عن طريق تعيينها إلى رموز أخرى ولكن عن طريق تعيينها لمجموعة من التجارب التي تم تذكرها والتي تم ترميزها عندما يتطلب الأمر جهدًا جسديًا لتحريك الأشياء. إنه سؤال مفتوح عما إذا كانت أجهزة الكمبيوتر بحاجة إلى خبرة جسدية لفهم اللغة بشكل كامل.

إلى جانب المشكلة المحتملة المتمثلة في الحاجة إلى الخبرة الجسدية للفهم الكامل ، قد تكون التمثيلات الرمزية المقدمة هنا هشة للغاية بحيث لا يمكنها التقاط التفاصيل الدقيقة للغة البشرية. بالنسبة لمشاركتي التالية حول هذا الموضوع ، سأتحدث عن فهم الكمبيوتر للغة البشرية باستخدام طريقة حسابية جديدة نسبيًا تسمى التعلم العميق. يمثل التعلم العميق المفاهيم باستخدام المتجهات بدلاً من الرموز الذرية. تمثل هذه المتجهات معاني متعددة في وقت واحد ويمكن أن تتحد بطرق مفيدة لتمكين الاستدلال عن طريق القياس. يعمل التعلم العميق على توسيع قدرات أجهزة الكمبيوتر بسرعة ، لذا ابق على اتصال. الوقت يطير كالسهم.

اقرأ  ما الخطأ في تحسين محركات البحث بشأن تحديثات Google

طور باحثون في جامعة ليفربول مجموعة من الخوارزميات التي ستساعد في تعليم أجهزة الكمبيوتر لمعالجة وفهم اللغات البشرية.

في حين أن إتقان اللغة الطبيعية أمر سهل للبشر ، إلا أنه شيء لم تتمكن أجهزة الكمبيوتر من تحقيقه بعد. يفهم البشر اللغة من خلال مجموعة متنوعة من الطرق ، على سبيل المثال ، قد يكون ذلك من خلال البحث عنها في قاموس ، أو من خلال ربطها بكلمات في نفس الجملة بطريقة ذات معنى.

ستمكّن الخوارزميات الكمبيوتر من التصرف بنفس الطريقة التي يتصرف بها الإنسان عند مواجهته بكلمة غير معروفة. عندما يصادف الكمبيوتر كلمة لا يتعرف عليها أو يفهمها ، فإن الخوارزميات تعني أنه سيبحث عن الكلمة في قاموس (مثل WordNet) ، ويحاول تخمين الكلمات الأخرى التي يجب أن تظهر مع هذه الكلمة غير المعروفة في النص.

إنه يعطي الكمبيوتر تمثيلًا دلاليًا لكلمة تتوافق مع القاموس وكذلك مع السياق الذي تظهر فيه في النص.

من أجل معرفة ما إذا كانت الخوارزمية قد زودت الكمبيوتر بتمثيل دقيق للكلمة ، فإنها تقارن درجات التشابه الناتجة باستخدام تمثيلات الكلمات التي تعلمتها خوارزمية الكمبيوتر مقابل أوجه التشابه المصنفة من قبل الإنسان.

قالت عالمة الكمبيوتر في ليفربول ، الدكتورة دانوشكا بوليجالا: “تعلم تمثيل الكلمات بدقة هو الخطوة الأولى نحو تعليم اللغات على أجهزة الكمبيوتر”.

“إذا تمكنا من تمثيل معنى كلمة ما بطريقة يستطيع الكمبيوتر فهمها ، فسيكون الكمبيوتر قادرًا على قراءة النصوص نيابة عن البشر وأداء مهام مفيدة محتملة مثل ترجمة نص مكتوب بلغة أجنبية ، وتلخيصًا لفترة طويلة المقالة ، أو البحث عن مستندات أخرى مماثلة من الإنترنت.

“نحن ننتظر بشكل مثير لرؤية الاحتمالات الهائلة التي ستحدث عندما يتم استخدام مثل هذه التمثيلات الدلالية الدقيقة في مهام معالجة اللغة المختلفة بواسطة أجهزة الكمبيوتر.”

تم تقديم البحث في مؤتمر جمعية النهوض بالذكاء الاصطناعي (AAAI-2016) الذي عقد في أريزونا ، الولايات المتحدة الأمريكية.