بخشی از مقاله


مقدمه ای بر پردازش زبان های طبیعی و زبانشناسی محاسباتی


چکیده :

پردازش زبان های طبیعی یکی از زیرشاخه های با اهمیت هوش مصنوعی است. هدف، تحلیل زبان طبیعی و در نهایت نولید زیان طبیعی با استفاده از تئوری های محاسباتی از زبان و انجام پردازش های مفید مربوط به زبان می باشد. زبان طبیعی حایگزین مناسبی برای رابط های کاربری موجود می باشد و علاوه بر سرعت بخشیدن در انجام امور به سهولت استفاده از سیستم ها می افزاید. از حوزه های کاربردی مهم پردازش زبان های طبیعی می توان به سیستم های درک و تولید گفتار، رابط های کاربری پردازش زبان های طبیعی، سیستم های پاسخ به سوال، تولید متن، و ترجمه ی ماشینی اشاره کرد. در ادامه به نقش پردازش زبان طبیعی در تعامل انسان و کامپیوتر و کاربردهای مهم این حوزه می پردازیم.

کلمات کلیدی : پردازش زبان های طبیعی، پردازش گفتار، ترکیب گفتار، صوت شناسی، آوا شناسی، ساختار شناسی،

تعامل انسان و کامپیوتر.

مقدمه :

این ایده که کامپیوترها بتوانند زبان انسان را تحلیل کنند به قدمت ساخت کامپیوترها برمیگردد. [1] پردازش زبان های طبیعی کمک بسیار زیادی به ارتقا رابط کاربری و ارتباط انسان ها با کامپیوتر می کند .تصور کنید انسان ها در هر موقعیتی با زبان خودشان با کامپیوترها ارتباط برقرار کنند. این ایده می تواند توسط تکنیک های پردازش زبان های طبیعی محقق شود

هدف از این رشته استفاده از رایانه برای انجام کارهای مفید مربوط به زبان انسان همانند برقراری ارتباط میان انسان و کامپیوتر، ارتقا و بهبود ارتباط انسان با انسان و پردازش های مفید مربوط به متن یا گفتار می باشد. [1] به طور کلی هدف این رشته ساخت مدل های محاسباتی از زبان طبیعی برای تحلیل و در نهایت تولید زبان طبیعی می باشد. [2]

.1 معرفی بعضی از کاربرد ها

.1-2 ترجمه ماشینی Machine Translation

بیایید نگاهی بیندازیم به یکی از کاربردی ترین وظایف شاخه پردازش زبان طبیعی، که به کاربران غیرانگلیسی این امکان را می دهد که به هزاران اطلاعات علمی در وب که به زبان انگلیسی می باشد، دسترسی داشته باشند. هدف از ترجمه ماشینی ترجمه ی یک سند از یک زبان به زبان های دیگر به صورت خودکار می باشد. ما به دنبال ساخت سیستم های هوشمندی هستیم که قوانین دستوری هر زبانی را به طور کامل در ترجمه متون رعایت کند.

.1-3 پاسخ به سوال مبتنی بر وب Question answering

پاسخ دادن به سوال مبتنی بر وب تعمیم یافته ی یک جستجوی ساده در اینترنت است با این تفاوت که کاربر به جای جستجوی کلمه یک سوال کامل را بپرسد [1] بدیهی است که برای تحقق یافتن این امر احتیاج به دانش وسیعی در حوزه ی زبان شناسی برای شناسایی کلمات درون سوال، تحلیل سوال و جواب دادن به آن می باشد. البته ناگفته نماند که برای جواب دادن جدای از درک سوال و قدرت تحلیل احتیاج به پایگاه داده ی قوی ای از کلمات و اطلاعات وسیعی در زمینه های مختلف می باشد.

بعضی از این سوالات همانند سوالات تعریفی و تاریخی، در حال حاضر توسط موتورهای جستجو پاسخ داده می شوند اما برای سوالات پیچیده تر احتیاج به استخراج اطلاعات از متن های درون وب، انجام استنتاج توسط اطلاعات شناخته شده و خلاصه سازی از متن های درون وب می باشد.[1]

از سیستم های پاسخ به سوال نه تنها در وب بلکه می توان در ادارات ، موسسات و کارخانجات به منظور اطلاع از داده های موجود استفاده نمود.

.1-4 استفاده از زبان طبیعی برای پایگاه داده :

به منظور مدیریت و نگهداری داده ها به طور گسترده ای از کامپیوتر ها استفاده می شود به عنوان مثال برای رزرو بلیط، کتابخانه، در بانک ها و برای مدیریت داده ها در شرکت های مختلف و ... از آنها استفاده می شود. معمولا برای استفاده از چنین سیستم هایی باید تخصص مورد نیاز را کاربر داشته باشد. هدف از رابط کاربری زبان طبیعی از میان برداشتن این مانع می باشد. تنها از کابر انتظار می رود که توسط زبان طبیعی بتواند با کامپیوتر ارتباط برقرار کند.

برای مثال در یک کتابخانه کاربر برای پیدا کردن کتاب موردنظر خود باید کتاب خود را از سیستم توسط زبان طبیعی درخواست کند. جواب هم باید به زبان طبیعی باشد : کتاب موجود است اما در حال حاظر به امانت سپرده شده و یا کتاب در قفسه 15 ردیف 4 به شماره 135422 می باشد. برنامه فLIFER توسط ت1978 Hendrix و INTELLECT توسط1977 Harries از جمله سیستم های پایگاه داده ای هستند که از زبان طبیعی به عنوان رابط کابری استفاده می کنند.

سیستم LIFER از زبان طبیعی به عنوان رابط کاربری برای ارتباط با پایگاه داده ای از اطلاعات نیروی دریایی آمریکا، استفاده می کند


.1-5 استفاده از زبان طبیعی به عنوان رابط کاربری :

در حال حاظر ما برنامه هایی را داریم که از زبان طبیعی به عنوان رایط کاربری استفاده کنند همانند برنامه فUC که در حکم یک مشاور در سیستم فUnix عمل می کند. برنامه به کاربرانی که به تازگی شروع به کار با سیستم کرده اند کمک می کند و هنگامی که کاربر با مشکلی مواجه شد می تواند از آن کمک بگیرد.

برنامه توسط گفت و گو با کاربر درگیر شده و سعی بر این دارد که به کاربر بگوید در آن موقعیت چه کاری باید انجام دهد. برنامه بر اساس اهداف کاربر طراحی و برنامه ریزی شده است . [2] زبان طبیعی حایگزین مناسبی برای رابط های کاربری موجود می باشد و علاوه بر سرعت بخشیدن در انجام امور به سهولت استفاده از سیستم ها می افزاید. برخی از رابط های کاربری موجود که از زبان طبیعی استفاده می کنند به شرح ذیل می باشد :

 
.2 تست تورینگ :

برای بسیاری از افراد، توانایی کامپیوتر برای پردازش زبان به طرز ماهرانه ای که ما انسان ها انجام می دهیم، به عنوان ملاکی برای هوشمندی کامپیوترها تلقی می شود. این باور از آنجا نشات می گیرد که استفاده موثر از زبان جزء اصلی ترین توانایی های شناختی ما در جهان محسوب می شود. اولین فردی که به مفاهیم محاسباتی این باور پرداخت آلن تورینگ ( ( 1950 بود. تورینگ در مقاله خود اقدام به معرفی و طرح مسیله ای نمود که به عنوان تست تورینگ شناخته می شود. آزمون تورینگ در سالف1950 توسط آلن تورینگ، ریاضیدان انگلیسی مطرح گردید. از نظر تورینگ، پرسش » آیا ماشینها میتوانند تفکر کنند ؟ « بیمعنیتر از آن بود که بتوان پاسخ روشنی به آن داد. چرا که نمیتوان تعریف مشخصی برای ارائه داد. بنابراین تورینگ پرسش را به این گونه مطرح نمود: آیا میتوان ماشینی ساخت که آزمون تورینگ را پشت سر بگذارد ؟

آزمون بدین صورت است که شخص ثالتی به عنوان قاضی در حکم یک پرسش کننده ظاهر شده و پرسشی را مطرح می کند، در طرف دیگر یک انسان و یک کامپیوتر قرار دارد که باید به پرسش پاسخ دهند، اگر کامپیوتر طوری پاسخ دهد که پرسش کننده تشخیص ندهد کدام یک به او پاسخ داده ، این کامپیوتر تست تورینگ را پشت سرگذاشته و طبق نظریه ی آلن تورینگ، هوشمند تلقی می شود. لازم به ذکر است که پرسش کننده باید در یک اتاق و انسان و کامپیوتر پاسخ دهده در اتاقی دیگر باشند، پرسش کننده جواب ها را به صورت متن دریافت می کند.

× ×شکل (1) تست تورینگ

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید