بخشی از مقاله

چکیده:

شد سریع شبکه و اینترنت و به دنبال آن دسترسی به حجم عظیم داده و اطلاعات الکترونیکی، موجب شده که یافتن اطلاعات موردنظر، کاري بس دشوار و بعضاً غیرممکن به نظر برسد. براي حل این مشکل پژوهشگران درصدد ایجاد رویکردهایی جهت پردازش مفهومی متون برآمدند تا به این ترتیب بازیابی اطلاعات با دقت و سرعت بیشتري صورت پذیرد. گرافهاي مفهومی از ابزارهاي تحقق این مهم می باشند که در این مقاله به ارائه رویکردي جهت تولید خودکار این گرافها با استفاده از شبکه قاب پرداخته شده است. سیستمی که در این مقاله پیشنهاد شده است شامل یک رویکرد سه مرحلهاي است که در مرحله اول به برچسبگذاري نقشهاي معنایی متون با استفاده از شبکه قاب پرداخته است. سپس با استفاده از این نقشهاي معنایی، گرافهاي مفهومی مرتبط با هر قاب ساخته شدهاند و در گام آخر این گراف ها به یکدیگر متصل شدهاند به نحوي که براي هر جمله موجود در متن یک گراف مفهومی همبند بدست آمده است. آنچه که مسلم است دقت و صح ت این سیستم وابسته به دقت و صحت تجزیهگر معنایی می   باشد. به همین علت در این مقاله، به ارزیابی دو ابزار که با استفاده از شبکه قاب عمل تجزیه معنایی را در تولید گرافهاي مفهومی انجام میدهند، پرداختهایم.

کلید واژهها - برچسب گذاري نقشهاي معنایی، تجزیهگر معنایی، شبکه افعال، شبکه قاب، شبکه واژگان، گراف مفهومی.

.1 مقدمه

در سالهاي اخیر، در نتیجه رشد سریع شبکه و اینترنت، انسانها با حجم عظیم مستندات مواجه شدهاند. یافتن اطلاعات موردنظر در میان این حمج گسترده، کاري بس دشوار، زمانبر و بعضاً غیرممکن مینماید. ﺑﻪ همین دلیل پژوهشگران درصدد یافتن راه حل هایی براي مرتفع کردن مشکل فوق برآمدهاند. مسلماً دستهاي از راهحلها نیازمند دانستن معنا و مفهوم متون میباشند - به عنوان مثال در موتورهاي جستجو، خوشهبندي متون و غیره - . بنابراین نیاز به روشی براي بازنمایی نمایش معنایی متون احساس میشود. گراف مفهومی1 یک شکل گرافیکی مناسب براي نمایش معنا و مفاهیم متون میباشد. در واقع این گراف ابزاري است جهت بازنمایی متن به شکل مفهومی آن.

گراف مفهومی یک سیستم منطقی است که مبتنی بر گرافهاي وجودي - معرفی شده توسط چارلز سندرز پرز - 2 و شبکههاي معنایی هوش مصنوعی میباشد. گرافهاي مفهومی معنا را در شکل منطقی مختصرشده و خوانا نشان میدهند. در واقع این گرافها به عنوان یک زبان میانی بکار می روند که صورت کامپیوترگرا را، به و یا از زبان طبیعی ترجمه میکنند.[1] گرافهاي مفهومی در بازیابی اطلاعات[2]، موتورهاي جستجو[3]، پردازش زبان طبیعی، طراحی پایگاه دادهها[4]، تفسیر معنایی[5]، مدیریت دادهها[7][6]، خلاصه-سازي متون[8]، طبقهبندي متون[9]، پژوهشهاي حوزه علوم پزشکی [11] ,[10] و ... استفاده میشوند.

براي ساخت این گرافها، میتوان از برخی منابع زبانشناختی استفاده کرد. به عنوان مثال هنسمن3 براي ساخت گرافهاي مفهومی بصورت نیمه خودکار، از ترکیب شبکه واژگان4 و شبکه افعال5 استفاده کرد . [14]–[12] وان6 و همکارانش با استفاده از ویکی پدیا به ساخت گرافهاي مفهومی پرداختند. در بخش بعدي این رویکردها بطور مختصر معرفی خواهند شد.در این مقاله سعی بر این شده است که براي اولین بار گرافهاي مفهومی با استفاده از هستاننگار شبکه قاب7 ساخته شوند. پروژة شبکه قاب دانشگاه برکلی، از سال 1997 آغاز شد . این پروژه به یافتن و شرح معانی و خصوصیات واژگان در فرهنگ لغات انگلیسی می-پردازد.

شبکه قاب یک پایگاه داده واژﮔﺎﻧﯽ در زبان انگلیسی با قابلیت خوانایی توسط ماشین و انسان است که مبتنی بر نمونههاي تفسیر شده اي است که کاربرد واژگان را در متون واقعی نشان میدهند. مفهوم معناشناسی قاب8 مبناي توصیف معناي واحدهاي لغوي در این پایگاه داده است و همچنین جملات مستخرج از پیکرة متون شبکه قاب به عنوان مواد اصلی جهت آنالیز و تفسیر به کار میروند. در این پیکره خصوصیات نحوي و معنایی هر واژه، بصورت ترکیبی شرح داده میشود.[16] ,[15]آنچه که در ادامه این مقاله آمده است بدین شرح میباشد:

در بخش بعدي به مروري بر کارهاي مرتبط پیشین میپردازیم و در واقع رویکردهاي موجود را که براي ساخت گرافهاي مفهومی وجود دارند، بطور مختصر معرفی میکنیم. در بخش سوم به معرفی مختصري از شبکه قاب که در سیستم پیشنهادي مورد استفاده قرار گرفته است میپردازیم با این هدف که آشنایی اولیهاي با این ابزار براي خوانندگان ایجاد شود و از بوجود آﻣﺪن ابهامات اساسی در روند ارائه رویکرد پیشنهادي جلوگیري شود. در بخش چهارم، رویکرد پیشنهادي مطرح می شود و جزئیات آن بیان میگردد. ارزیابی و آزمایش رویکرد پیشنهادي در فصل 5 صورت میگیرد. در نهایت، در فصل پایانی نتیجهگیري و پیشنهادات آتی ارائه میشوند.

.2 مروري بر کارهاي پیشین

یک گراف مفهومی، یک نمایش گرافی براي منطق مبتنی بر شبکههاي معنایی هوش مصنوعی و گرافهاي وجودي چارلز سندرز پرز است .[1]گراف مفهومی شبکهاي از گرههاي مفهوم و گرههاي رابطه است. گره-هاي مفهوم نشاندهنده موجودیتها، ویژگیها یا رویدادها - کنشها - هستند. گرههاي رابطه انواع ارتباط بین دو گره مفهوم را مشخص می-کنند .[2]براي اولین بار در سال 1979، سوا 9 یک نسخه از گرافهاي مفهومی را به عنوان زبان واسطه و میانی براي تطابق سوالات و احکام زبان طبیعی با یک پایگاه داده رابطهاي معرفی کرد [17] و سپس در سال 1984 به توسعه رویکرد خود پرداخت .[18]رویکردهاي متعددي با هدف تولید گرافهاي مفهومی ارائه شدهاند که اکثراً وابسته به دامنه خاصی از متون بوده و داراي قوانین دستی می-باشند.

در سال 2001، ژانگ10 و همکارانش رویکردي مبتنی بر یادگیري ماشین جهت تولید خودکار گرافهاي مفهومی ارائه دادند و ادعا کردند که سیستم پیشنهادیشان، برخلاف سیستمهاي پیشین، خاص دامنه نبوده و براي دامنههاي مختلف قابل آموزش دادن است و همچنین نیازمند اعمال قوانین دستی نمیباشد .[19][3]هنسمن و همکارانش گرافهاي مفهومی را براي نمایش متون با استفاده از ترکیبی از منابع زبانشناختی موجود نظیر شبکه واژگان و شبکه افعال ساختند .[21] ,[20] ,[13] ,[12]آنها یک رویکرد دو مرحله اي ارائه دادند که در آن ابتدا نقشهاي معنایی موجود در یک جمله شناسایی میشوند سپس این نقشها به همراه دانش خاصدامنه نیمه خودکار، براي ساخت گرافهاي مفهومی بکار برده میشوند.اولین مرحله که همان شناسایی نقشهاي معنایی است، خود شامل چهار گام میباشد که در ادامه شرح داده میشوند.

در گام اول، تجزیهگر چارنیاك11 براي ساخت درخت تجزیه استفاده شده است. این مرحله، مرحله پیش پردازش نام دارد. در گام دوم، تمامی قابهاي نقش معنایی استخراج شدهاند. براي این هدف شبکه افعال بکار برده شده است. گام بعدي الگوریتم تطابق است. این رویکرد نیمه خودکار است زیرا در این گام در الگوریتم تطابق چهار حالت درنظر گرفته شده است که یکی از آنها بصورت دستی انجام میپذیرد. کار الگوریتم تطابق، نگاشت الگوي جمله با هریک از قابهاي نقش معنایی استخراج شده از شبکه افعال است. اگر الگوریتم بیش از یک تطبیق بین الگوي جمله و قاب  هاي نقش معنایی استخراج شده از شبکه افعال را برگرداند، بهترین آنها بصورت دستی انتخاب میشود. گام آخر، بررسی محدودیتهاي انتخاب است. در این گام اگر یک مولفه کاندید براي یک نقش موضوعی وجود داشته باشد، آنگاه به نقش مورد نظر اختصاص داده میشود. در گام دوم که در بالا اشاره شد،

گرافهاي مفهومی در سه مرحله ساخته میشوند:

مرحله اول: براي هریک از مولفههاي جمله، یک نمایش گراف مفهومی ساخته میشود.

مرحله دوم: تمامی گرافهاي مفهومی در یک گراف واحد بهم می-پیوندند. این عمل با استفاده از رابطه هریک از مولفهها با فعل جملهانجام می شود. به این ترتیب که اجزا جمله به فعل جمله متصل می-شوند.

مرحله سوم: در خصوص رابطههاي ناشناخته تصمیمگیري میشود.مشکل عمدة این سیستم که نویسندگان نیز خود بر آن تاکید دارﻧﺪ این است که شبکه افعال برخی افعال را پوشش نمیدهد. اگرچه در توسعههاي سالهاي اخیر شبکه افعال، تا حد زیادي این مشکل بهبود یافته، اما بطور کامل برطرف نشده است.در سال 2014، وان و همکاران، متد جدیدي ارائه دادند که در آن عمل طبقهبندي متون با استفاده از دانش استخراج شده از گرافهاي مفهومی صورت میگرفت. آنها براي ساخت گرافهاي مفهومی از ویکی پدیا استفاده کردند. به این ترتیب که هر مقاله یک گره مفهوم در گراف مفهومی، در نظر گرفته شد. عناوین، لینک ها، متون و اطلاعات ﻃﺒﻘﻪﺑﻨﺪي به عنوان یالها در نظر گرفته شدند که میزان ارتباط بین گرههاي مفاهیم را مشخص میکردند.

هر متن به مجموعهاي از گره-هاي مرتبط نگاشت میشود وﺳﭙﺲ براي تولید یک مجموعه از گره-هاي با اهمیت که متن را به بهترین شکل ممکن نمایش میدهند، الگوریتم رندم واك12 بکار برده میشود. در پایان نیز با استفاده از معیار معیار مشابهت برداري، مجموعهها امتیازدهی شدند. آنها براي ارزیابی تکنیکشان از مجموعه دادههاي استاندارد طبقهبندي متون استفاده کردند و نتایج قابل قبولی را نیز بدست آوردند .[9] .3 شبکهٴ قاب پروژ ة شبکه قاب یک پایگاه داده واژگانی زبان انگلیسی است که قابلیت خوانایی توسط انسان و ماشین را دارد و مبتنی بر مثالهاي تفسیر شدهاي است که نشان میدهند چگونه واژگان در متون اصلی استفاده میشوند.

شبکه قاب در واقع فرهنگ واژگانی مشتمل بر بیش از 10000 واژه است که بیشتر آنها با مثالهاي تفسیرشده همراههستند تا به این وسیله معنی و کاربرد واژه نشان داده شود. براي پژوهشگران حوز ة   پردازش زبان طبیعی، بیش از 170000 جمله تفسیر شده بصورت دستی نیز در این پایگاه داده وجود دارد که یک مجموعه داده آموزش دیده منحصر به فرد از برچسبگذاري نقشهاي معنایی را فراهم میکند که در کاربردهایی نظیر استخراج اطلاعات، ترجمه ماشین، ت شخیص رویداد، آنالیز احساس و غیره به کار میروند. موسسه بین المللی علوم کامپیوتر برکلی از سال 1997 این پروژه راآغاز کرده است و توسط بنیاد علوم طبیعی حمایت میشود.شبکه قاب مبتنی بر تئوري معنی است که معناشناسی قاب خوانده میشود و نتیجه فعالیت چارلز فیلمور13 و همکارانش میباشد,[15] .[24]–[22]

ایدة ا  صلی در این پروژه بسیار ساده است  به این صورت که معانی بیشتر واژهها براساس یک قاب معنایی راحتتر درك میشود. قاب معنایی یک توصیف از نوع رویداد، رابطه یا موجودیت و شرکاي آن است. براي مثال، مفهوم "پختن" - Cooking - شامل شخصی است که عمل پختن را انجام می دهد تحت عنوان "آشپز" - Cook - ، چیزي که پخته می شود تحت عنوان "غذا" - Food -  ، چیزي که غذا در حین پختن در آن نگهداري می شود تحت عنوان "ظرف" - Container - و منبع حرارت یا همان "ابزار حرارت دادن" . - Heating_instrument - در پروژة شبکه قاب، مفاهیم بالا در قاب Apply_heat آورده میشوند کهدر آنCook, Food, Container و Heeting_instrument عناصر قاب14نامیده میشوند. واژههایی که این قاب را فراخوانی میکنند مانند fry, bake, boil و broil را واحدهاي لغوي15 قاب Apply_heat مینامند.

بعضی قابها پیچیدهتر هستند مانند قاب Revenge که شامل عناصرقاب    Offender,  Injury,  Injured _Party,  Avenger,  وPunishmentاست و برخی قابها نیز ساده هستند مانند قاب Placing که شامل دو عامل میباشد. یکی "چیزي که در محل قرار داده شده است" تحت عنوان Theme و دومی محلی که شی در آن قرار داده شده است یا .Goalکار شبکه قاب مشخص کردن قاب ها و تفسیر جملات است و نشان دادن اینکه چگونه عناصر قاب بطور نحوي در اطراف واژهاي که قاب را فراخوانی میکند، قرار گرفتهاند. به عنوان مثال در دو جمله :

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید