بخشی از پاورپوینت

اسلاید 1 :

رابط کاربری در وب معنایی : سیستم های پرس و جو زبان طبیعی

اسلاید 2 :

ساختار ارائه
مقدمه
رابط های پرس و جو زبان طبیعی در وب معنایی
بررسی قابلیت استفاده رابط های پرس و جو زبان طبیعی
سیستم های پرس و جوی زبان طبیعی

اسلاید 3 :

مقدمه
سیستم های پرس و جوی زبان طبیعی

اسلاید 4 :

سیستم های پرس و جوی زبان طبیعی

اسلاید 5 :

تقسیم بندی سیستم ها بر اساس دامنه تحت حمایت
سیستم های پرس و جوی زبان طبیعی
دامنه بسته
دامنه باز
یافتن هستی شناسی های مربوط برای جواب به پرس و جوی کاربر
شناسایی نگاشت های صحیح معنایی
ترکیب اطلاعات ناهمگون
مقیاس پذیری
ناهمگونی سطح بالا
مقابله با داده های ناکامل و نویزی

اسلاید 6 :

سیستم های پرس و جوی زبان طبیعی
سیستم های مبتنی بر الگو
این سیستم ها سعی دارند تا الگوهای قطعی که در پرس و جو کاربر تکرار می شوند را شناسایی کنند . این الگوها برای تفسیر طبیعت و ماهیت درخواست بازیابی اطلاعات که به صورت ضمنی در پرس و جو وجود دارد به کار می رود.
Querix
سیستم های پرس و جو زبان طبیعی کامل
این سیستم ها هیچگونه ساختار گرامری برای زبان که پرسش و جملات درخواست های بازیابی اطلاعات به کار می رود ، تحمیل نمی کنند . در عوض از تکنیکهای پردازش زبان طبیعی پیچیده برای تجزیه ، تفسیر و ترجمه ورودی به زبان پرس و جو سازگار با وب معنایی استفاده می کنند.
PANTO
سیستم های زبان طبیعی کنترل شده
این سیستم ها بر زبان طبیعی کنترل شده تکیه دارند، هدف این است که با محدود کردن ورودی های کاربر به یک زیرمجموعه بدون ابهام از درخواست های پرس و جوی امکان پذیر ، یک پردازش گر پرس و جو زبان طبیعی بتواند پرس و جو های کاربر را تفسیر کند و آن را به پرس و جو فرمال معادل معنایی تبدیل کند.
CNL خاص (SWAT که از ACE استفاده می کند)
هدایتگر (Ginseng)
تقسیم بندی دیگر

اسلاید 7 :

سیستم های پرس و جوی زبان طبیعی
سوالات کامل انگلیسی
رفع ابهام از طریق همفکری با کاربر و استفاده از دیالوگ های صریح
ساده است و تکنولوژی معناگرای پیچیده ای استفاده نمی کند. (یک مجموعه محدود از ابزارهای NLP را به خدمت می گیرد.
اين سيستم شامل هفت بخش اصلي است:
رابط كاربر
مدير هستان شناسی
تولید برچسب هاي منابع با به دست آوردن مترادف ها از طريق WordNet
تحليل گر پرس و جو
Stanford parser برای تولید درخت نحو
تولید دنباله هایی به شکل Q-V-N-P-N-Q-V-P-N
مركز تطبيق دهنده
استفاده از الگوهای هیوریستیک برای تطبیق پرس و جوهای کاربر به سه گانه های هستان شناسی (به طور مثال Q-V-N)
توليدكننده پرس و جو
SPARQL
جزء محاوره اي
يك لايه دسترسي به هستان شناسی
Jena و Pellet reasoner
Querix: يك رابط زبان طبيعي بر اساس ديالوگ هاي صریح

اسلاید 8 :

معماری :
دستور زبان چند سطحی
بخش ایستا که در ابتدا وجود دارد وشامل قوانين مستقل از هستی شناسی است كه ساختار جملات عمومي را مشخص مي كند
بخش پویا که در زمان بارگذاری آنتولوژی ایجاد می شود
پارسر افزایشی
گزینه های کاربر (کنترل شده و محدود به واژگان آنتولوژی)
پرس و جوهاي RDQL
لایه دسترسی به هستان شناسی (Jena)
محدودیت : نمي تواند همه پرس و جوهاي NL را به واسطه ساختارش مورد پردازش قرار دهد
سیستم های پرس و جوی زبان طبیعی
Ginseng: يك رابط کاربری زبان طبيعي با ورودي هاي هدايت شده

اسلاید 9 :

نمونه ای از قوانین گرامر چند سطحی Ginseng
سیستم های پرس و جوی زبان طبیعی
(1) ::= ?
| SELECT <>
| WHERE (<>)

(2a) ::= which | <>
| <> <>

(2b) ::= what
| <>
| (<> <>) (<> <>)
(3) ::= state
| ?state
| (type=[])

(4) ::= borders
| -
| <> (domain=[], range=[])

(5)::= New York City
| ?newyorkcity | (type=[, ])

(6)::= Mississippi
| ?mississippi | (type=[])

(7)::= Mississippi
| ?mississippi | (type=[])

اسلاید 10 :

NLP_Reduce: يك رابط ساده
سیستم های پرس و جوی زبان طبیعی
مجموعه کوچکی از عملگرهای پردازش زبان طبیعی را استفاده می کند:
توسعه مترادف ها (WordNet)
ریشه یابی (Porter Stemmer)
پردازش پرس و جوها به صورت بسته ای از کلمات
برای ورودی های ناکارا ، قوی است
قابل حمل است
می تواند ورودی های غیرگرامری را بپذیرد (زبان طبیعی کامل ، بخشی از جمله یا کلمات کلیدی)
محدودیت : نمی تواند به پرس و جوهایی که نیاز به ساختار وابستگی بین عناصر دارند را پاسخ دهد

اسلاید 11 :

SWAT
یک رابط زبان طبیعی کنترل شده است که اجازه می دهد که کاربران پرس و جوها را در یک CNL خاص که Attempto Controlled English (ACE) نامیده می شود فرموله کنند.(جملات ساده ، مرکب و پرسشی)
ابهام را از بین می برد و نیاز به ابزارهای پیچیده پردازش زبان طبیعی ندارد
نیاز به آموزش کاربر دارد
سیستم های پرس و جوی زبان طبیعی
محدودیت ها :
نیاز به آموزش کاربر دارد. (یادگیری زبان های کنترل شده بسیار آسان تر از زبان های رسمی است)
نیاز به بازنویسی دستی قوانین هنگامیکه از یک هستان شناسی جدید استفاده می شود ، دارد.
قابلیت حمل پایین

اسلاید 12 :

PANTO : یک رابط زبان طبیعی قابل حمل
بر پایه توجه ویژه به عبارتهای اسمی، این رابط یک مدل داده مبتنی بر سه گانگی را برای تحلیل نتایج درخت های تجزیه با استفاده از StanfordParser اتخاذ می کند.
تغییرات پیچیده در پرس و جو های زبان طبیعی (مانند منفی سازی ، مبالغه و مقایسه) نیز بررسی شده است.
عبارت های اسمی در درخت های تجزیه به صورت جفت هایی استخراج می شوند تا نمایشی میانی به نام QueryTriples شکل گیرد.
محدودیت : ارتباط با کاربران کم است.
سیستم های پرس و جوی زبان طبیعی

اسلاید 13 :

AquaLog
AquaLog تعداد زیادی از تکنیکهای قوی را به روشی جدید ترکیب می کند تا پرس و جو های زبان طبیعی را با مفهوم کند و آنها را به نشانه گذاری معنایی تبدیل کند.
شامل یک جزء فراگیرنده است که عملکرد سیستم را در پاسخ به اصطلاحات خاص به کار برده شده توسط کاربر نهایی بهبود می بخشد.
از پلتفرم GATE NLP ، الگوریتم های ارزیابی رشته ، WordNet و سرویس های جدید تشابه مبتنی بر هستی شناسی برای روابط و کلاسها استفاده می کند تا پرس و جوی کاربر را با توجه به پایگاه دانش هدف تعبیر نماید.
به صورت بسیار زیادی بر پردازش زبان متکی است و احتیاج به جملات درست دستوری دارد. و از زبان طبیعی کنترل شده استفاده می کند.
سیستم های پرس و جوی زبان طبیعی
دو ماژول اصلی:
جرء زبانی
سرویس تشابه رابطه (RSS)

اسلاید 14 :

AquaLog.
سیستم های پرس و جوی زبان طبیعی
سرویس تشابه رابطه (RSS)
از کاربر برای رفع ابهام درخواست می کند
قابلیت کلیک بر روی OntoTripleها و نمایش ویژگی های آن
از مکانیزم یادگیری بهره می گیرد.(عملکرد در طول زمان بهبود می یابد)
بر روی جزئیات پروفایل کاربر متمرکز است
تعریف زمینه ( نگهداری دو نگاشت مجزا)
جامعه کاربران
محدودیت ها : برخی از سوالات از دیدگاه AquaLog ناهنجار به شمار می آیند و توسط AquaLog پشتیبانی نمی شوند:
پرس و جوهای عطفی
پرس و جوهایی شامل bracket
پرس و جوهایی که با عبارت “how many” آغاز می شوند
پرس و جوهایی که به شکل پرس و جوی کلمل نیستند

اسلاید 15 :

PowerAqua : پرس و جو در وب معنایی دامنه باز
سیستم های پرس و جوی زبان طبیعی
قادر است به پرس و جوها بوسیله مکان یابی و مجتمع کردن اطلاعات که می توانند در میان منابع معنایی ناهمگون توزیع شده باشند ، پاسخ دهد.
از ابهام زدایی پرس و جو ، ادغام دانش ( برای مجتمع سازی جواب های جزئی یا مشابه) و مکانیزم های رتبه بندی ، برای شناسایی دقیق ترین پاسخ حمایت می کند.

اسلاید 16 :

QuestIO
سیستم های پرس و جوی زبان طبیعی
از آن جا که تمام استخراجات مربوط به طور خودکار از منابع هستی شناسی مشتق می شود، هیچ سفارشی سازی برای شروع QuestIO نیاز نیست.
در برابر اشتباهات در زبان پرس و جو بسیار قوی و پایدار می باشد و به کاربر آزادی برای وارد کردن پرس و جو با هر طول و فرمی را می دهد.
رفع ابهام در پرس و جوها با استفاده از استدلال و استنتاج در هستی شناسی انجام می شود.
سیستم ارتباطات ممکن بین جفت های مفاهیم را تحلیل می کند و آن ها را بر اساس چندین فاکتور مرتبط ، اولویت بندی می کند تا به تفسیر دقیق تر برسد.
مولفه ها :
KCIT : ابزاری برای شناسایی مفاهیم کلیدی می باشد. مفاهیم کلیدی شناسایی شده ، به منابع هستی شناسی مانند نمونه ها ، کلاس ها ، خصوصیت ها اشاره دارند.
جمع کننده متن :که همه کلمات پرس و جو که توسط KCIT شناسایی نشده اند ، اما می توانند در فرآیند تولید پرس و جوی رسمی مفید باشند ، جمع آوری می کند.
تحلیل گر پرس و جو

اسلاید 17 :

FREyA : يك رابط تعاملي
سیستم های پرس و جوی زبان طبیعی
دو نوع از محاوره درFREyA وجود دارد :
محاوره ابهام زدايي برا ي حل ابهام شناسايي شده در سوال توسط كاربر(ocها)
بر اساس كانون سوال يا نوع جواب
محاوره نگاشت براي نگاشتPOC در سوال به يكOC پيشنهاد شده توسط كاربر
FREyA تلاش نمي كند كه تمام سوال را در يك مرتبه تفسير كند ، بلكه اين عمل را براي هر جفت از OCها در هر لحظه انجام مي دهد.
مكانيزم يادگيري (به ازای هر انتخاب به روز رسانی می شود.)
ابهام زدايي تا حد ممكن و استفاده از مكانيزم ها ي رتبه بندي ، و تصحيح آنها در صورت نياز با استفاده از ويژگي ها ي تعاملي
مد خودکار
مد ForceDialog

اسلاید 18 :

ارزیابی قابلیت استفاده زبان طبیعی به عنوان یک رابط
برای یافتن پاسخ های بیشتر و دقیق تر به سوال مفید بودن NLI، پیشنهاد می شود که دوگانگی بین رویکردهای زبان طبیعی کامل و رویکردهای پرس و جو رسمی و مبتنی بر منطق شکسته شود و به عنوان انتهاهای زنجیره تشریفات در نظر گرفته شوند که آزادی زبان های طبیعی کامل و ساختاریافتگی زبان های پرس و جو رسمی در انتهای زنجیره قرار می گیرند.
در واقع در این بخش هدف این است که رویکردهای زبان طبیعی کامل و رویکردهای مبتنی بر منطق و رسمی به هم نزدیک شوند زیرا فرض بر این است که بهترین راه حل برای کاربران نهایی عادی جایی در میانه زنجیره تشریفات قرار دارد که داد و ستد بین آزادی و ساختاریافتگی را نشان میدهد.
سیستم های پرس و جوی زبان طبیعی

اسلاید 19 :

مطالعه قابلیت استفاده
سیستم های پرس و جوی زبان طبیعی
برخی ویژگی های این 4 رابط به شرح زیر است:
NLP_Reduce : بر اساس کلمات کلیدی ، بخشی از جمله و یا جمله کامل
Querix : جمله کامل
Ginseng : جملات و کلمات مبتنی بر منو و قابل پیش بینی
Semantic Crystal : نمایش گرافیکی ، قابل کلیک ، زبان پرس و جو فرمال
در این مطالعه از 48 کاربر خواسته شده است که یک سری عملیات بازیابی مشابه با هر یک از این چهار سیستم انجام دهند و اعلام کنند از کدام زبان پرس و جو بیشتر و از کدام کمتر خوششان آمده است و دلایل آن را نیز مطرح کنند. همچنین موارد زیر نیز سنجیده شده است:
زمان مورد نیاز کاربران برای انجام عملیات.
تعداد پرس و جو های لازم برای یافتن اطلاعات.
میزان موفقیت کاربران در یافتن جواب با استفاده از هر سیستم.
از کاربران خواسته شده است تا به پرسشنامه مربوط به میزان قابل استفاده بودن هر سیستم(SUS ، تست استانداردUsability ) پاسخ دهند. این آزمون جنبه های مختلف Usability مانند نیاز به پشتیبانی ، آموزش و پیچیدگی را پوشش می دهد.
پس از پر کردن این پرسشنامه ها از کاربران خواسته شده است تا به پرسشنامه مقایسه ای پاسخ دهند.

اسلاید 20 :

نتایج مطالعه قابلیت استفاده
سیستم های پرس و جوی زبان طبیعی
نتایج مطالعه نشان می دهد که Querix و زبان پرس و جوی آن که اجازه استفاده از سوالات کامل انگلیسی ولی با عبارتهای آغازی محدود را می دهد به عنوان مفیدترین و دوست داشتنی ترین رابط پرس و جو شناخته شده است.
با توجه به ترجیحات کاربران و با در نظر گرفتن سرعتی معلوم، بهترین راه حل برای کاربران عادی به سمت میانه اما در طرف طبیعی زنجیره تشریفات قرار دارد.
بررسی ها بر روی جستجوی مبتنی بر کلمات کلیدی در مقابل جستجو به صورت سوال کامل نشان می دهد که کاربران جملات پرس و جو کامل را می پذیرند ، اگر که نتایج بازیابی شده بهتر باشد.
اگرچه که SemanticCrystal مشکل است ، اما برخی کاربران به امتیاز گرافیکی بودن آن اشاره کرده اند.

در متن اصلی پاورپوینت به هم ریختگی وجود ندارد. برای مطالعه بیشتر پاورپوینت آن را خریداری کنید