بخشی از پاورپوینت
اسلاید 1 :
ترجمه ماشینی مبتنی بر آنتولوژی
Ontology based translation machine
اسلاید 2 :
فهرست مطالب
مقدمه
آنتولوژی
وب معنایی
ترجمه ماشینی
ترجمه معنایی
نتیجه گیری
مراجع
به نام خدا
اسلاید 3 :
مقدمه- جایگاه و ضرورت
نانو تکنولوژی
بیوتکنولوژی
تکنولوژی اطلاعات
علوم شناختی
روباتیک و هوش مصنوعی و.
ترجمه ماشینی
بیش از 6809 زبان متفاوت در دنیا وجود دارد
239 زبان از این تعداد فقط در قاره اروپا استفاده می شود.
قاره آسیا 2196 زبان متفاوت را داراست.
اسلاید 4 :
آنتولوژی- تاریخچه
ریشه آغازین این واژه از فلسفه یونان گرفته شده که البته پس از مدتها در قرن 19 فلاسفه آلمانی آن را در مورد هستان شناسی و مطالعه چیستی به کار برده اند .
Human = Rational sensitive animate material Substance
اسلاید 5 :
آنتولوژی - تعاریف رسمی
Ontology is a term in philosophy and its meaning is ``theory of existence''.
Ontology is an explicit specification of conceptualization.
Ontology is a body of knowledge describing some domain, typically common sense knowledge domain.
تعریف دوم را که آقای Thomas Gruber مطرح کرده است و به طور کلی مورد پذیرش دانشمندان هوش مصنوعی می باشد که در مورد آنتولوژی برای استفاده در فنون مهندسی کاربردی تر می باشد
اسلاید 6 :
آنتولوژی
Person A: "what is the last document you read ?"
Person B: "the article Gruber wrote on ontology in 1993."
The syllogism "a article is a book" "a book is a document" so "a article is a document
آنتولوژی در واقع پیشنهاد دهنده یک ساختار مفید برای بهره برداری غیر مبهم از داده ها ست.
اسلاید 7 :
وب معنایی – اجزاء
اسلاید 8 :
وب معنایی
وب معنایی در واقع فضایی از جنس محاسبات هوشمند است که در آن کتابخانه ها ،دانش نامه ها ، روزنامه ها و سایر منابع دانش ، می توانند از محتوای معنایی یکدیگر، باخبر شده و یکدیگر را درک نمایند.
اسلاید 9 :
ترجمه ماشینی– تاریخچه
دوره آغازین
ایده اصلی ترجمه ماشین به قرن 17 بر می گردد و ابتدا با معرفی یک زبان ساختگی شروع شد. در سال 1629 توسط رنه دکارت(ریاضیدان و فیلسوف فرانسوی)
دوره رخوت
در دهه 1960-1970 به این خاطر که طراحان و محققان این رشته ، متوجه رام نشدنی بودن این مسئله شدند، دچار رخوت و سستی گردید.
دوره حیات مجدد
در اوایل دهه 80 که سخت افزار سیستم ها با بهبود خوبی روبرو شدند و هزینه ها هم به نوعی، کاهش پیدا کرد، دوباره علاقه به پیگیری موضوع هم بوجود آمد.
اسلاید 10 :
ترجمه ماشینی - دسته بندی
مستقیم - غیر مستقیم
زبان میانی – واسط انتقال دهنده
دامنه محلی - دامنه سراسری
MAT
HAMT
MAHT
اسلاید 11 :
ترجمه ماشینی - انواع ترجمه ماشینی
سیستم های ترجمه مبتنی بر قاعده Rule based
سیستم های ترجمه مبتنی بر دانش Knowledge based
سیستم های ترجمه مبتنی بر مجموعه نوشتجات Corpus based
مبتنی بر نمونه(مثال) Example based
مبتنی بر روشهای آماری Statistical
سیستم های ترکیبی Hybrid MT
اسلاید 12 :
ترجمه ماشینی - مبتنی بر روشهای آماری
ترجمه های آماری سعی دارند که با استفاده از کاربرد متد های آماری، بر روی دانشنامه های دو زبانی ترجمه هایی را تولید نمایند .
اولین نرم افزار ترجمه ماشینی به روش آماری CANDID از شرکت IBMبود .
Google برای سالها از Systran استفاده می کرد. از اکتبر سال 2007 به روشهای آماری روی آورد.
در واقع به مسئله ترجمه به صورت یک مسئله یادگیری ماشین برخورد می کند .
شیوه کلی آنها در یک کلام بررسی دقیق ترجمه های انجام شده توسط انسان ، آموختن آن و سپس ارایه ترجمه بر اساس آموزش های مرحله قبل می باشد .
اسلاید 13 :
ترجمه ماشینی - ترجمه مبتنی بر نوشتجات نمونه
مبتنی بر استنتاج قیاسی است Case base reasoning
شامل یک پیکره به حد کافی بزرگ دو زبانی است که از تعداد زیادی نمونه و ترجمه نظیر آن تشکیل شده است
یک الگوریتم انطباق برای یافتن شبیه ترین عبارات به عبارت ورودی
یک الگوریتم انتقال برای تولید ترجمه هر یک از عبارا ت مرحله قبل
یک الگوریتم ترکیب مجدد برای اتصال عبارات ترجمه شده شده به یکدیگر
اسلاید 14 :
ترجمه ماشینی - ترجمه آنلاین
اسلاید 15 :
ترجمه ماشینی - ارزیابی سیستم های ترجمه
به عنوان قدیمی ترین روش می توان از قضاوت انسانی استفاده کرد .
BLEU
NIST
F-Score
METEOR
اسلاید 16 :
ترجمه ماشینی - ارزیابی به روش Bleu
در این معیار ارزیابی، میزان همبستگی بالا میان متن تولید شده توسط ماشین، و متن ترجمه شده توسط انسان به صورت کمی، مورد بررسی قرار گرفته است.
m : در این فرمول تعداد کلماتی از عبارت کاندید است که در عبارت مرجع نیز وجود دارد .
M : تعداد کل کلماتی است که در عبارت کاندید ظاهر شده است.
- ارزیابی به روش NIST
دارای الگوریتمی مشابه الگوریتم BLEU می باشد، با این تفاوت که در مدل BLEU برای هر کلمه مرکب n گرمی، وزن یکسانی فرض شده است در حالیکه در این روش کلمات مرکب چند گرمی بر اساس تعداد تکرارشان در متن وزن دهی می شوند.
اسلاید 17 :
ترجمه ماشینی - ارزیابی به روش F-Score
دو پارامتر p(precision) , r(recall) برای محاسبه دقت به صورت زیر محاسبه می شوند:
p برابر است با تعداد نتایج صحیح، تقسیم بر تعداد کل نتایج برگشت داده شده.
r برابر است با تعداد نتایج صحیح، تقسیم بر تعداد نتایجی که باید برگشت داده می شد.
در حالت کلی به ازای عدد نامنفی بتا داریم:
اسلاید 18 :
ترجمه معنایی
. این روش در واقع از مزایای پیوند دادن معنا به داده های موجود در لغتنامه بهره می گیرد تا بتواند واژه معادل و هم معنا را در زبان دوم پیدا نماید.
یکی از ملزومات این روش این است که معنا را به شکلی خاص نه لزوماً زبان مبدا و نه در قالب زبان مقصد به گونه ای باز نمایی می کند.
از امکانات موجود در آنتولوژی ها برای رفع ابهام در ترجمه های تولید شده بهره می گیرد. مثلا رابطه معادل بودن.
اسلاید 19 :
ترجمه معنایی سیستم Mikrokosmos
اسلاید 20 :
معماری سیستم برای تحلیل متون ورودی
خروجی مرحله تحلیل، یک بازنمایی معنایی، از متن نوشته شده به زبان مبدا است که بوسیله یک ساختار مستقل با نام TMR ارایه می گردد.