دانلود فایل پاورپوینت Part-of-Speech tagging

PowerPoint قابل ویرایش
21 صفحه
8900 تومان

لطفا به نکات زیر در هنگام خرید دانلود فایل پاورپوینت Part-of-Speech tagging توجه فرمایید.

1-در این مطلب، متن اسلاید های اولیه دانلود فایل پاورپوینت Part-of-Speech tagging قرار داده شده است

2-به علت اینکه امکان درج تصاویر استفاده شده در پاورپوینت وجود ندارد،در صورتی که مایل به دریافت تصاویری از ان قبل از خرید هستید، می توانید با پشتیبانی تماس حاصل فرمایید

4-در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل اسلاید ها میباشد ودر فایل اصلی این پاورپوینت،به هیچ وجه بهم ریختگی وجود ندارد

5-در صورتی که اسلاید ها داری جدول و یا عکس باشند در متون زیر قرار نخواهند گرفت

— پاورپوینت شامل تصاویر میباشد —-

اسلاید ۱ :

art-of-S eech ( OS) taggi g

art-of-S eech ( OS) یا جزء کلام: مقوله نحوی که هر کلمه به آن تعلق دارد.

 

نامهای دیگر: word classes، lexical tags، tags

 

OS taggi g (taggi g): فرایند انتساب مقوله نحوی به هر کلمه در پیکره متنی

 

OSهای اصلی در انگلیسی:

ou s

Verbs

Adjectives

Adverbs

re ositio s (o , to, by, from, with, …)

Determi ers (a, a , the)

ro ou s (she, who, my, others, …)

Co ju ctio s (a d, but, if, …)

Auxiliaries (ca , should, are, …)

articles (u , dow , off, i , out, …)

umerals (o e, two, three, first, seco d, …)

اسلاید ۲ :

بسته به کاربرد، ممکن است OS های جزئی تری در پیکره های متنی به کار روند:

Si gular ou s

lural ou s

Com arative adjectives

Su erlative adjectives

Modal verbs

erso al ro ou s

ossessive ro ou s

برای علائم نقطه گذاری هم tag های متفاوتی ممکن است به کار رود.

 

tag setهای مختلف در انگلیسی:

e Treeba k tag set: شامل ۴۵ tag

Brow Cor us tag set: شامل ۸۷ tag

C5 tag set: شامل ۶۱ tag

C7 tag set: شامل ۱۴۶ tag

 

در پیکره متنی زبان فارسی (دکتر بیجن خان) حدود ۶۶۰ tag به کار رفته است.

اسلاید ۳ :

OS-taggi g: کاربردها

دانستن مقوله نحوی یک کلمه می تواند اطلاعات بیشتری در مورد خود کلمه و کلمات مجاور آن به ما بدهد.

 

کاربردها:

مدل سازی زبانی (در بازشناسی گفتار و …): مقوله نحوی یک کلمه می تواند در پیش بینی کلمه بعدی کمک کند.

مثال: در انگلیسی بعد از ضمایر ملکی، اسم و بعد از ضمایر شخصی، فعل می آید.

در فارسی معمولاً بعد از حرف اضافه اسم یا ضمیر می آید.

سنتز گفتار: مقوله نحوی یک کلمه می تواند اطلاعاتی در مورد نحوه تلفظ صحیح یک کلمه به ما بدهد.

مثال: تلفظ کلمه object در انگلیسی به صورت OBject ( ou ) و obJECT (verb)

تلفظ کلمه ”مرد“ در فارسی به صورت ”مَرد“ (اسم)، ”مُرد“ (فعل)

بازیابی اطلاعات: دانستن مقوله نحوی کلمات می تواند به استخراج کلمات مهم در متن کمک کند.

رفع ابهام معنایی: دانستن مقوله نحوی کلمات می تواند به رفع ابهام معنایی کلمه کمک کند.

مثال: کلمه watch در انگلیسی و کلمه ”در“ در فارسی

تجزیه نحوی ( arsi g): برای arsi g پایین به بالا در ابتدا نیاز به تعیین مقوله نحوی کلمات داریم.

اسلاید ۴ :

OS taggi g: روش ها

مشکل اصلی در OS taggi g: بعضی از کلمات به چند مقوله نحوی تعلق دارند.

حدود ۱۱٫۵% از انواع کلمات به کار رفته در پیکره brow دارای بیش از یک tag هستند.

این کلمات حدود ۴۰% پیکره را شامل می شوند.

 

روش های کلی OS taggi g:

روش های مبتنی بر قاعده (rule based OS taggi g)

روش های آماری ( robabilistic/stochastic OS taggi g)

 

روش های ترکیبی (tra sformatio -based OS taggi g)

اسلاید ۵ :

Rule based OS taggi g

با استفاده از یک سری rule مقوله نحوی کلمات دارای ابهام را با توجه به کلمات مجاور تعیین می کند.

Ruleها به وسیله زبان شناسان نوشته می شوند.

 

دو مرحله کلی از OS taggi g مبتنی بر قاعده

ابتدا با استفاده از یک دیکشنری تمام tag های ممکن برای کلمات تعیین می شوند.

سپس برای هر کلمه در متن، با استفاده از قواعد و با توجه به کلمات مجاور، یکی از tag ها به عنوان tag اصلی تعیین می شود.

اسلاید ۶ :

مثال: I thi k that you are clever

I: RO

thi k: V

that: RO , DET, COM , ADV

you: RO

are: AUX

clever: ADJ

مثالی از یک rule (از  E GTWOL tagger)

Adverbial-that rule:

Give i ut: “that”

If

  (+۱ ADJ/ADV/QUA T)

  (+۲ SE T-LIM)

  ( OT -1 V-SVO)

the elimi ate o -ADV tags

else elimi ate ADV tag

اسلاید ۷ :

با استفاده از یک پیکره tagخورده، دنباله tagهای ممکن برای دنباله کلمات مختلف را یاد می گیرد و با استفاده از آن محتمل ترین tag برای هر کلمه را پیدا می کند.

 

مسئله OS taggi g به صورت آماری:

با فرض داشتن دنباله کلمات W=w1…w ، دنباله tag های T=t1…t را طوری پیدا کنید که (T|W) ماکزیمم شود:

 

 

با استفاده از قانون بیز:

 

اسلاید ۸ :

محاسبه احتمال های فوق در عمل بسیار مشکل است. بنابراین چند فرض ساده کننده برای محاسبه احتمال ها به کار می رود:

 

(حاصلضرب احتمالات -gram)

 

 

(حاصلضرب احتمالات lexical-ge eratio )

 

بنابراین باید دنباله tag ها را طوری پیدا کنیم که عبارت زیر ماکزیمم شود:

اسلاید ۹ :

محاسبه احتمالات با استفاده از پیکره برچسب خورده

 

احتمالات bigram

 

احتمالات lexical-ge eratio

 

محاسبه محتمل ترین دنباله از tagها

ساده ترین روش: درنظر گرفتن تمام دنباله های محتمل و محاسبه احتمال هر یک به روش فوق (Brute Force Search)

با فرض داشتن برچسب و T کلمه، حداکثر T دنباله از برچسب ها تولید می شود.

اسلاید ۱۰ :

زنجیره مارکوف (Markov Chai )

محاسبه احتمال (T) با استفاده از زنجیره مارکوف

 

زنجیره مارکوف: نوع خاصی از Fi ite State Machi e که در آن به پرش های بین state ها یک احتمال نسبت داده می شود.

فرض مارکوف مرتبه اول: احتمال بودن در هر state فقط به state قبلی وابسته است.

مطالب فوق فقط متون اسلاید های ابتدایی پاورپوینت بوده اند . جهت دریافت کل ان ، لطفا خریداری نمایید .
PowerPointقابل ویرایش - قیمت 8900 تومان در 21 صفحه
سایر مقالات موجود در این موضوع
دیدگاه خود را مطرح فرمایید . وظیفه ماست که به سوالات شما پاسخ دهیم

پاسخ دیدگاه شما ایمیل خواهد شد