دانلود فایل پاورپوینت بررسی تکنولوژی بازشناسی گفتار فارسی با رویکردی به صنعت بانکداری

PowerPoint قابل ویرایش
65 صفحه
8900 تومان

لطفا به نکات زیر در هنگام خرید دانلود فایل پاورپوینت بررسی تکنولوژی بازشناسی گفتار فارسی با رویکردی به صنعت بانکداری توجه فرمایید.

1-در این مطلب، متن اسلاید های اولیه دانلود فایل پاورپوینت بررسی تکنولوژی بازشناسی گفتار فارسی با رویکردی به صنعت بانکداری قرار داده شده است

2-به علت اینکه امکان درج تصاویر استفاده شده در پاورپوینت وجود ندارد،در صورتی که مایل به دریافت تصاویری از ان قبل از خرید هستید، می توانید با پشتیبانی تماس حاصل فرمایید

4-در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل اسلاید ها میباشد ودر فایل اصلی این پاورپوینت،به هیچ وجه بهم ریختگی وجود ندارد

5-در صورتی که اسلاید ها داری جدول و یا عکس باشند در متون زیر قرار نخواهند گرفت

— پاورپوینت شامل تصاویر میباشد —-

اسلاید ۱ :

°معرفی تکنولوژی بازشناسی گفتار

° مروری بر کاربردهای بازشناسی گفتار

° نمایش عملی سامانه تایپ گفتاری فارسی نویسا

° نمایش عملی یک سیستم دیالوگ تلفنی ویژه بانکداری

° پرسش و پاسخ

 

اسلاید ۲ :

°گفتار ساده‌ترین و کارآمدترین راه ارتباط انسان هاست

°هدف بازشناسی خودکار گفتار Automatic Speech Recognition (ASR)

±تبدیل گفتار انسان به متن یا دستورالعمل معادل

± گفتار می‌تواند یک فایل صوتی، ورودی با میکروفون، از طریق خط تلفن و یا فرمان از راه دور باشد.

 

اسلاید ۳ :

°یک سیستم بازشناسی کامل :

±قادر به بازشناسی گفتار پیوسته و محاوره‌ای باشد.

±گفتار افراد مختلف، حتی با لهجه‌های متفاوت را بازشناسی نماید.

±در محیط‌های شلوغ و نویزی هم جوابگو باشد.

±بصورت بلادرنگ عمل کند.

±قادر به فراگیری اطلاعات جدید نظیر کلمات، قوانین زبانی و . . . باشد.

°سیستم‌‌های کاربردی امروزی:

±گفتار بایستی به صورت کتابی باشد.

±گفتار بایستی بر اساس حالت استاندارد زبان باشد و تغییرات مربوط به لهجه‌ها منجر به کاهش کارایی می‌شود.

±استفاده از آنها در محیط و شرایط نویزی منجر به افت کارایی و دقت آنها می‌شود.

±اغلب سیستم های کاربردی امروزی تقریبا بلادرنگ هستند.

±سیستم‌های موجود محدود به کلمات موجود در واژگان هستند و از اطلاعات زبانی و معنایی به صورت محدود استفاده می‌کنند.

اسلاید ۴ :

°بازشناسی گفتار کار پیچیده ای است

±ارتباط انسان با ماشین امروزه بر پایه دکمه ها و کلیدهاست، نه گفتار

±اگر شما یک کلمه خاص مانند ”آسمان“ را ۱۰ بار مختلف بیان نمایید، تقریبا در هیچ دو حالتی فایل های ضبط شده دیجیتالی آنها دقیقا یکسان نیست!

پیچیدگی‌های مطرح در سیستم‌های بازشناسی گفتار

uمیزان وابستگی یا استقلال از گوینده

v پیوسته یا گسسته بودن گفتار

w اندازه‌ی واژگان 

x محدودیت‌های زبانی

y کارایی در حضور نویز و در محیط‌های کاربردی مختلف

z ابهام آکوستیکی و میزان اشتباه بین کلمات

اسلاید ۵ :

°پیچیدگی‌های مطرح در سیستم‌های بازشناسی گفتار

uمیزان وابستگی یا استقلال از گوینده

²گوینده های مختلف از نظر مشخصات صدا، سن، لهجه، جنس، نحوه صحبت کردن و … با هم متفاوتند

²وابسته به گوینده (SD: Speaker Dependent): به یک و یا چند گوینده‌ خاص پاسخ می‌دهد

²مستقل از گوینده (SI: Speaker Independent) به تمام گویندگان یک زبان پاسخ می‌دهند

²

²بیشتر روش‌های بازشناسی گفتار امروزی قادرند به هر دو صورت عمل کنند. وابستگی یا استقلال از گوینده در مورد یک سیستم بازشناسی گفتار، در مرحله‌ی آموزش مشخص می‌شود.

²دقت بازشناسی در حالت وابسته به گوینده (بعلت محدودیت و تنوع کمتر) بالاتر از حالت مستقل از گوینده (بعلت پیچیدگی بیشتر) است ولی نیاز به آموزش سیستم به صدای آن کاربر خاص را دارد.

²در کاربردهای واقعی که گوینده از ابتدا مشخص نیست سیستم را مستقل از گوینده آموزش داده می‌شود و سپس هنگام استفاده به کمک برخی رویکردها مانند تطبیق (Adaptation)، سیستم  برای یک گوینده خاص تطبیق می‌شود.

²در برخی کاربردهای دیگر مانند بازشناسی از پشت خط تلفن وابسته به گوینده بودن چندان معنی خاصی ندارد چون گوینده از ابتدا مشخص نیست.

اسلاید ۶ :

°پیچیدگی‌های مطرح در سیستم‌های بازشناسی گفتار

v پیوسته یا گسسته بودن گفتار

²محدودیت‌ بر نحوه ادای کلمات توسط گوینده میزان پیوستگی یا گسستگی کلمات

²بازشناسی کلمات مجزا (IWR: Isolated Word Recognition)

ªگفتار کلمه به کلمه و کاملاً مجزا – هر فایل صوتی یک کلمه

²بازشناسی گفتار متصل (Connected Word Recognition)

ªدنباله‌ای از کلمات که به وسیله سکوتی کوتاه از هم جدا شوند – هر فایل چند کلمه با سکوت در بین کلمات

²بازشناسی گفتار پیوسته کتابی (CSR: Continuous Speech Recognition)

ªگفتار به صورت دیکته کتابی و روان

²بازشناسی گفتار پیوسته محاوره ای (Spontaneous Speech)

گفتار به صورت کاملاً طبیعی بیان میشود، شامل جملات ناقص، سرفه، تپق، مکث‌های طولانی و … است.

² پیچیدگی بازشناسی گفتار پیوسته و فی‌البداهه بسیار زیاد است (مشکلات ناشی از اثر بافت مانند مشخص نبودن مرز کلمات متوالی و ادغام شدن ابتدای یک کلمه با انتهای کلمه قبلی)

²سیستم‌های امروزی فقط برای خواندن کتابی کاربردی هستند و تشخیص گفتار فی‌البداهه یکی از زمینه‌‌های فعال تحقیقات می‌باشد.

اسلاید ۷ :

°پیچیدگی‌های مطرح در سیستم‌های بازشناسی گفتار

w اندازه‌ی واژگان 

²اندازه واژگان یا تعداد کلمات مورد استفاده در یک سیستم بازشناسی از عوامل موثر در دقت و سرعت سیستم است. سیستم‌های IWR فقط برای تشخیص تعداد محدودی کلمه طراحی شده‌اند درحالی‌که بعضی دیگر از سیستم‌ها قادرند مجموعه بزرگی از کلمات را تشخیص دهند.

²معمولاً دقت یک سیستم بازشناسی با افزایش تعداد کلمات کم می‌شود. چرا که در این حالت کلمات شبیه به هم زیاد شده و احتمال جایگزینی یک کلمه با دیگری بیشتر است.

²واژگان کوچک(Small Vocabulary): 1 تا ۹۹ کلمه

²واژگان متوسط (Medium Vocabulary): بین ۱۰۰ تا ۱۰۰۰ کلمه

²واژگان بزرگ (Large Vocabulary) : بین ۱۰۰۰ تا ۶۰۰۰۰ کلمه

²واژگان خیلی بزرگ (Very Large Vocabulary): بیشتر از ۶۰۰۰۰  کلمه

اسلاید ۸ :

°پیچیدگی‌های مطرح در سیستم‌های بازشناسی گفتار

xمحدودیت‌های زبانی

²اطلاعات زبانی شامل دستور زبان و معنا از مهمترین اطلاعات مورد استفاده در یک سیستم بازشناسی گفتار است

²مدل زبانی (Language Model) بیانگر اطلاعات زبانی در سیستم بازشناسی گفتار هستند.

² اطلاعات معنایی به ندرت در این سیستم‌ها استفاده می‌شوند ولی محدودیت های دستوری تقریباً در تمامی سیستم های بازشناسی گفتار پیوسته مورد استفاده قرار می‌گیرند.

²میزان محدودیتی که توسط مدل زبانی درون یک سیستم بازشناسی ایجاد می شود، پیچیدگی (Perplexity) آن مدل زبانی نامیده می‌شود که هرچه مقدار این پیچیدگی کمتر باشد فضای مورد جستجو کوچک‌تر می‌شود.

²تاثیر اطلاعات زبانی در تشخیص (و درک) گفتار در سیستم‌های تشخیص گفتار امروزی تا اندازه‌ای است که می‌توان ادعا کرد که تحقق یک سیستم تشخیص گفتار با واژگان بزرگ (یا خیلی بزرگ) با کاربرد واقعی بدون استفاده از اطلاعات زبانی غیر ممکن است.

اسلاید ۹ :

°پیچیدگی‌های مطرح در سیستم‌های بازشناسی گفتار

yکارایی در حضور نویز و در محیط‌های کاربردی مختلف

²کارایی سیستم های بازشناسی گفتار با وجود اثرات مخربی چون نویز، پژواک، تداخل و اعوجاج که معمولاً از محیط، میکروفن، کانال انتقال و یا صدای گوینده ناشی می‌شوند به شدت کاهش می‌یابد.

²روش‌های مختلفی جهت مقابله با نویز در سیستم‌های بازشناسی ارائه شده است که می‌توان آنها را در سه دسته‌ی ویژگی‌های مقاوم به نویز، تخمین گفتار تمیز  و مبتنی بر اصلاح مدل آکوستیکی تقسیم کرد.

² عدم حفظ کارایی سیستم در شرایط واقعی و عملی (که با نویز همراه است) یکی از بزرگترین مشکلات سیستم های بازشناسی گفتار امروزی است.

اسلاید ۱۰ :

°پیچیدگی‌های مطرح در سیستم‌های بازشناسی گفتار

zابهام آکوستیکی و میزان اشتباه بین کلمات

²کلماتی که شکل نوشتاری متمایز ولی تلفظ یکسان یا شبیه به هم دارند [هم آوا] سبب ایجاد ابهام آکوستیکی شده و ممکن است بجای یکدیگر بازشناسی شوند

ªمثال: «سمر» و «ثمر» – «خواستن» و «خاستن» – «خویش» و «خیش» – «ارز» و «عرض» و «ارض» – و …

²کلماتی که شکل نوشتاری آنها به یکدیگر شباهت دارند [هم نگاره] در استخراج مدل زبانی دچار اشکال می کنند

ªمثال: «نُه» و «نه» – «کرد» و «کُرد» – «مهر» و «مُهر» – «گل» و «گِل» – …

²هر چه تعداد این‌گونه کلمات در بانک واژگان بیشتر شود، دقت سیستم بازشناسی پایین‌تر می‌آید. برای جبران این مسأله، سیستم بازشناسی باید از مدل زبانی در سطوح گرامر و معنا کمک گرفت.

مطالب فوق فقط متون اسلاید های ابتدایی پاورپوینت بوده اند . جهت دریافت کل ان ، لطفا خریداری نمایید .
PowerPointقابل ویرایش - قیمت 8900 تومان در 65 صفحه
سایر مقالات موجود در این موضوع
دیدگاه خود را مطرح فرمایید . وظیفه ماست که به سوالات شما پاسخ دهیم

پاسخ دیدگاه شما ایمیل خواهد شد