دانلود فایل پاورپوینت بازشناسی گفتار ( Speech Recognition )

پاورپوینت قابل ویرایش

28 صفحه

قیمت پاورپوینت 000 149 تومان

این پاورپوینت دارای ضمانت بازگشت وجه میباشد

شرکت مگ ایرانز ضمانت می کند تا 48 ساعت ،اگر به هر دلیلی از خرید خود ناراضی بودید ، مبلغ آن به صورت کامل و بدون چون و چرا، برگشت داده شود .جهت درخواست برگشت وجه ، با پشتیبانی تماس بگیرید .

بخشی از پاورپوینت

--- پاورپوینت شامل تصاویر میباشد ----

اسلاید 1 :

تشخيص گفتار انسان توسط ماشين و تبديل آن به متن يا دستورالعمل معادل

نكات مطرح در بازشناسي گفتار

تعداد كلمات مورد بازشناسي

پيوسته يا گسسته بودن اداي كلمات

وابستگي يا استقلال از گوينده

اسلاید 2 :

يک سيستم بازشناسي کامل :

قادر به بازشناسي گفتار پيوسته و محاوره‌اي باشد.

گفتار افراد مختلف، حتي با لهجه‌هاي متفاوت را بازشناسي نمايد.

در محيط‌هاي شلوغ و نويزي هم جوابگو باشد.

بصورت بلادرنگ عمل کند.

قادر به فراگيري اطلاعات جديد نظير کلمات، قوانين زباني و . . . باشد.

سيستم‌‌هاي کاربردي امروزي:

گفتار بايستي به صورت کتابي باشد.

گفتار بايستي بر اساس حالت استاندارد زبان باشد و تغييرات مربوط به لهجه‌ها منجر به کاهش کارايي مي‌شود.

استفاده از آنها در محيط و شرايط نويزي منجر به افت کارايي و دقت آنها مي‌شود.

اغلب سيستم هاي کاربردي امروزي تقريبا بلادرنگ هستند.

سيستم‌هاي موجود محدود به کلمات موجود در واژگان هستند و از اطلاعات زباني و معنايي به صورت محدود استفاده مي‌کنند.

اسلاید 3 :

انواع سيستم هاي بازشناسي گفتار بر اساس تعداد كلمات

واژگان کوچک(Small Vocabulary): 1 تا 100 کلمه

واژگان متوسط (Medium Vocabulary): بين 100 تا 1000 کلمه

واژگان بزرگ (Large Vocabulary) : بين 1000 تا 60000 کلمه

واژگان خيلي بزرگ (Very Large Vocabulary): بيشتر از 60000 کلمه

انواع سيستم هاي بازشناسي گفتار بر اساس وابستگي يا استقلال از گوينده

وابسته به گوينده (SD: Speaker Dependent): به يک و يا چند گوينده‌ خاص پاسخ مي‌دهد.

مستقل از گوينده (SI: Speaker Independent) به تمام گويندگان يک زبان پاسخ مي‌دهد.

اسلاید 4 :

انواع بازشناسي گفتار بر اساس پيوسته يا گسسته بودن كلمات

بازشناسي کلمات مجزا (IWR: Isolated Word Recognition)

گفتار کلمه به کلمه و کاملاً مجزا – هر فايل صوتي يک کلمه

p دنباله‌اي از کلمات که به وسيلة سکوتي کوتاه از هم جدا شوند – هر فايل شامل چند کلمه با سکوت در بين کلمات

بازشناسي گفتار پيوسته کتابي (CSR: Continuous Speech Recognition)

گفتار به صورت ديکته کتابي و روان

بازشناسي گفتار پيوسته محاوره اي (Spontaneous Speech Recognition)

گفتار به صورت کاملاً طبيعي بيان ميشود، شامل جملات ناقص، سرفه، تپق، مکث‌هاي طولاني و ... است.

اسلاید 5 :

واحد آوايي: واحدي از زبان كه در بازشناسي گفتار مورد مدلسازي قرار مي گيرد مانند كلمه (word)، واج (phoneme)، هجا (syllable)، واحدهاي وابسته به بافت (context dependent) و ...

در بازشناسي گفتار براي هر واحد آوايي يك مدل (آوايي) آكوستيك تشكيل مي شود.

واحد آوايي بسته به نوع بازشناسي گفتار (پيوسته يا گسسته، با واژگان كوچك يا بزرگ) انتخاب مي گردد.

واحد آوايي براي بازشناسي گفتار با واژگان كوچك معمولاً كلمه است.

براي بازشناسي گفتار پيوسته با واژگان بزرگ معمولاً واج ها به عنوان واحد آوايي انتخاب مي گردند.

اسلاید 6 :

بازشناسي گفتار با رويکرد تشخيص الگو

با فرض داشتن دنباله آكوستيك A، دنباله كلمات W را طوري پيدا كنيد كه P(W|A) ماكزيمم شود.

با استفاده از قانون بيز:

P(A|W): احتمال مشاهده دنباله آكوستيك A به شرط مشاهده دنباله كلمات W ← با استفاده از مدل آوايي (آكوستيك) محاسبه مي شود.

P(W): احتمال رخداد دنباله كلمات W در زبان ← با استفاده از مدل زباني به دست مي آيد.

اسلاید 7 :

بازشناسي گفتار داراي دو فاز آموزش (Train) و آزمون (Test) مي باشد.

آموزش: مدل هاي آكوستيك و زباني با استفاده از داده هاي آموزشي تشكيل مي شوند.

آموزش مدل آكوستيك: با استفاده از مجموعه اي از داده هاي گفتاري، الگوهاي مربوط به واحدهاي آوايي (مانند کلمه، واج و ...) مدل‌سازي مي‌شوند.

آموزش مدل زباني: با استفاده از مجموعه اي از داده هاي متني، پارامترهاي مدل زباني (مثلاً احتمالات n-gram) استخراج مي شود.

آزمون (استفاده): مقايسه گفتار ورودي با الگوهاي آموزش داده شده جهت تشخيص واحدهاي آوايي موجود در گفتار ورودي

اسلاید 8 :

دادگان گفتاري (speech database): مجموعه اي از فايل هاي صوتي حاوي گفتار كه در آن معمولاً گوينده هاي مختلف كلمات يا جملات مختلفي را بيان كرده اند.

معمولاً در كنار هر فايل صوتي، يك فايل متني (فايل برچسب) هم وجود دارد كه در آن متن گفتار مشخص شده است.

انواع برچسب دهي:

واجي (phonemic)

آوايي (phonetic)

كلمه اي

دادگان هاي گفتاري كه شامل گفتار پيوسته هستند، ممكن است داراي تقطيع در سطح واج يا كلمه هم باشند.

دادگان گفتاري بسته به كاربرد مي تواند ميكروفوني يا تلفني باشد.

دادگان هاي گفتاري براي آموزش (train) مدل هاي آكوستيك به كار مي روند.

اسلاید 9 :

استخراج ويژگي: سيگنال گفتار به بخش هاي كوچكي به نام فريم تقسيم مي شود و از هر فريم يك بردار ويژگي شامل تعدادي ضريب بازنمايي استخراج مي گردد.

هدف: کاهش حجم محاسبات و حذف افزونگي‌هاي موجود در سيگنال گفتار

طول فريم ها: 10 تا 50 ميلي ثانيه (با هم پوشاني 25% تا 75% بين فريم ها)

تعداد ضرايب استخراجي از هر فريم: بين 10 تا 13 ضريب

روش هاي رايج

ضرايب كپستروم در مقياس مل (MFCC)

ضرايب پيشگويي خطي (LPC)

اسلاید 10 :

با استفاده از داده هاي آموزشي، يك مدل آكوستيك براي هر واحد آوايي آموزش داده مي شود.

داده هاي آموزشي متناسب با كاربرد از يك دادگان گفتاري مناسب انتخاب مي شوند.

مرحله استخراج ويژگي براي تمام داده هاي آموزشي انجام مي شود و با استفاده از بردارهاي ويژگي استخراج شده، مدل هاي آكوستيك آموزش داده مي شوند.

معمولاً براي هر واحد آوايي يك مدل آكوستيك آموزش داده مي شود.

روش هاي رايج در مدل سازي آكوستيك

مدل مخفي ماركوف ( HMM)

انطباق زماني پويا (DTW)

شبكه عصبي مصنوعي (ANN)

روش هاي تركيبي

در متن اصلی پاورپوینت به هم ریختگی وجود ندارد. برای مطالعه بیشتر پاورپوینت آن را خریداری کنید

ادرس کوتاه https://magirans.com/id/33372

مقالت رو پیدا نکردی ؟

ما رایگان واست سرچ میکنیم .فقط کافیه موضوع و شماره موبایلت را در کادر ثبت موضوع ، وارد کنی و تمام . ما لیستی از بهترین عناوین که مرتبط با موضوع شماست را در (روبیکا ، ایگپ ، ایتا یا واتساپ) تقدیمتون میکنیم.

ثبت موضوع

با تشکر از شما
درخواست بررسی موضوع مقاله شما با موفقیت ثبت گردید . کارشناسان ما بزودی نتیجه بررسی را به شما اطلاع میدهند .

درباره مگ ایرانز

مگیرانز برندی معتبر در بین کاربران فضای علمی ایران

مگ ایرانز یک سایت خدماتی اینترنتی محسوب می شود که روزانه مقالات و پاورپوینت های زیادی را جمع آوری ، تهیه و در دسترس دانشجویان ، دانش‌آموزان و محققین قرار می‌دهد . گروه مگ ایرانز در سال 1390 زمانی که هنوز کسب و کارها حالت سنتی داشتند و کافی نت ها به صورت حضوری در سطح شهر فعالیت می‌کردند با ایده کافی نت آنلاین راه اندازی شد . طرح اولیه این شرکت در ابتدا با ایده و تلاش دو دانشجوی خلاق راه اندازی گشت . سپس در سال دوم راه اندازی ، پس از مستقر شدن در دفتر کاری مجهز و استخدام چند نیروی ماهر ،توانستند در طول 5 سال به اهداف خود یعنی 1- رضایت و اعتبارحداکثری در بین کاربران اینترنتی 2- گرد اوری بانکی جامع از مقالات ( 60 هزار مقاله و پاورپوینت فارسی وقابل ویرایش ) 3- همکاری با بیش از 100 کافینت در سطح ایران ، دست پیدا کنند و این راه همچنان ادامه دارد . . .

تماس با ما

سوالات متداول

دانلود فایل پاورپوینت بازشناسی گفتار ( Speech Recognition )

بخشی از پاورپوینت

--- پاورپوینت شامل تصاویر میباشد ----

اسلاید 1 :

اسلاید 2 :

اسلاید 3 :

اسلاید 4 :

اسلاید 5 :

اسلاید 6 :

اسلاید 7 :

اسلاید 8 :

اسلاید 9 :

اسلاید 10 :

چرا مگ ایرانز؟

تحقیق در مورد مروری بر سیستم تشخیص گفتار و کاربرد آن

دانلود پاورپوینت iris recognition

دانلود پاورپوینت گفتار درمانی

دانلود فایل پاورپوینت بررسی تکنولوژی بازشناسی گفتار فارسی با رویکردی به صنعت بانکداری

دانلود فایل پاورپوینت گفتار درمانی

دانلود فایل پاورپوینت معیارهای مبتنی بر سیگنال برای تخمین نقاب طیف‌نگاری در جهت بازشناسی گفتار

دانلود فایل پاورپوینت مدلسازی سیستم عصبی – عضلانی تولید گفتار

دانلود فایل پاورپوینت سیستم های خودکارسازی خانه فعال شونده با گفتار

دانلود فایل پاورپوینت IRIS RECOGNITION

دانلود فایل پاورپوینت Part - of - Speech tagging