بخشی از پاورپوینت
--- پاورپوینت شامل تصاویر میباشد ----
اسلاید 1 :
مقدمه
سيستمهاي بازشناسي گفتار پيشين
تأثير نويز در افت کارايي سيستمهاي بازشناسي گفتار
اسلاید 2 :
رويکرد داده گمشده
دو رويکرد اصلي در تئوري داده گمشده :
Data Marginalization
Data imputation
اسلاید 3 :
نقاب طيفنگاري
تعريف نقاب طيفنگاري
انواع نقاب طيفنگاري :
- نقاب سخت
- نقاب نرم
مهمترين و حياتيترين بخش تئوري ويژگيگمشده
اسلاید 4 :
روشهاي تخمين نقاب طيف نگاري
رويكردهاي براساس تحليل سيگنال ( روشهاي bottom-up)
رويکردهاي براساس مدلهاي آماري ( روشهاي top-down )
رويکردهاي براساس تحليل سيگنال و مدلهاي آماري(ترکيب دو روش بالا)
رويكردهاي بر اساس CASA
اسلاید 5 :
هدف نهايی : تخمين دقيق SNR در هر مولفه زمان-فرکانس
معيارهاي تخمين مستقيم SNR
الگوريتم هاي تخمين نويزکلي
الگوريتم هاي تخمين نويز محلي و تخمين SNR محلي
معيارهاي تخمين غير مستقيم SNR بر اساس ويژگيهاي سيگنال گفتار
اسلاید 6 :
معيارهاي تخمين غير مستقيم SNR بر اساس ويژگيهاي سيگنال گفتار
Spectral Entropy Measure
Sparsity Measure
Comb Filter Ratio (CFR)
AutoCorrelation Peak Ratio (ACPR)
Kurtosis
Flatness
اسلاید 7 :
Spectral Entropy Measure
تعريف entropy
enrtropy به عنوان معياري براي peakness
هدف : محاسبه آنتروپي short time fourier transform spectrum
تبديل spectrum به PMF :
محاسبه آنتروپي براي هر فريم :
اسلاید 8 :
Sparsity Measure
proposed Sparsity measure:
If we assume the number of samples of signal is M then:
اسلاید 9 :
Kurtosis
- سيگنالهاي صوت اطراف ما، شامل گفتار، به عنوان سيگنالهاي سوپرگاوسين در نظر گرفته ميشوند.
- Kurtosis معياري براي تعيين تيز بودن نقطه بيشينه ميباشد .
اميدهاي رياضي از ميانگين نمونهها در هر زير باند از هر فريم بدست آمده است.