بخشی از مقاله

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***

کاربرد عملگر غیرخطی انرژي در تخمین فرکانس گام سیگنال گفتار بیماران مبتلا به ناهنجاري حنجرهاي به منظور تشخیص میزان نارسایی

چکیده

فرکانس گام، یا فرکانس نوسانات پایهاي سیگنال صوتی، یکی از بنیاديترین مشخصههایی است که در تشخیص و ارزیابی میزان آسیب دیدگی دستگاه تولید گفتار انسان بویژه حنجره تحت بررسی قرار می گیرد. از آنجاکه عملکرد نامنظم حنجـره در اثر عوامل مختلف بیماري تعیین دقیق فرکانس گام را دشوار میسازد، بدین جهت پیاده سـازي روشـی کـه بتوانـد بـا حداقل خطاي ممکن به تخمین این فرکانس براي یک واکه مشخص بپردازد از اهمیت ویـژهاي برخـوردار اسـت. در ایـن مقاله به ارائه روشی مبتنی بر اعمال عملگر غیرخطی انرژي تیگر برسیگنال بازسازي شدة حنجره به منظور تخمین هرچه دقیق تر فرکانس گام سیگنالهاي صوتی مبتلا به ناهنجاري هاي متنوع گفتاري و همچنین مقایسه آن با برخی از روشـهاي رایج پیشین پرداخته ایم. بررسی انجام شده برتري روش فوقالذکر را نسبت به روشهاي قدیمیتر به اثبات می رساند.

واژههاي کلیدي: "پردازش گفتار"،"آسیبشناسی سیگنال صوتی"،"عملگرغیرخطی انرژي"،"فیلترینگ معکوس"


مقدمه

سیگنال صوتی واکدار سالم از نوسانات منظمی با فرکانسی معین ، به نام فرکانس گام ، به علاوة ساختار مربوط به دینامیک شکل و طول مجراي صوتی در سیستم تولید گفتار انسان تشکیل شده است. به بیان دیگر سیگنال صوتی از طریق مدولاسیون اعمال شده بر روي جریان هواي ورودي از ریهها و عبور آن از حنجره ساخته میشود.[1] بنابراین اولین مسئله مهم در تشخیص بیماریها و اختلالات موجود در سیستم تولید گفتار انسان با بهرهگیري از روشهاي معمول کامپیوتري تخمین هرچه دقیقتر این فرکانس پایهاي براي یک واکه خاص تلفظ شده توسط بیمار است . تعریف سایر پارامترها و ویژگیهاي خاص مورد نیاز و شناخته شده در تحلیل چنین اختلالاتی، بستگی زیادي به تعیین هرچه دقیقتر این فرکانس بنیادي خواهدداشت.


از آنجا که اختلالات گفتاري بوجود آمده در سیگنال صوتی بیماران مبتلا به ناهنجاريهاي حنجرهاي در تلفظ صحیح آواهاي واکدار بطور مستقیم با عدم باز و بسته شدن کامل و بموقع تارهاي صوتی ( دراثر عواملی چون فلج ماهیچههاي درگیر با تارها ، پوشیده شدن تارها توسط سلولهاي سرطانی ، فعالیت بیش از حد و خستگی مفرط عضلات و ... ) در ارتباط است، بدین منظور تخمین هرچه دقیقتر فواصل زمانی مابین باز و بسته شدن تارها از روي سیگنال بازسازي شدة حنجره امکانپذیر خواهد بود.

محاسبه فرکانس پایهاي در سیگنالهاي صوتی آسیب دیده توسط عواملی چون اعوجاج بوجود آمده در دامنه و فرکانس نوسان سیگنال از یک دوره به دورهاي دیگر و یا تغییرات بیش از حد مشاهده شده در آنها ناشی از نحوة عملکرد متغیر حنجره حتی در فواصل زمانی کوتاه با مشکلات عدیدهاي روبروست.
عوامل تولید خطا در تخمین فرکانس پایهاي صداهاي ناهنجار را میتوان به 4 طبقه اصلی تقسیم بندي نمود
:[2]

– 1 تغییرات قابل توجه مشاهده شده در دامنه و فرکانس اصلی نوسانات سیگنال از سیکلی به سیکل دیگر
- 2 حضور اجزاء شامل زیرهارمونیکها
- 3 حضور عناصر غیر متناوب با شدت بالا
- 4 اثر به جاي مانده از ساختارآسـیب دیـدة حنجـره کـه بیانگر رفتاردینامیک اجزاء سیستم تولید گفتار میباشد.

بازسازي رفتار حنجره

فیلترینگ معکوس لب و مجراي صوتی

یکی از رویه هاي معمول در استخراج رفتار دینامیک تارهاي صوتی استفاده از روش فیلترینگ معکوس می باشد.

اولین گام در اجراي این رویه جبرانسازي و حذف اثر فیلترهاي مدل کنندة لب و همچنین مجراي صوتی از روي سیگنال گفتار S(n) به منظور دستیابی به پروفایل سرعت جریان هواي عبوري از بین تارهاي صوتی است.

اولین مرحله در این گام بصورت حذف اثر لب از روي سیگنال گفتاري و بدست آوردن خطسیر پروفایل سرعت جریان هوا قبل از عبور از لب Sl (n)  قابل تعریف خواهد بود. در واقع شکل موج فشار سیگنال صوتی از طریق امپدانس تابشی R(z) با سرعت حجمی هواي عبوري از میان لبها ارتباط خواهد داشت (شکل.(1 براي فرکانسهاي
کمتر از 4000Hz فشارهواي ناشی از سیگنال صوتی درفاصله l1 از لبها با مشتق زمانی سرعت حجمی نرمالیزهنشدة هواي عبوري از میان آن با تاخیر زمانی l1 / c ( که در آن سرعت انتشار صوت میباشد) متناسب است. با صرفنظر از ضریب تناسب و تاخیر زمانی، رابطه تقریبی امپدانس تابشی لبها در فرکانسهاي پایین بصورت زیر قابل بیان است: [3]

در آزمایشات انجام شده مقدار مجاز براي ضریب z−1 در محدودة 0.98 ≤ α ≤ 1 قابل تغییر است.
مرحله بعد در این گام عبارتست از حذف اثر فیلتر حنجره از روي سیگنال بدست آمده از مرحله پیشین به منظور دستیابی به سیگنال . Sv (n) در واقع اثر بدست آمده در این مرحله بیانی است از تحریک تابع تبدیل فیلتر تمامقطب مدلکنندة مجراي صوتی توسط سیگنال تحریک کنندة دستگاه تولید گفتار متشکل از قطار ضربهاي با فواصل زمانی برابر با دورهتناوب گام سیگنال صوتیخروجی.

تابعتبدیل تمامقطب مجرايصوتی بصورتزیربیان میگردد :



به منظور رسیدن از Sv (n) به سیگنالی با طیف قدرت سفید از یک فیلتر وینر (Wiener Filter) بطور معکوس بهعنوان سفید کنندة طیف سیگنال Sv (n) استفاده شده است. در عمل فیلتر وینر معادل با استفاده از یک شبکه پارکر تطبیق یابنده (PARCOR lattice) از مرتبه 64 پیادهسازي شده است. اگر فیلتر وینر بدست آمده با پاسخ ضربه hv0 (n) به سیگنال Sl (n) که در آن اثر لب حذف گردیدهاست اعمالگردد، تخمین اولیهاي از سیگنال u0 (n) ناشی از اعمال اثر تحریک بر فیلتر حنجره که نتیجه حذف اثر لب و مجرايصوتی از سیگنال گفتار میباشد بدست خواهد آمد (شکل.(2

بدین دلیل که بهترین درجه براي فیلترهاي لب و حنجره با قاطعیت قابل تعیین نمیباشد از این رو تضمینی نیز براي بهینه بودن تخمین اولیه سیگنال u0 (n) وجود نخواهد داشت. بنابراین بهینه سازي تخمین سیگنال حنجره از طریق تکرار پیدرپی رویه ذکر شده بصورت بازگشتی امکانپذیر خواهد بود (شکل.(3 به محض بدست آوردن اولین تخمین از سیگنال حنجره از آن براي بدست آوردن تخمین جدیدي از u(n) استفاده خواهد شد. رویه مزبور بدین صورت خواهد بود که در آن از تخمین اولیه بدست آمده از سیگنال حنجره میتوان به منظور محاسبه پاسخ ضربه فیلتر معکوس آن که جهت حذف اثر حنجره از سیگنال Sl (n) بکار گرفته میشود استفاده نمود. سپس مجدداً از Sv (n) اصلاح شده در این مرحله جهت محاسبه

ضرایب فیلتر تمام قطب مجراي صوتی و کانولوشن Sl (n) با معکوس آن جهت دستیابی به تخمین دقیقترياز u(n) بهرهبرداريمیشود. با تکرار پیدرپی مراحل فوق تخمین مناسبی از سیگنال حنجره قابل حصول خواهد بود.[4,5]

عملگر انرژي تیگر

از آنجاکه در اغلب سامانههاي تحلیل کنندة سیگنالهاي گفتاري از خصوصیات خطی شدة روند انتشار هـوا در طـی مجراي تولید صوت در انسان استفاده میشود، لـذا مناسـب است تا در شرایطی که با گونهاي از اختلال و ناهنجـاري در محـل اسـتقرار تارهـاي صـوتی، کـه در آن دینامیـکهـاي غیرخطی در نحوة انتشار موج سیال ورودي از ناي به داخل مجراي تولید سیگنال گفتار دخالت دارند، مواجه هستیم از روشهاي تحلیل غیرخطـی بـراي بیـان رفتـار آن اسـتفاده نماییم. همچنین در نظر گرفتن پدیدههایی چون جریانهاي گردابی و اغتشاش سیال در اطراف شکاف حنجـره مـا را در درك عمیهرچه دقیقتر و قتر رویه انتشار و تولیـد اصـوات یاري مینماید. در واقع ایدة مدلسازي سـایر منـابع تولیـد کننــدة انــرژي آکوســتیکی در ارزیــابی میــزان کیفیــت سیگنالهاي گفتاري در کاربردهاي کلینیکی نقشی کلیدي بازي میکند.[6]

مسئله جداسازي منابع انرژي صـوتی ماننـد جریانهـاي گردابی از یکدیگر، که در تولید سیگنالهاي گفتـاري دخیـل میباشند، براي اولین بار توسط تیگر مورد توجه قرار گرفته اسـت. تحقیقـات وي بـر روي معــادلات مکانیـک حرکتـی جریان هوا در طول مجراي صوتی بـا درنظـر گـرفتن جـرم، مومنتوم و انرژي آن منجر به ابداع عملگر انـرژي غیرخطـی اسـت تفاضلیاي شـده کـه قـدرت تعقیـب مدولاسـیونهاي AM-FM را با محاسبه تخمینـی از حاصلـضرب دامنـه و فرکـانس متغیـر بـا زمـان آنهـا در یکـدیگر از خـود نـشان میدهد.

عملگر تیگر پیوسته- زمان

عملگر انرژي تیگر براي سـیگنالهاي پیوسـته در حـوزة زمان با رابطه غیرخطی زیر تعریف میشود: [7]


با در نظـر گـرفتن سـیگنال x(t) بـصورت یـک نوسـانگر نامیراي خطی و اعمال عملگر تیگر بر روي آن داریم :

همانطور که دیده میشود، خروجـی عملگـر تیگـر برابـر بـا Aer tω0 2 بوده و با انرژي منبع تولیـد نوسـان متناسـب

است. در واقع به همین علت از عملگر ψ c بعنـوان عملگـر انرژي نام بـرده مـیشـود. همچنـین خروجـی ایـن عملگـر غیرخطی بـراي حاصلـضرب دو سـیگنال مجـزا در یکـدیگر بــصورت ترکیــب غیرخطــی اعمــال عملگــر بــر هریــک از سیگنالها بطور جداگانه قابل بیان خواهد بود :

عملگر تیگر گسسته- زمان با گسستهسازي رویه مشتقگیري میتوان بـه بیـانی از عملگر انرژي تیگر در حوزة سیگنالهاي گسستهزمان دسـت یافت. اگر مشتقگیري را بصورت تفاضل دونمونه متـوالی از یکدیگر در نظر بگیریم بـه عبـارت ارتبـاط دهنـدة ψ d در حوزة گسسته به معادل خود یعنـی ψ c در حـوزة پیوسـته خواهیم رسید :

بطورمثال با درنظرگرفتن رابطه یک سیگنال AM بـصورت
که در آن رونـد تغییـرات بخـش اول در مقایـسه بـا بخـش دوم(سیگنال کریر) بسیار کمتر باشد، و با اعمال ψ dداریم :

بنابراین با فرض خواهیم داشت
:

همانطور که از روابط اسـتنباط مـیشـود، خروجـی عملگـر گسسته تیگر براي سیگنال ورودي AM با ضریب ثابتی که دربرگیرندة اطلاعات کریر میباشد با انرژي جزء مدوله شده نسبت مسقیم دارد.

رویه فوق برروي یک نمونه ازسیگنال FM بصورت زیر:

فرکانس لحظهاي باشد نتیجهاي بصورت زیر خواهد داشت :

بنــابراین خروجــی عملگرتیگــر بــراي ســیگنالهاي FM ،

تعقیبکنندة انرژيکریر درفرکانسلحظهاي Ωi خواهد بود.
از آنجا که سـیگنال صـوتی ناهنجـار حتـی در پنجـرههـاي زمانی کوتاه در اثر عوامل بیماري از نظر دامنه و فرکانس به شدت تغییر میکند بنابراین در بسیاري از موارد لازم اسـت تا تغییرات دامنـه و فرکـانس لحظـهاي سـیگنال بـه جـاي دردست داشتن

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید