بخشی از مقاله

چکیده

 در این مقاله، یک روش شکلدهی پرتو باند پهن وفقی برای بهسازی گفتار از عوامل مخرب محیطی نظیر نویز و پژواک ارائه میشود. در این روش با ترکیب آرایه تودرتو خطی و شکلدهندهی پرتوی مصالحهای، ساختاری جدید برای بهسازی گفتار ارائه شده است. روش پیشنهادی شامل دو مرحله است: در مرحله اول، یک آرایه تودرتو خطی با چهار زیرآرایه به منظور ایجاد شکلدهی باند پهن استفاده شده است. در مرحله دوم، در هر زیرآرایه با استفاده از یک شکلدهندهی پرتوی مصالحهای عمل حذف نویز و پژواک انجام میپذیرد. سپس با شبیهسازی یک اتاق به بررسی و مقایسه عملکرد روش پیشنهادی میپردازیم. نتایج شبیهسازی بیانگر اثربخشی قابل ملاحظهی این روش بر کیفیت سیگنال گفتار و نسبت سیگنال به نویز است.

کلید واژه- آرایه تودرتو خطی، بهسازی گفتار، حذف نویز، حذف پژواک، شکلدهی پرتو.

-1 مقدمه

دریافت دست-آزاد در بسیاری از کاربردها از جمله کنفرانس از راه دور مورد نیاز بوده و هست. یک آرایه میکروفنی را میتوان برای دریافت سیگنالهای محیط مورد استفاده قرار داد. این آرایه شامل چندین میکروفن است که با الگویی خاص چیده شدهاند. سیگنال دریافتی توسط میکروفنها معمولا شامل گفتار مطلوب و تداخل میباشد که باید برای کاهش تداخل و استخراج گفتار مطلوب مورد پردازش قرار گیرد .[2 ,1]در این مقاله، بر مبحث شکلدهی پرتو توسط آرایه میکروفنی برای بهبود کیفیت گفتار تمرکز شده است. با توجه به ویژگیهای سیگنال گفتار از جمله باند پهن بودن سیگنال گفتار و محیط دریافت آن، پردازش سیگنال آرایه میکروفنی دارای ویژگیها و چالشهایی منحصر به فرد است.

یکی از این ویژگیها نیاز به پردازش باند پهن است. ایجاد شکلدهی باند پهن بدلیل وابستگی خصوصیات آرایه به فرکانس بسیار مشکل است. ویژگی بعدی مورد نیاز در پردازش سیگنال آرایه میکروفنی، پردازش میدان نزدیک است .[4 ,3] بدلیل قرار گرفتن منبع سیگنال در نزدیکی آرایه، فرض ساده کنندهی میدان دور برقرار نبوده و در نظر گرفتن این فرض باعث اختلال در کارآیی آرایه در سناریوی میدان نزدیک میشود. از دیگر چالشهای پیش رو در بحث پردازش سیگنال آرایه میکروفنی، پدیدهی اعوجاج سیگنال گفتار مطلوب است. اعوجاج گفتار هنگام استفاده از الگوریتمهای وفقی شکلدهی پرتو در محیطهای پر انعکاس اتفاق میافتد .[4]

الگوریتهای وفقی شکلدهی پرتو متداول به دلیل شباهت سیگنالهای مسیر مستقیم و بازتابهای آن باعث از بین رفتن سیگنال مطلوب میشوند. در مرجع [5] برای اینکه بتوان تا حدودی به این سه چالش پاسخ داده شود، شکلدهی پرتو زیرباندی چند نرخی ارائه شده است. در این روش، یک آرایه تودرتو با بانک فیلتر چند نرخی زیرباندی ترکیب شده و در هر زیرباند از یک حذف کنندهی وفقی نویز - - ANC1 به همراه یک انتخابگر پرتو - - SB2 استفاده شده است.در این مقاله، ما ساختار حذفکنندهی وفقی نویز انتخابگر پرتو را با شکلدهندهی پرتو مصالحهای3 جایگزین کردهایم.

روش پیشنهادی شامل دو قسمت است: ابتدا سیگنالهای رسیده به میکروفونهای آرایه در زیرآرایهها تقسیم میشوند و سپس با استفاده از یک شکلدهندهی پرتو مصالحهای عمل پردازش یا بهسازی در هر زیرباند انجام میپذیرد.این مقاله شامل بخشهای زیر است. در بخش دوم، مدل سیگنال استفاده شده توضیح داده شده و در بخش سوم، ساختار کلی سیستم پیشنهادی ترکیب آرایه تودرتو و شکلدهندهی مصالحهای ارائه میشود. در بخش چهارم، عملکرد روش پیشنهادی بررسی و با روشهای پایه مقایسه خواهد شد. بخش پنجم نیز شامل خلاصه و نتیجهگیری خواهد بود.

-2 مدل سیگنال

در این تحقیق، مدل سیگنال همانند حالت مرسوم در پردازش آرایهای سیگنال گفتار در نظر گرفته شده است. در این مدل یک آرایه با N حسگر سیگنال منبع را که در پاسخ ضربه سیستم بین منبع و هر حسگر کانوالو و با نویز محیط جمع شده، دریافت میکند. سیگنالهای دریافتی در حوزهی زمان به صورت زیر بیان میشوند :[1]که در آن    g n  t  پاسخ ضربهی صوتی از منبع صوتی نامعلوم s t تا محل میکروفن n ام است. همچنین، عملگر معرف کانولوشن خطی و  vn t  نویز جمعشونده در میکروفن n ام است. در اینجا فرض بر آن است که پاسخ ضربهی اتاق نامتغیر بازمان بوده و سیگنالهای xn tgn  t   s t و vn t  حقیقی، ناهمبسته، باند پهن و با میانگین صفر هستند. با این تعریف، درطول آرایه سیگنالهای  t xnهمبسته و سیگنالهای نویز  vn   tناهمبسته خواهند بود. با بازنویسی فرمول 1 در حوزهی STFT داریم:                                          

-3 روش پیشنهادی بر اساس ترکیب آرایه میکروفنی تودرتو و شکل دهنده پرتوی مصالحهاییکی از روشهای مؤثر و در عینحال ساده برای پوشش آرایهای سیگنالهای باندپهن، استفاده از آرایهی تودرتو است .[7 ,6] آرایهی تودرتو از ترکیب چند زیرآرایه تشکیل شده و هر یک از زیرآرایهها برای پوشش پهنای فرکانسی خاصی مورد استفاده قرار میگیرد. ساختار کلی ترکیب آرایهی تودرتو و شکلدهندهی پرتو مصالحهای در شکل 1 نشان داده شده است. عملکرد کلی این سیستم بدین صورت است که سیگنال رسیده به حسگرهای آرایهی تودرتو با نرخ نمونهبرداری بالایی Fs نمونه برداری شده و بعد از تقسیم شدن در زیرآرایهها، ازفیلترهای آنالیز...,Hi   k   i=1,2عبورداده میشوند.

در ادامه، بعداز کاهش نرخ نمونه برداری Diدر هر زیرباند، عمل بهسازی گفتار با استفاده از شکلدهندهی پرتوی مصالحهای در فرکانس نمونهبرداری    Fs    Fi    انجام میپذیرد. در انتها نیز با افزایش نرخ Diنمونه برداری  Ii، خروجی زیرباندها از یک بانک فیلتر سنتزGi k عبور داده شده و سپس با یکدیگر ترکیب میشوند تا خروجی کلی بدست آید. در کل ساختار بهسازی گفتار توسط آرایهی تودرتو و شکلدهندهی پرتو مصالحهای را میتوان به سه قسمت اصلی تقسیمبندی کرد که در ادامه به بررسی هر یک میپردازیم.

1-3 -آرایهی تودرتو خطی

اگر    برای    سیگنال گفتار پهنای باندی    بین 50Hz تا 7kHz درنظر گرفته شود، آرایه تودرتو خطی برای    پوشش پهنای باند7200Hz    50    BT با چهار زیرآرایه طراحی میشود. زیرآرایه اول برای پوشش بالاترین پهنای فرکانسی یعنی فرکانسهایB1      3600  7200Hz  طراحی شده است و بر اساس رابطهی بین  طولموج و فاصلهی بین میکروفنها در آرایه d1 و همچنین فرکانس مرکزی این پهنای فرکانسی    5400Hz ، کمترین فاصله  بین میکروفنها در این زیرآرایه باید از d1 بدست آمده، کمتر باشد. در اینجا d 2.4cm در نظر گرفته شده است. زیرآرایه دومبرای پوشش پهنای فرکانسی B21800  3600Hzطراحی شده و فاصلهی بین دو میکروفن در این زیرآرایه برابر d1d2 2 قرارداده شده است.

در زیرآرایه سوم فاصلهی بین میکروفنهاd3    4  d1    است تا از این طریق بتوان محدودهی فرکانسی1800Hz    B3 900 را به خوبی پوشش داد. زیرآرایه چهارم که برای پوشش پایینترین پهنای فرکانسی یعنی  900Hz    50    B4طراحی شده دارای فاصلهی بین میکروفنی در حد    8  d1    d4است. در اینجا، آرایه میکروفنی تودرتو طراحی شده در هر زیرآرایه دارای 5 میکروفون بوده در مجموع دارای 11 میکروفن و طولی برابر 76.4cm است.

-2-3 بانک فیلتر چندنرخی

در هر زیرباند برای جلوگیری از مسئله الیاسینگ و همچنین برای ایجاد باند فرکانسی مناسب برای هر زیرآرایه، به فیلترهای آنالیز و سنتز نیاز است. وجود نمونه برداری چندنرخی باعث جلوگیری از پیچیدگی محاسباتی و سهولت در طراحی و پیادهسازی شکلدهی باندپهن میشود. فیلترهای آنالیز H i k و کاهش دهندههای نرخ نمونهبرداری Di را میتوان از طریق ساختار درختی که در [8 ,5] توضیح داده شده است، پیادهسازی کرد. همچنین بدلیل شباهت کامل بین فیلترهای سنتز Gi k و H i k ، ترکیب این فیلترها و Ii ها را نیز میتوان با استفاده از ساختار درختی اجرا کرد. پاسخ فرکانسی فیلترهای آنالیز در شکل2 نشان داده شده است.

-3-3  شکلدهی مصالحهای پرتو

در این بخش ابتدا به معرفی شکلدهندهی پرتو MVDR1 و فیلتر وینر چندکاناله 2 - MWF - پرداخته و سپس، شکلدهندهی پرتو مصالحهای را -که حالت کلی و تعمیمیافته شکلدهندهی پرتو MVDR و فیلتر وینر چندکاناله است- معرفی مینماییم.

الف - فیلتر وینر چندکاناله فیلتر وینر چندکاناله به دلیل فرمولبندی ساده و همچنین قابلیت پیادهسازی، کاربردهای فراوانی دارد. ضرائب این فیلتر به صورت زیر بدست میآید :[1]

ب - MVDR شکلدهندهی پرتو MVDR برای اولین بار توسط کاپن ارائه

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید