بخشی از مقاله
خلاصه
در این مقاله ، چهارچوب جدیدی از جداسازی کور منبع - BSS - ، مانند ICA مبتنی بر مدل تک-ورودی چند-خروجی - SIMO - را شرح می دهیم و درمورد قابلیت کاربرد آن در پردازش سیگنال صوتی بحث می کنیم.هدف از این مقاله، جداسازی نویز زمینه از صوت و به طور کلی جداسازی صدای دو صوتی به کمک ICA و با استفاده از سیستم SIMO می باشد. خروجی ICA به عنوان ورودی یک سیستم SIMO بوده و در خروجی سیستم SIMO، چند سیگنال صوتی خالص و با نویز داریم. سیستم SIMO این مزیت را داردکه با توجه به اینکه دارای چند خروجی می باشد، صوتی را که با نویز بوده وقتی به خروجی ها می رود، نویز بین خروجی ها تقسیم شده و حتما یک خروجی بدون نویز می ماند. در واقع به عنوان یک سوپاپ اطمینان عمل می کند.
کلمات کلیدی: جداسازی کور منبع، آنالیز جز مستقل، سیستم های تک ورودی-چندخروجی
.1 مقدمه
ICA متشکل از چند ICA و یک کنترلر هماندهی است و هر ICA تحت کنترل هماندهی کل سیستم جداسازی به صورت موازی کار می کند. در سناریوی SIMO-ICA، سیگنال چند منبعی ناشناخته که در کانال های انتقال صوتی نامعلوم ترکیب می شوند در میکروفون ها شناسایی شده و این سیگنال ها می توانند نه تنها به سیگنال های منبع تک صوتی بلکه به سیگنال های مبتنی بر مدل SIMO از منابع مستقل همانند میکروفون ها جداسازی شوند. ازاین رو سیگنال های جداسازی شده SIMO-ICA می توانند کیفیت فضایی هر منبع صوتی را حفظ کنند. جدایش منبع کور - BSS - روشی است که برای تخمین سیگنال های منبع اصلی تنها با استفاده از اطلاعات سیگنال های ترکیبی مشاهده شده در هر کانال ورودی به کار می رود. این تکنیک در زمینه های مختلف پردازش سیگنال مانند سیستم های ارتباطاتی دیجیتال، سیستم های آنتن رادار، و سیستم های پردازش سیگنال تصویر و صوتی قابل استفاده است. یک مثال احتمالی در پردازش سیگنال صوتی، سیستم های ارتباط از دور هندزفری - بدون دست - با کیفیت بالا شامل یک دستگاه آنتن میکروفون است 2]،.[1
آنالیز جزء مستقل [3] - ICA - عموما در چهارچوب BSS به کار می رود و روش های مختلف مبتنی بر ICA برای جداسازی صداهای صوتی که با مورد ترکیب پیچیده متناظر است پیشنهاد شده است.[4-9] با این حال، روش های BSS موجود فقط می تواند منابع صوتی ترکیبی را به هر سیگنال مستقل تک صوتی تفکیک کند. ازاین رو، از نقطه نظر عملی، این روش ها دارای یک ایراد جدی هستند، اینکه صداهای جداسازی شده نمی توانند اطلاعات مربوط به جهت دار بودن، موضع یابی یا کیفیت های فضایی هر منبع صوتی را حفظ کنند. چون اطلاعات فوق الذکر برای شنوایی انسان ضروری است، این ایراد مانع از این می شود که روش های BSS در فناوری صوتی با هماندهی - فیدلیتی - بالا مانند پردازش سیگنال دوصوتی ، پردازش سیگنال شنیداری یا سیستم های تولید مجدد صدا که مبنای ضروری برای فناوری واقعیت مجازی صوتی می سازند، به کار رود.
دراینجا اصطلاح "SIMO" ، سیستم انتقال ویژه را بیان می کند که درآن ورودی یک سیگنال تک منبع و خروجی ها، سیگنال های ارسالی مشاهده شده آن در چند حسگر هستند. در SIMO-ICA ، سیگنال های چندمنبعی ناشناخته که از طریق کانال های انتقال صوتی ناشناخته ترکیب شده، در میکروفون ها شناسایی می شوند. دراینجا صداهای ترکیبی به عنوان انطباق سیگنال های صوتی مبتنی بر مدل SIMO از منابع مستقل درنظر گرفته می شود و نه تنها می تواند به سیگنال های منبع تک صوتی بلکه به سیگنال های مبتنی بر مدل SIMO از منابع مستقل همانند میکروفون ها جداسازی شود. ازاین رو، سیگنال های جداسازی شده SIMO-ICA می تواند کیفیت های فضایی هرمنبع صوتی را حفظ کند، یعنی صحنه های صوتی تجزیه شده را نشان می دهند.
.2 مدل سیگنال
فرض کنید M منبع صوتی مستقل و N میکروفن با M N در یک اتاق باشد.در n امین میکروفن و K امین نمونه روابط برای یک سیستم M×N MIMO به صورت زیر می باشد:
.3 معرفی ICA
ICA روش محاسباتی و آماری برای تجزیه پایگاه داده های پیچیده به زیر بخش - بخش فرعی - مستقل است. برای سادگی تفسیر ICA ، دو سیگنال منبع اصلی و دو سیگنال مشاهده شده را تعریف می کنیم.سیگنال های مشاهده شده x1 - t - و - x2 - t به عنوان سیگنال های ثبت شده در نقطه زمانی t از میکروفون ها مشخص می شوند. سیگنال های منبع s1 - t - و - s2 - t همان گونه که منابع کلامی به عنوان اجزاء مستقل در نظر گرفته می شوند تعریف می شوند. سپس - xi - t می تواند به عنوان حاصل جمع وزن دار - si - t با رابطه x=as توضیح داده شود. ماتریس ضرایب a به فاصله بین منابع و میکروفون ها وابسته است: