بخشی از مقاله
چکیده
جداسازي منابع یکی از مسائل اساسی و رو به گسترش در حوزه پردازش سیگنال است که به مساله جداسازی سیگنال های نامعلومی که مخلوط آن ها به واسطه یک ترکیب کننده نامعلوم دریافت شده می پردازد.جواب منحصربفرد براي این مساله وجود ندارد و تکنیکهای مختلفی تا کنون ارایه شده است. ماتریس ها یکی از روش های پر کاربرد در ذخیره سازی داده ها و به طبع آن روش های خطی همچون تجزیه های ماتریسی به طور گسترده ای مورد استفاده قرار می گیرند. براي کار با داده های زیاد تانسورها که تعمیم از ماتریس ها می باشند و بدنبال آن روش هاي چند خطی معرفی شدهاند. یکی از وی ژگی های مهم تجزیه های ماتریسی و تانسوری خاصیت کاهش بعد است که آن را به ابزار مهمی در استخراج ویژگی، خوشه بندی، طبقه بندی و کاهش بعد و جداسازی منابع کور - - BSS ١ خطی و چند خطی - MBSS - ٢ قرار می دهد. از مهم ترین روش ها در این زمینه می توان به آنالیز مولفه های مستقل خطی و چند خطی - ICA - ، تجزیه نامنفی ماتریس و تانسور - - N MF=NT F و ... اشاره کرد. در این مقاله کاربرد تجزیه تانسورها در زمینه جداسازی کور منابع می پردازیم و کاربردی از آن را زمینه تفکیک سیگنال های مادر و جنین بیان می کنیم.
واژه های کلیدی: تانسور، تفکیک سیگنال، تجزیه تانسوری، تجزیه تاکر، تجزیه .CP١ مقدمه
ریشه آنالیز چند راهی به مطالعات چندجمله ای های مشابه در قرن نوزدهم باز می گردد که توسط گاوس ،کرونکر،کیلی،ویل و هیلبرت صورت گرفت]١[ .بعد از آن تانسورها در زمینه شنوایی،پردازش ویدئو و تصاویر،یادگیری ماشین و علوم فرآیند زیستی استفاده شدند.برای اطلاع بیش تر از کاربرد تانسورها می توان به کتاب های ]١، ۴، ٣[ مراجعه کرد. روش های تجزیه تانسوری مانند تاکر و CP اخیرا به عنوان ابزاری برای آنالیز داده های چند بعدی و به ویژه در زمینه تفکیک BSS چند خطی ،استخراج ویژگی،خوشه بندی و پیشگویی مورد استفاده قرار می گیرند.تانسورها ابزار قدرتمندی برای آنالیز داده های حجیم و کشف روابط و ساختارهای پنهان در آن ها بیان می کنند.
٢ مفاهیم اولیه تانسور
یک تانسور ٣ یک آرایه ی چند راهی ۴ یا یک ماتریس چند بعدی است. مرتبه ۵ تانسور برابر با تعداد ابعاد یک تانسور است که به نام وجه ها یا راه ها نیز شناخته می شود ]١. [ تانسور را می توان به صورت ریاضی زیر بیان کرد: تعریف ٢ . ١. یک تانسور _:::_IN٢_I١A 2 RI از مرتبه N یک آرایه ی N راهی است. اسکالر یک تانسور مرتبه صفر، بردار تانسور مرتبه یک و ماتریس تانسور مرتبه دو است. برای مثال تانسور مرتبه ٣یا آرایه ی سه راهی دارای سه وجه است - یا بعد - که در شکل زیر نشان داده شده است.
تانسور ها از بردارها و ماتریس ها تشکیل می شوند. یک فیبر ١ را می توان یک بردار یا قطعه ای یک بعدی از تانسور در نظر گرفت که با ثابت نگاه داشتن همه ابعاد به جز یکی از آن ها شکل می گیرد در حالی که اسلایس ٢ یک ماتریس یا قطعه دو بعدی از یک تانسور است که با ثابت نگاه داشتن بعضی ابعاد به جز دوتای آن ها به وجود می آید ]۴.[ در کار با تانسورها یا به عبارتی جبر چندخطی، معمولا تانسور را به یک فرم ماتریسی تبدیل و از جبر خطی استفاده می کنیم. تانسور را می توان نسبت به وجوه آن ماتریسی کرد. ٣ تعریف ٢ . ٢. ماتریسی کردن: ماتریس شده تانسور N راهی _:::_IN٢_I١A 2 RI نسبت به وجه n ام که با A - n - نشان داده می شود، ماتریسی است که از چینش مجدد فیبرهای یک تانسور حاصل می شود. عنصر - _ _ _ ; iN ;١ - i تانسور A نظیر عنصر - in; j - در A - n - است
دو دسته از مهمترین تجزیه های تانسوری تاکر و تجزیه SV D چندراهی است که تجزیه CP می باشند. در تجزیه تاکر تانسور هسته پر و در CP یک تانسور قطری است. از مهمترین انواع تجزیه تا کر، نامیده می شود. اغلب روش های خطی جداسازی کور منایع را می توان به عنوان یک مساله تجزیه ماتریسی مقید در نظر گرفت. فرض کنید Y = - yit - 2 RI_T ماتریس مشاهدات ما باشد که داده شده است. ]٢، ۶[ در مدل BSS ما به دنبال یافتن ماتریس های A =2 RI_J ، B 2 RT _J و E 2 RI_T با شرایط مورد نظر هستیم که : برای نمایش ضرب داخلی به کار می رود. A را ماتریس ترکیب،B منابع ناشناخته و E خطا می نامند. هدف اصلی در BSS تخمین منحصر به فرد ماتریس های A و B با توجه به شرایط خاصی همچون استقلال آماری - ICA - ، تنک بودن، - SCA - نامنفی بودن - - NMF یا تعامد - P CA=SV D - است. در بعضی کاربردها ماتریس داده Y به بیشتر از سه عامل تجزیه می شود برای مثال در تجزیه - SV D - شکل زیر را داریم: که A و B ماتریس متعامد و D یک ماتریس قطری است که درایه های روی قطر آن مقادیر تکین Y و نامنفی می باشند.
چندین مجموعه داده را می توان با ماتریس های Yn نشان داد و هر یک از Yn ها را جداگانه و به صورت زیر می توان تجزیه کرد:البته ممکن است در محاسبه An و Bn با برخی از محدودیت ها مانند مستقل بودن ستون ها و یا تنک بودن مواجه شویم که در روش هایی مانند ICA برقرار هستند. زمانی که با داده هاي زیاد سروکار داریم به سراغ روش BSS چند خطی می رویم که گسترده تر و انعطاف پذیرتر از گروه ICA است. زیرا محدودیت های مختلف ممکن است باعث شوند ماتریس های حاصل از تجزیه با یکدیگر متفاوت باشند. از طرف دیگر در دنیای واقعی مولفه های منابع پنهان به ندرت از یکدیگر مستقل هستند بنابراین اگر از روشی مانند ICA که در آن مستقل بودن یکی از شاخصه های مهم به شمار می آید استفاده کنیم ممکن است همه مولفه ها استخراج نشوند.به همین دلیل روش BSS چند راهی که علاوه بر مستقل بودن مولفه ها،شاخصه های دیگری را نیز برای آن ها معرفی می کند را در نظر می گیریم. مدل ساده خطی BSS که در بالا به معرفی آن پرداختیم را می توان برای داده های چند بعدی نیز به کار برد و با استفاده از تجزیه های تانسوری مقید آن را به یک مدل BSS چند خطی گسترش داد.