بخشی از مقاله
چکیده
تبدیل ویژگی به عنوان مرحلهای مهم در سیستم کلاسبندی مطرح میباشد. روشهای تبدیل ویژگی به دو دسته کلی تبدیلات ویژگی مبتنی بر داده و مبتنی بر کلاسبند تقسیم بندی میشوند. روشهای تبدیل ویژگی مبتنی بر داده در فرایند تخمین صرفاً به توصیف دادهها توجه دارد و به خطای کلاسبندی توجهی ندارد. همچنین این روشها بعضاً روی رفتار آماری دادگان دارای فرضیات نادرستی هستند. در مقابل تبدیلات ویژگی مبتنی بر کلاسبند به خطای کلاسبندی توجه دارند و توصیف دادهها را در نظر نمیگیرند.
در صورتی که برای تخمین یک تبدیل ویژگی مناسب باید هر دو جنبه توجه به توصیف دادهها و توجه به خطای کلاسبندی را در نظر گرفت. تبدیل ویژگی خطای کلاسبندی کمینه مبتنی بر هسته ارائه شده روشی است که به توصیف دادهها توجهی ندارد و همچنین کارائی آن وابسته به انتخاب تابع هسته می-باشد. مقاله حاضر روشی برای تعیین تابع هسته برای روشهای غیرخطی مبتنی بر داده بر اساس خطای کلاسبندی معرفی می نماید. بدین منظور از الگوریتم ژنتیک چند هدفه برای ترکیب خطی توابع هسته متداول بهره گرفته شده است. همچنین ازکاربردهای خمینه برای حفظ همسایگی المانها به منظور رسیدن به نتیجه مطلوب استفاده می شود.
.1 مقدمه
کارائی روشهای تبدیل ویژگی غیرخطی مبتنی بر هسته وابسته به نوع و انتخاب تابع هسته میباشد.ایده اصلی توابع هسته1 به این صورت است که ابتدا دادههای ورودی توسط یک تابع غیرخطی نگاشت میشوند و سپس تحلیل متمایزساز خطی روی نتیجه حاصل اعمال میشود. تبدیل ویژگی خطای کلاسبندی کمینه مبتنی بر هسته ارائه شده روشی است که به توصیف دادهها توجهی ندارد و همچنین کارائی آن وابسته به انتخاب تابع هسته میباشد.
از سوئی دیگر روشهای تبدیل ویژگی غیرخطی مبتنی بر داده مانند KLDA و KPCA به خطای کلاسبندی توجه نداشته و عملکردشان وابسته به انتخاب تابع هسته می-باشد. به این منظور در این مقاله از الگوریتم ژنتیک چند هدفه با به کارگیری توابع برازندگی خطای کلاسبندی و اطلاعات متقابل ویژگیها و کلاسها، همبستگی، و رابطه Fisher وWLPPبرای تعیین تابع هسته در روشهای تبدیل ویژگی غیرخطی مبتنی بر داده استفاده شده است. [1]
.2 ایده اصلی توابع هسته
فرض کنید که به تعداد K عدد مشاهده وجود دارد و هر یک از مشاهدات، دارای n بعد میباشند. بنابراین یک ماتریس n K به عنوان ماتریس نمونهها موجود میباشد و یک ماتریس ویژگی با اندازه K n داریم.
هدف تبدیل ویژگیها پیدا کردن یک تابع نگاشتY h : X میباشد به طوری که منجر به ایجاد ویژگیهای جدیدی شود که در نتیجه، عمل دستهبندی با دقت بالاتری ان جام شود. در مورد استخراج ویژگیها بر مبنای توابع هسته، تابع نگاشت یک تابع غیرخطی میباشد و دارای فرم کلی زیر است :
که در این نگاشت، A یک ماتریس مقادیر حقیقی با اندازه m K میباشد. همچنین X k : X ، یک تابع پیوسته، متقارن و مثبت میباشد. همچنین در این رابطه، X ،ماتریس نمونهها میباشد و k - X , z - ، فرم مختصر رابطهk - x1 , z - ,...,k - xK , z - T میباشد. همانطور که در رابطه فوق دیده میشود، ترکیب خطی توابع پایه k - x1 , z - ,...,k - xK , z - ، اجزاء اصلی بردار ویژگیهای جدید h - z - را نتیجه میدهد.
ملاکی که برای بدست آوردن ماتریس A استفاده میشود، برای هر روش متفاوت میباشد و بستگی به مجموعه داده X دارد.
بر مبنای نظریه [2] Mercer، اگر k یک تابع هسته Mercer باشد، آنگاه یک فضای حاصل ضرب نقطهای F و همچنین یک تابع نگاشت : X F موجود میباشد به طوری که:
این روند در شکل 1 نشان داده شده است. در این تعریف،F،فضای ویژگیهای هسته نام دارد و نگاشت ویژگیها نامیده میشود. با توجه به تعریف بالا، اگر یک نگاشت همانی باشد، آنگاه تابع k - x, z - x.z یک تابع متقارن، پیوسته و مثبت میباشد. فضای ویژگیهای F و عملگر حاصل ضرب که روی این فضا انجام میشود، به طور ضمنی، توسط تابع هسته انجام می-گیرد. فضای F و همچنین تابع نگاشت به طور ضمنی ایجاد میشوند.
شکل : - 1 - ایده اصلی تابع هسته
بدست آوردن تابع هسته، یکی از مسائل مهم در این قسمت میباشد. با این وجود، چند کاندید متفاوت برای توابع هسته وجود دارد. که معروفترین آنها عبارتند از: تابع هسته چندجمله-ایk12 ، تابع هسته گاوسیk23 ، تابع هسته درجه دوم گویا:
در ادامه به بررسی روشهای مختلف استخراج ویژگیها بر مبنای توابع هسته میپردازیم.
.3 تحلیل مؤلفه های اصلی بر مبنای توابع هسته
تکنیک اصلی تحلیل مؤلفه های اصلی بر مبنای توابع هسته5 محاسبه تبدیل PCA در فضای نگاشت یافته توسط یک تابع نگاشت غیرخطی است که از ایده هسته برای تخمین این نگاشت استفاده میشود.
KPCA از گذشته تاکنون برای کارهای مختلفی از جمله حذف نویز در پردازش تصویر پیشنهاد شده است که با استفاده از آن یک تصویر تمیز را از روی یک تصویر نویزی ایجاد میکنند
تحقیقات بسیاری بر روی استخراج ویژگیهای کلاسبندی انجام شده است اما هیچ یک از آنها نتوانستهاند تأثیر نویز را بر ویژگیها به خوبی حذف کنند. در حوزه شناسایی کلاسبندی، یکی از مسائل کلیدی، توسعه روشهایی است که امکان شناسایی کلاسبندی را در محیط نویزی بدهند. سیستمهای کنونی شناسایی کلاسبندی، قادر به عملکرد مناسب روی سیگنال کلاسبندی تمیز میباشند.
روش استخراج ویژگیها بر اساس توابع هسته، برای حذف اثر نویز از ویژگیها مورد استفاده قرار گرفته است. در این روش به جای تبدیل گسسته کسینوسی، DCT، KPCA بر روی خروجیهای انرژی بانکفیلتر مل اعمال میشود. نتایج شناسایی کلاسبندی، نشان میدهد که روش KPCA، در زمانی که سیگنال کلاسبندی دارای نویز است، دارای عملکرد بهتری نسبت به DCT میباشد
تأثیر KPCA در شکل 2 به نمایش گذاشته شده است. دو مجموعه داده مصنوعی در شکل 2 - الف - و شکل - 2ب - نشان داده شده است. بعد از اعمال KPCA - با تابع هسته گوسین - مجموعه داده شکل - 2الف - به فرم شکل 2 - ج - و مجموعه داده موجود در شکل - 2ب - توسط روش KPCA با تابع هسته گوسین به فضای جدید نشان داده شده در شکل 2 - د - تبدیل میشوند.
شکل : - 2 - تأثیر KPCA روی مجموعه داده مصنوعی
.4 تحلیل متمایزسازی غیرخطی
در قسمتهای قبل تحلیل متمایزساز خطی به عنوان نگاشت خطی مورد بررسی قرار گرفت. در بسیاری از موارد، تحلیل متمایزساز خطی قادر به پیدا کردن نگاشت خطی مناسب نخواهد بود. به مثال زیر توجه کنید: فرض کنید دادههای ورودی دو بعدیای را در اختیار داریم که توزیع آنها به صورت شکل 3 باشد
شکل : - 3 - توزیع داده های غیرخطی
همانطور که در شکل 3 دیده میشود، دادهها، شامل دو کلاس میباشند که به صورت خطی تفکیکپذیر نیستند. در این مورد بسیار واضح میباشد که هیچ تبدیل خطی با ابعاد پایینتر موجود نمیباشد که بتواند دادهها را به صورت خطی متمایز کند. علاوه بر این تحلیل متمایزساز خطی حتی قادر به تشخیص ساختار دادهها در این مثال نیز نمیباشد