بخشی از مقاله
چکیده
در این مقاله شیوهای از دادهکاوی که در طبقهبندی یادگیری ماشین کاربرد دارد، معرفی میکنیم . هدف اصلی مقاله طبقهبندی دادههای بدون برچسب و با بردن دقت آن می باشد. برای رسیدن به این هدف، داده های بدون برچسب را به کمک ماشین بردار پشتیبان و با استفاده از نامساوی قدرمطلق طبقهبندی میکنیم، برای بالا بردن دقت روش مذکور را با روش های ضریب سیلهوت و انتخاب ویژگی ترکیب می نماییم. سپس برای روش های معرفی شده، محاسبات عددی در ابعاد مختلف ارائه می دهیم . نتایج عددی با ترکیب شیوه فوق با روش سیلهوت و انتخاب ویژگی به طور قابل ملاحظه ای بهبود یافته است. برای مقایسه کارایی روش ترکیبی فوق، از الگوریتم k-means برای مقایسه نیز استفاده میکنیم .
واژه های کلیدی: طبقهبندی، نامساوی قدرمطلق، ماشین بردار پشتیبان، یادگیری ماشین، دادههای بدون برچسب.
-1 مقدمه
ماشین بردار پشتیبان - SVM - 1، یک طبقه بندی کننده دودویی است که پیش بینی می کند یک نمونه در کدام طبقه قرار گیرد. ایده SVM برای جداسازی داده ها به این صورت است که ابتدا یک ابرصفحه جداکننده می سازیم. در اینجا این ابرصفحه را با xt w b نشان میدهیم که در آن w بردار نرمال صفحه و b فاصله صفحه جداکننده تا مبدا میباشد و x t ترانهاده بردار ستونی x است. سپس دو ابرصفحه مرزی موازی با ابرصفحه جداکننده رسم می کنیم و آن دو را آنقدر از هم دور می کنیم که به دادهها برخورد کند. ابرصفحه جداکننده ای که بیشترین فاصله را از ابرصفحات مرزی داشته باشد، بهترین جداکننده خواهد بود. این ابرصفحات مرزی را با ٌ xt w b نمایش می دهیم. در نتیجه فضا به دو طبقه از نمونهها باویژگیهای زیر تقسیم میشود:
در این مقاله ما از روش نامساوی قدر مطلق محدب - - CAVI برای طبقه بندی داده های بدون برچسب استفاده می کنیم و برای بهبود این طبقهبندی ستونهای نامطلوب را به روش انتخاب ویژگی ها - FS - حذف میکنیم. در ادامه برای مشاهده نتایج بهتر آن را با روش ضرایب سیلهوت - - SC ادغام میکنیم.در بخش 2 مقاله به معرفی روش طبقه بندی CAVI می پردازیم. در بخش 3 به معرفی ضریب سیلهوت می پردازیم. در بخش 4 روش انتخاب ویژگی را بررسی میکنیم . به محاسبات عددی در بخش 5 میپردازیم و در بخش 6 نتیجهگیری را مشاهده میکنید.
2 طبقهبندی با روش CAVI2
در این روش با وارد کردن نامساوی قدرمطلق محدب در دستگاه SVM میتوان دادهها بدون برچسب را با موفقیت به دو طبقه تقسیم کرد.فرض کنیم x یک بردار ستونی در فضای n بعدی R n باشد. نامساوی قدرمطلق محدبی را به صورت زیر معرفی میکنیم: