بخشی از مقاله

چکیده

ماشین بردار پیشتیبان1 نشان داده که عملکرد بیشتری نسبت به ماشین های سنتی دارد و به عنوان ابزارهای قدرتمندی برای حل مسائل طبقه بندی معرفی شده است. ماشین بردار پیشتیبان شبه صفحه ی مطلوب را با استفاده از کنش های ضرب نقطه ای در فضای برجسته که هسته های اصلی نامیده می شوند پیدا می کند و ماشین بردار پیشتیبان فازی2 این گونه عمل می کند که یک عضویت نامعلوم را برای هر نقطه داده ورودی ماشین بردار پیشتیبان بکار می برد.

در این مقاله که بررسی با هدف مقایسه سرعت و دقت دو الگوریتم در ده مرتبه تکرار انجام می شود که ماشین بردار پیشتیبان فازی عملکرد بهتری نسبت به ماشین بردار پیشتیبان را نشان می دهد برای این منظور به تشریح الگوریتم ماشین بردار پیشتیبان و ماشین بردار پیشتیبان فازی می پردازیم.

.1 مقدمه

طبقه بندی یکی از مسائل اصلی مطرح شده در یادگیری ماشین است و خیلی از مسائل را می توان به صورت یک مسئله ی دسته بندی مطرح کرده و حل کرد. در یادگیری ماشین روش های مختلفی برای حل مسئله دسته بندی صورت گرفته است یکی از روش هایی که در حال حاضر برای مسئله ی دسته بندی مورد استفاده قرار می گیرد روش ماشین بردار پیشتیبان است. شاید بتوان محبوبیت روش ماشین بردار پشتیبان را با محبوبیت شبکه های عصبی در دهه ی گذشته مقایسه کرد. علت نیز قابلیت استفاده این روش در حل مسائل گوناگون می باشد، در حالیکه روش هایی مانند درخت تصمیم گیری را نمی توان به راحتی در مسائل مختلف بکار برد.

فیشر اولین الگوریتم را برای طبقه بندی و دسته بندی الگوها در سال 1936 ارائه کرد و از طریق کم کردن خطای طبقه بندی داده های آموزشی، برای بهینه کردن الگوها به کار گرفت، در سال 1965، پژوهشگری روسی به نام ولادیمیر و پنک، گامی بسیار مهم در طراحی طبقه بندی کننده ها برداشت. وی نظریه ی آماری یادگیری را به صورت محکم تری بنا نهاد و ماشین های بردار پشتیبان را بر این اساس ارائه داد، در واقع ریشه ی ماشین بردار پیشتیبان ها در تئوری یادگیری آماری است و کاربردهای فراوانی در رگرسیون، طبقه بندی، خوشه بندی و به طور کلی تقریب توابع دارند

روش ماشین بردار پیشتیبان، یک روش آماری غیر پارامتریک نظارت شده است و بر اساس این فرض عمل می کند که هیچ گونه اطلاعی از چگونگی توزیع مجموعه داده ها وجود نداشته باشد. ویژگی اصلی این روش توانایی بالا در استفاده از نمونه های تعلیمی کمتر و رسیدن به دقت بالاتر در مقایسه با سایر روش های طبقه بندی پیشین است. ماشین بردار پشتیبان در واقع یک طبقه بندی کننده دودویی است که دو کلاس را با استفاده از یک مرز خطی از هم جدا می کند و وابسته به خانواده طبقه بندی های خطی تعمیم یافته است.

یک ماشین بردار پیشتیبان ابتدا نقاط ورودی در یک فضای بر جسته با بعد بالا ترسیم کرده و یک شبه صفحهی مجزاکنندهای که حاشیهی میان دو طبقه در این فضا را به حداکثر میرساند پیدا می کند. به حداکثر رساندن این حاشیه یک مسئلهی در برنامهریزی درجه دوم است و میتوان آن را از مسئله ی دوگانهاش با بکارگیری ضریبهای لاگرانژ حل کرد. بدون هیچ شناختی از این ترسیم، ماشین بردار پیشتیبان شبه صفحهی مطلوب را با استفاده از کنشهای ضرب نقطهای در فضای برجسته که "هستههای اصلی" نامیده میشوند پیدا میکند. راه حل شبه صفحهی مطلوب را میتوان به صورت ترکیبی از چند نقطه ورودی که بردارهای پشتیبان نامیده میشوند نوشت. کاربردهای زیادی وجود دارد که در آن از تکنیک های ماشین بردار پیشتیبان استفاده میشود.

با این حال، در بسیاری از کاربردها، برخی نقاط ورودی را نمی توان به طور دقیق برای یکی از این دو طبقه بکار گرفت. برخی مهم تر از آن هستند که آنها را به طور کامل برای یک طبقه بکار برد به طوری که ماشین بردار پیشتیبان بتواند این نقاط را به صورت صحیح تر از هم جدا سازد. برخی نقاط داده که به دلیل اختلالات معیوب می شوند کمتر با معنی هستند و ماشین می بایست آنها را کنار بگذارد. ماشین بردار پیشتیبان فاقد این نوع توانایی است.

ماشین بردار پیشتیبان فازی این گونه عمل می کند که یک عضویت نامعلوم را برای هر نقطه داده ی ورودی ماشین بردار پیشتیبان بکار می برد و ماشین بردار پیشتیبان را دوباره در ماشین بردار پیشتیبان نامعلوم فرموله می کند بطوریکه نقاط ورودی مختلف بتوانند تأثیرات مختلفی در فهمیدن سطح تصمیم داشته باشند. این روش ارائه شده، ماشین بردار پیشتیبان را در کاهش تأثیر بخش های مجزا و اختلالات در نقاط داده ارتقا می بخشد. ماشین بردار پیشتیبان فازی برای کاربردهایی که نقاط داده در آن ویژگی های بی مدل دارند مناسب است.

.2 توصیف الگوریتم ها

.1-2 ماشین بردار پیشتیبان - SVM -

در این قسمت اساس و پایهی تئوری SVM را در مسائل طبقهبندی مرور خواهیم کرد.6] و [4 فرض کنید یک مجموعهی S با نقطه های کار آموزی بر چسب دار به ما داده شده باشد.
هر نقطه کارآموزی xi ∈ RN به یکی از دو طبقه تعلق دارد یک برچسب yi ∈ {−1,1} برای L 1'…'1 دارد. در اکثر موارد، جستجوی یک شبه صفحه ی مناسب در یک فضای ورودی بقدری محدود کننده است که استفاده ی عملی ندارد.

یک راه حل برای این وضعیت عبارتست از ترسیم فضای ورودی برجسته با بعد بالا و جستجو شبه صفحه مطلوب در این فضای برجسته . فرض کنید که Z = φ - x - بردار فضای برجسته ی مربوطه با ترسیم φ از RN به یک فضای برجسته Z باشد.

شبه صفحه را که با جفت - W.B - تعریف شده را پیدا کنید، به طوریکه می توانیم طبق تابع زیر نقطه
را مجزا کنیم که در آن W ∈ Z و b ∈ R می باشد. به طور دقیق تر، مجموعه ی S گفته می شود که به طور خطی   قابل جدا شدن می باشد به شرط آنکه - W,b - وجود داشته باشد چنانکه این نابرابری ها برای تمامی عناصر مجموعه ی S اعتبار داشته باشد

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید