بخشی از مقاله

چکیده:

یکی از روشهای توسعه مدلهای طبقهبندی استفاده از مدل های برنامهریزی ریاضی تحلیل ممیز است. اکثر روشهای برنامهریزی ریاضی عموماً برای توسعه طبقهبندی خطی استفاده شده اند، اما مدل های طبقهبندی غیرخطی می توانند عملکرد طبقهبندی بهتری نسبت به مدلهای خطی داشته باشند و با در نظر گرفتن اینکه از توابع قطعهای خطی میتوان برای تقریب توابع غیرخطی استفاده کرد یک مدل برنامهریزی ریاضی که از حداقل مجموع انحرافات به عنوان تابع هدف استفاده میکند برای تولید توابع تمایز قطعهای خطی معرفی میگردد.

برای بهبود مدل معرفی شده به منظور صرفهجویی در هزینه و بهبود سرعت فرایند مدل، این مدل به حالتیکه با در نظر گرفتن یک مقدار خطای مشخص، کمترین تعداد مولفه را تولید میکند توسعه داده میشود. کاربرد مدل ارایه شده بر روی 100 شعبه بانک های ژاپن، که توسط متخصصین موسسه مالی ژاپن به دو گروه تقسیم شدهاند نشان داده میشود که نتیجه بهدست آمده نشان میدهد که با استفاده از روش مذکور، در یک تکرار همان دقت مورد نظر با کمترین تعداد قطعات بهدست میآید.

.1 مقدمه

تحلیل ممیز یک تکنیک تصمیم گیری است که در آن با استفاده از یک مجموعه مشاهدات که عضویتشان در گروه های مختلف مشخص است، وزن های یک تابع تمایز با در نظر گرفتن مهیارهای مختلفی تخمین زده می شوند و سپس با استفاده از این تابع تمایز، پیش بینی می شود که یک مشاهده جدید در کدام یک از گروه ها قرار می گیرد.در دهه های گذشته مطالعات وسیعی بر روی تحلیل ممیز با استفاده از روش های مختلف انجام گرفته است. استفاده از روشهای برنامه ریزی ریاضی برای تحلیل ممیز از روشهای برنامه ریزی خطی پیشنهاد شده برای تولید توابع تمایز خطی آغاز شد

معیار جداسازی گروهها در این روشهای برنامه ریزی خطی براساس انحراف مشاهدات اشتباه طبقهبندی شده از تابع تمایز، با در نظر گرفتن اهدافی مانند ماکزیمم کردن حداقل انحراف یا حداقل کردن مجموع انحرافات*1 میباشد. اهداف دیگری نیز برای مدلهای تحلیل ممیز برنامه ریزی خطی [4] و مدلهای براساس برنامه-ریزی آرمانی 1] و [2 نیز پیشنهاد شده است.

گهرلین [5] و ویلسون [6] از دقت طبقهبندی بهطور مستقیم بهعنوان معیار جداسازی گروهها بهوسیله روشهای برنامه ریزی صحیح مختلط استفاده کردند و متناظر هر مشاهده یک متغیر دودویی درنظر گرفتند. اما به-دلیل وجود متغیرهای دودویی این روشها با محدودیت تعداد مشاهدات مواجه هستند. آسپاروخوف و استام [7] یک روش برنامه ریزی صحیح مختلط با هدف حداقل کردن طبقهبندی غیرصحیح برای مسایل متشکل از دو گروه پیشنهاد کردند که برای هریک از 2 ترکیب ممکن از متغیرها، یک متغیر دودویی در نظر میگیرد. اما تعداد متغیرهای دودویی در این مدل نیز به تعداد مشاهدات و متغیرها بستگی دارد.

رتزلاف- رابرتز [8] با استفاده از ترکیب تحلیل پوششی داده ها و تحلیل ممیز روشی جدید برای مسایل تحلیل ممیز ارایه کرد. سپس سی یو شی [9] یک روش جدید از تکنیک تحلیل ممیز بر اساس برنامه ریزی آرمانی و با استفاده از مدل جمعی تحلیل پوششی داده ها پیشنهاد کرد که این روش جدید را " تحلیل پوششی داده ها-تحلیل ممیز" نامید.

بهدلیل اینکه بیشتر مدلهای برنامهریزی ریاضی* تحلیل ممیز ارائه شده توابع تمایز خطی تولید میکنند، مدلهای برنامهریزی ریاضی عموما برای توسعه مدلهای طبقهبندی خطی استفاده میشوند. بهنظر میرسد که توابع تمایز غیرخطی میتوانند عملکرد طبقهبندی بهتری نسبت به توابع خطی داشته باشند و اگر فرم تابع مشخص باشد و پارامترهای هر مشاهده به فرم مورد نیاز تبدیل شوند این توابع نیز میتوانند بهوسیله مدلهای MP تحلیل ممیز تولید شوند، اگرچه در عمل فقط تعداد محدودی از این تبدیلات میتواند در نظر گرفته شود.

گلن [10] مدلی برای تولید توابع تمایز قطعهای خطی معرفی کرد که با استفاده از حداقل کردن مجموع انحرافات بهعنوان تابع هدف، توابع قطعهای خطی را به عنوان تابع تمایز تولید میکند. در این مطالعه مدل فوق به حالتیکه با در نظر گرفتن یک مقدار خطای مشخص، کمترین تعداد مولفه را تولید میکند توسعه داده میشود و نمونهای از کاربرد آن آورده میشود.

.2 مدل تحلیل ممیز بر مبنای برنامهریزی ریاضی

فرض کنید مساله شامل mk  مشاهده متعلق به k گروه - k=1,2 - باشد، که هر مشاهده شامل n متغیر است و فرض کنید Xkij  مقدارمتغیر در مشاهده - i=1,2,…,mk - i  از گروه - k=1,2 - k باشد. فرض میشود یک تابع تمایز خطی که بهوسیله یک جمله ثابت ao و ضریب aj برای متغیر - j=1,2,…,n - j تعریف میشود، تولید میشود بهطوریکه تا جای ممکن مشاهدات متعلق به گروههای 1 و 2 باید بهترتیب در دو طرف این تابع قرار گیرند.

سادهترین مدلهای تحلیل ممیز بر مبنای برنامهریزی ریاضی، مدلهای برنامهریزی خطی هستند که جداسازی گروهها برحسب انحراف مشاهدات اشتباه طبقهبندی شده از تابع تمایز ارزیابی میشود. این مدلهای برنامهریزی خطی از توابع هدفی مانند ماکزیمم کردن مینیمم انحراف یا حداقلکردن مجموع انحرافات استفاده میکنند. در این قسمت مدل MSD را در نظر میگیریم. فرض کنید dki≥0 انحراف مشاهده i متعلق به گروه k را از تابع تمایز نشان دهد، که اگر مشاهده بهطور صحیح طبقهبندی شود dki=0 و اگر مشاهده اشتباه طبقهبندی شود dki>0 است. مدل برنامهریزی خطی ارائه شده توسط گلن برای تولید تابع تمایز MSD بهصورت زیر است:

این مدل برای جلوگیری از جوابهای - j=o, 1,…,n - aj=0 باید نرمالایز شود و برای اینکار جمع قدر مطلق ضرایب متغیرها، برابر یک عدد ثابت قرار داده میشود.
 
.3 مدل تحلیل ممیز قطعهای خطی

گلن [10] با استفاده از مدل - 1 - ، مدل تحلیل ممیز قطعهای خطی دو گروهی برای تولید تابع تمایز قطعهای خطی با s≥2 قطعه را معرفی کرد. فرض میشود مساله شامل mk مشاهده متعلق به k گروه - k=1,2 - باشد، که هر مشاهده شامل n متغیر است و فرض کنید Xkij مقدار متغیر - j=1,2,…,n - j در مشاهده - i=1,2,…,mk - i از گروه - k=1,2 - k باشد. همچنین فرض میشود که مولفههای تابع - l=1,2,…,s - l از تابع قطعهای خطی بهوسیله جمله ثابت alo و ضریب alj برای متغیر j تعریف میشود و مشاهدات متعلق به گروههای 1 و 2 تا جای ممکن باید بهترتیب بالا و پایین این تابع قطعهای قرار گیرند.

برای روشن شدن مطلب، تابع تمایز قطعهای خطی دو قطعهای با دو متغیر را درنظر بگیرید که در شکل - 1 - نشان داده شده است. خطوط AA' و BB' که در C اشتراک دارند، مولفه توابع دو قطعهای خطی ACB' و BCA' را نشان میدهند. دقت شود که برای تابع قطعهای خطی ACB' ناحیه برای مشاهدات گروه 1 که بهطور صحیح طبقهبندی شدهاند، محدب است در حالیکه ناحیه برای مشاهدات گروه 2 که بهطور صحیح طبقهبندی شدهاند غیر محدب است.بهطور مشابه برای تابع قطعهای خطی BCA' ناحیه محدب وابسته به مشاهدات گروه 2 است که بهطور صحیح طبقهبندی شدهاند و مشاهدات گروه 1 که بهطور صحیح طبقهبندی شدهاند ناحیه غیر محدب را تشکیل میدهند. بهمنظور مشخص کردن تابع تمایز قطعهای خطی بهین، هرکدام از این دو مورد باید بهطور مجزا در نظر گرفته شوند.

شکل .1 مساله تحلیل ممیز برای دو گروه

در این بخش حالتی که ناحیه وابسته به مشاهدات صحیح طبقهبندی شده گروه 1 محدب است و مشاهدات صحیح طبقهبندی شده گروه 2 ناحیه غیر محدب تشکیل میدهند، در نظر گرفته میشود و مدل حالت دوم بهطریق مشابه بهدست میآید.

فرض کنید eli انحراف مشاهده i متعلق به گروه 1 را از مولفه - l=1,2 - l مربوط به تابع قطعهای خطی، نشان دهد. بهعنوان مثال، در شکل بالا l=1 متناظر AA' و l=2 متناظر BB' است، که eli=0 اگر مشاهده بهطور صحیح بهوسیله تابع l بر خودش طبقهبندی شود و eli>0 اگر مشاهده بهوسیله تابع l بر خودش اشتباه طبقهبندی شود. لازم به تذکر است که مشاهده i از گروه 1، بهطور صحیح بهوسیله تابع قطعهای خطی طبقهبندی میشود اگر بهوسیله تمام مولفههای این تابع بهطور صحیح طبقهبندی شود، یعنی eli=0 - l=1,2 - و اشتباه طبقهبندی میشود اگر حداقل یکی از این انحرافات مثبت باشد.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید