بخشی از مقاله
- 1 مقدمه:
هدف اصلی این مقاله بررسی مدلهاي تحلیلهاي عاملی است که بتواند در برابر تأثیرات دادههاي دورافتاده مقاومت نماید. بدین ابتدا با تعیین و محاسبه عاملها با استفاده از روش ماکسیمم درستنمایی - ML - و تحلیل عاملی با مؤلفه اصلی - PFA - توسط برآوردگرهاي کوواریانس استوار کار خود را آغاز خواهیم نمود. سپس خواهیم دید روش تحلیل عاملی بر مبناي مینیمم دترمینان کوواریانس - MCD - نتایج معقولتري را ارائه میدهد. در ادامه به بررسی میزان تاثیرات دادههاي دورافتاده در دو روش PFA و ML کلاسیک و استوار انجام میپردازیم و در پایان، مطالب ارائه شده را با یک مثال کاربردي مورد بحث و بررسی قرار خواهیم داد.
- 2 بیان مسئله:
تحلیل عاملی یکی از روش هاي تحلیل چند متغیره معروف است که هدف آن تقریب p مولفه اصلی توسط ترکیبات خطی تعداد کمتري از k متغیر پنهان که عامل نامیده میشود میباشد. انجام تحلیل عاملی بر اساس روشهاي مولفه اصلی و ماکسیمم درستنمائی، نیازمند یافتن مقادیر ویژه و بردارهاي ویژه ماتریس کوواریانس یا همبستگی است. متأسفانه حضور دادههاي دورافتاده در کلیه محاسباتی که در خصوص تعیین عاملها شامل برآورد بردار میانگین، ماتریس کوواریانس یا همبستگی، و بالطبع یافتن مقادیر و بردارهاي ویژه صورت میگیرد، تأثیرگذار بوده و نتایج نادرستی را ارائه مینماید. لذا به منظور حصول نتایج صحیح و منطقی میبایست دادههاي دورافتاده شناسائی و تاثیر آن بر محاسبات آماري را به حداقل رساند.
در بخش دیگري از این مقاله به بررسی تحلیل عاملی استوار خواهیم پرداخت. به این ترتیب که در اولین گام ماتریس پراکندگی استواري را تحت عنوان برآوردگرهاي کوواریانس با کمترین دترمینان - MCD - محاسبه میکنیم - روسو . - 1985 سپس در گام دوم چندین روش معمول از قبیل ماکسیمم درستنمایی و تحلیل عاملی با مولفه اصلی را مورد بررسی قرار خواهیم داد و با انجام تحلیلهاي میزان حساسیت و بررسیهاي مونت کارلو روي دادههاي شبیه سازي شده و مقایسه میانگین مربعات پارامترهاي مدل - 1 - به مقایسه دو روش فوق خواهیم پرداخت.
- 3 روش کار:
روشهاي متداول براي محاسبه این برآوردها عبارتند از روش ماکسیمم درستنمایی - - MLE و روش مولفه اصلی . - PFA - از آنجائیکه این روشها نمیتوانند در برابر اثرات دادههاي دورافتاده مقاومت نمایند لذا استفاده از بردار مکانی و ماتریس پراکندگی استوار پیشنهاد میگردد. در این خصوص برآوردگر مینیمم دترمینان کوواریانس - MCD - نقش مهمی را ایفا میکند. در واقع MCD به دنبال یافتن h زیرمجموعه در مجموعه دادههاي مورد بررسی میباشد که کمترین دترمینان کوواریانس را داشته باشد. بردار مکانی - Tnr - MCD، میانگین h نقطه از زیر مجموعه مذکور و ماتریس پراکندگی Snr - MCD - ، برآورد پراکندگی آن است.
برآوردهاي MCD در مواجهه با دورافتادهها به شدت استوار است و نسبت به برآوردگر بیضیوار - MVE - سریعتر همگرا خواهد بود. علاوه بر مزایاي فوق برآوردهاي MCD به سرعت با استفاده از الگوریتم روسو و وان دریسن - 1999 - قابل محاسبه است. بار عاملی استوار Lrn و واریانس ویژه استوار Pnr در مقایسه با Lcn کلاسیک و Pnc کلاسیک متفاوت خواهد بود چون بردار مکانی Tnc و Snc و متعاقب آن Lcn و Pnc در برابر دادههاي دورافتاده تاثیرپذیر است. از طرفی استواري ماتریس پراکندگی MCD استواري بار عاملی Lrn و Pnr را به دنبال خواهد داشت.