بخشی از مقاله
چکیده:
رگرسیون چندگانه با یک متغیر پاسخ و چندین را در نظر بگیرید، بطوریکه تعداد متغیرهاي پیش بین زیاد باشد - مثلا متغیرها از نمونه بیشتر باشد - یا اینکه متغیرهاي پیش بین داراي همبستگی چندگانه شدیدي باشد. در چنین مواردي ، از نمونه اي به نمونه دیگر ناپایدار است. - داراي واریانس بزرگی است. - در مواردي که متغیرها از حجم نمونه بیشتر باشد، آزمونهاي به کار گرفته در رگرسیون فاقد توان است. یک روش براي رفع مشکل همبستگی، رگرسیون مولفه هاي اصلی است که در آن بر روي مولفه هاي اصلی انجام می گیرد. استفاده از مولفه هاي اصلی بزرگتر، واریانس بزرگ را کاهش می دهد اما مقدار اریبی نیز به ها اضافه خواهد شد.
اگر همبستگی بین متغیرها زیاد باشد، رگرسیون مولفه هاي اصلی با وارد کردن مقدار اریبی در برآوردها، همبستگی را تا اندازه زیادي کاهش می دهد . رگرسیون مولفه هاي اصلی : اکثر اوقات در بیان رگرسیون مولفه هاي اصلی از هاي استاندارد شده استفاده می شود بطوریکه نسبتی از ماتریس همبستگی است، که ماتریسی از مقادیر استاندارد شده است، با این حال مولفه هاي اصلی از ماتریس کواریانس در بسیاري از موارد ترجیح داده می شود، مولفه ها را از ماتریس کوواریانس ها بدست می آورده، سپس این شیوه را براي مولفه هاي بدست آمده از ماتریس تطبیق می دهند.