بخشی از مقاله
*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***
برآورد نااریب ضرایب در مدل های خطای اندازه گیری به روش کمترین مربعات تعمیم یافته
چکیده مدل های خطای اندازهگیری زمانی ارائه می شوند که متغیرهای به کار گرفته شده در مدل با خطا اندازه گیری شده باشند. در این حالت برای برآورد ضرایب مدل، روش کمترین مربعات با استفاده از مشاهدات اصلی، برآوردهایی اریب را نتیجه می دهد. بر این اساس در این مقاله به روش کمترین مربعات تعمیم یافته، برآوردگرهای نااریب معرفی میگردد
واژه های کلیدی: روش کمترین مربعات تعمیم یافته، مدل خطای اندازه گیری، مدل ورا ساختاری
مقدمه
در اکثر آزمایش هایی که در سراسر دنیا صورت می گیرد، نتایج مشاهدات علمی، مقادير واقعی نبوده بلکه مقادير بدست آمده همراه با یک نوع خطا است. در علوم آماری چنین خطایی به خطای اندازه گیری معروف است. به خصوص در علومی مانند علوم آموزشی، علوم زیستی، خطای اندازه گیری غیر قابل انکار است به عنوان مثال در تعیین سطح نمرات یک کلاس یا تعيين ضریب هوشی افراد، بسته به موقعیت زمانی، نوع سوالات و وضعیت روحی افراد، نمی توان به صورت دقیق مقادير واقعی و دقیق آنها را اندازه گیری کرد.
این نوع خطا ممکن است به دلایل مختلفی از جمله دقت پایین دستگاه اندازه گیری، شرایط نامناسب زمان آزمایش و اشتباه در ثبت اطلاعات رخ دهد. چنین خطایی باعث بروز مشکلاتی در تحلیل داده ها شده و میتواند اعتبار نتایج بدست آمده را زیر سوال ببرد و حتی نادیده گرفتن چنین خطایی معمولا باعث نتایج گمراه کنندهای میشود. از نقطه نظر تاریخی هنگامی که فولر [۶] قصد داشت مدل رگرسیونی نیتروژن موجود در خاک را بررسی کند، متوجه این نوع خطا شد. وی بعد از آزمایش های دقیق متوجه شد که نیتروژن موجود در خاک را نتوانسته به صورت دقیق اندازه گیری کند. سپس نشان داد که با نادیده گرفتن خطای اندازه گیری پارامترهای مدل رگرسیونی اریب برآورد شده و در نتیجه باعث برازش مدل های گمراه کنندهای شده است. بعلاوه ایشان مطالعات گستردهای روی مدل های رگرسیونی ساده که متغیرهای رگرسیونی یا متغير پاسخ یا هر دوی آنها آلوده به خطای اندازه گیری است انجام داد. حاصل تلاش های وی منجر به نگارش کتاب جامعی به نام مدل های خطای اندازه گیری شد. مدل خطای اندازه گیری که از آن به اختصار با عنوان مدل ME یاد می کنیم، به عنوان یک تعمیم از مدل رگرسیون استاندارد به شمار می آید و زمانی مورد بحث قرار میگیرد که هر دو متغیر پاسخ و متغیر رگرسیونی تحت بررسی توأم با خطا اندازه گیری شده باشند. در این حالت نیز هدف برازش یک خط رگرسیونی مستقیم بین دو متغیر پاسخ و رگرسیونی می باشد. مقاله حاضر مدل خطای اندازه گیری را به صورت کامل و سه مدل مهم از مدل های خطای اندازه گیری را بیان کرده و به برآورد پارامتر شیب در این مدل ها می پردازد.
۲ - مدل خطای اندازه گیری
مدل رگرسیون خطی ساده ی استاندارد با یک متغیر توضیحی را در نظر بگیرید:
که در آن متغیر مستقل ثابت و یا تصادفی بوده و خطای دارای میانگین صفر و ناهمبسته با می باشد. با توجه به مشاهدات مستقل
عرض از مبدأ مجهول و شیب معمولا با استفاده از روش کمترین مربعات و یا برخی روش دیگر برآورد میشوند[۸]
در یک مدل ME، فرض میکنیم که متغیرهای به صورت زیر به هم مرتبط اند:
اما این متغیرهای غیر قابل مشاهده هستند و تنها می توانند همراه با خطا مشاهده شوند. بنابراین بجای مشاهده به صورت مستقیم، مشاهدات زیر را داریم:
که در اینجا فرض می شود متغیر و خطاهای ناهمبسته هستند[۲]
فرض کنید نمونه ای به حجم برای این مدل به صورت زیر خواهد بود
از آنجا که هر دو متغیر همراه با خطا اندازه گیری می شوند، این مدل را مدل خطای اندازه گیری می نامند.
در مدل های ME ، متغیرهای گاهی اوقات متغیرهای پنهان در برخی از زمینه های کاربرد نامیده میشوند. زمینه هایی که در آن متغیر همراه با خطای اندازه گیری است شاید بیشتر از زمانی که در آنها به دقت اندازه گیری می شود، مورد استفاده قرار میگیرند. اکثر متغیرهای پزشکی مانند فشار خون، ضربان قلب، درجه حرارت و شیمی خون همراه با خطای قابل توجهی اندازه گیری می شوند. همچنین متغیرهای کشاورزی مانند بارش باران، نیتروژن خاک، درجه آلودگی آفت، تخصیص وسعت زمین کشاورزی به محصول و مانند آن نیز نمیتوانند به دقت اندازهگیری شوند. در علوم مدیریت، علوم اجتماعی و تقریبا هر رشته نزدیک به این رشته های بسیاری از متغیرها تنها می توانند همراه با خطا اندازه گیری شوند. به این مدل، مدل ME استاندارد نیز می گویند چرا که جمله خطا در معادله فوق وجود ندارد. در اینجا لازم میدانیم تعریفی از مدل ME همراه با خطا ارائه نماییم.
۱۰۲ مدل خطای معادلات
مدل های خطای معادلات تغییر شکلی از مدلهای MIE استاندارد می باشند که معمولا به عنوان مثال در اندازه گیری تفسير و بررسی پدیده های اقتصادی مورد استفاده قرار می گیرند.
اکنون وضعیتی را در نظر بگیرید که در آن ارزشهای واقعی به دلیل وجود خطای q در معادله به صورت کامل خطی به هم مرتبط نیستند. به عبارت دیگر رابطه ی (۲) را برای نمونه ای به حجم n بدین گونه خواهیم داشت:
که qi ها متغیرهای تصادفی مستقل دارای میانگین صفر و واریانس مثبت می باشند و به ازای تمامی ها از هم مستقل می باشند. بنابراین فرض می شود که به ازای همه i و j ها مستقل هستند. مدل های (۵) و (۳) مدل خطای معادلات یا مدل خطا در معادلات نامیده میشود. بیشتر مؤلفان مدل خطای معادلات را بدین صورت مینویسند:
جمله خطای اندازه گیری نامیده می شود، شامل خطای متغیر مستقل بعلاوه خطای معادله به صورت می باشد. بنابراین
مدل خطای معادله تقریبا مانند مدل های (۲) و (۳) به نظر می رسد که تنها تفاوت آن در نمایش است.
۳ سه مدل متناظر در مدل خطای اندازه گیری
مدل های ME خطی یک متغیره (۲) و (۳) را میتوان بر اساس نمونه ای به حجم n به شرح زیر فرمول بندی کرد. متغیرهای غیر قابل مشاهده بصورت زیر به هم مرتبطاند:
در این صورت مشاهدات متغیرهای واقعی همراه با خطاهای افزودنی بصورت زیر هستند
اکنون فرض می کنیم که همگی واریانس محدود دارند و ناهمبسته هستند و (بدون از دست دادن کلیت) میانگین صفر دارند. نتایج زیر به ازاء هر برقرار می باشند:
در بیشتر نتایج نظری نیاز است که خطاها مستقل و نه فقط ناهمبسته باشند. غالبا فرض بر این است که خطاهای بصورت نرمال توزیع شده اند[۳]. بر این اساس فرض ناهمبستگی به طور خودکار به فرض استقال تبدیل شود. فرض نرمال می تواند تأثیرات مهمی در جهت شناسایی مدل داشته باشد. بدین معنی که اگر در مدل های نرمال نباشد، از چندین روش برآورد به عنوان مثال برآورد بر پایه گشتاورهای مرتبه بالا، استفاده میشود[۱۰]. چنانچه مدل غیر نرمال نزدیک به یک مدل نرمال باشد، این روش ها بی اساس هستند.
فرض محدود کننده خطاهای به این است که آنها هر کدام میانگین ها و واریانس های مشترک دارند. اگر آنها با میانگین های مشترک صفر نباشند (یعنی خطاهای سیستماتیک وجود دارند، که این خطاها می توانند در جذب شوند؛ بنابراین فرض خطاها با میانگین صفر، محدود کننده نیست. در صورت چنین پیامدی ممکن است یک مدل بدون عرض از مبدأ به یک مدل با عرض از مبدأ تبدیل شود.