بخشی از پاورپوینت
اسلاید 2 :
فصل سوم:
مدل رگرسیون دو متغیره
(قسمت سوم)
اسلاید 3 :
ضریب تعیین
علاوه بر آزمون معنی داری پارامترهای تخمینی، می توان قدرت توضیحی کلی رگرسیون را نیز آزمون کرد. این کار بوسیله ضریب تعیین انجام می شود که با نشان داده می شود.
ضریب تعیین نسبت کل تغییر متغیر وابسته (حول میانگین خود) که بوسیله تغییر متغیرهای مستقل در رگرسیون توضیح داده می شود را نشان می دهد.
در مثال مخارج تبلیغات – درآمد فروش، ضریب تعیین درصد تغییر در فروش که بوسیله تغییر در مخارج تبلیغات توضیح داده می شود را می سنجد.
تغییرات توضیح داده شده در Y
تغییرات کل در Y
اسلاید 4 :
تغییرات توضیح داده شده
کل تغییرات
تغییرات توضیح داده نشده
اسلاید 5 :
ضریب تعیین
تغییرات توضیح داده نشده + تغییرات توضیح داده شده = کل تغییرات
TSS = ESS + RSS
در مثال مخارج تبلیغات درآمد فروش:
یعنی 85 درصد از تغییرات درآمد فروش را
تغییرات در مخارج تبلیغات توضیح داده است.
همواره عددی بین صفر و یک است.
اسلاید 6 :
ضریب همبستگی:
جذر ضریب تعیین را ضریب همبستگی نامند.
ضریب همبستگی درجه پیوستگی یا هم تغییری بین متغیر x و y را اندازه میگیرد.
مشخص است که:
در مثال قبل:
یعنی در 92 درصد موارد x و y که همان مخارج تبلیغات و درآمد فروش هستند، با هم تغییر می کنند. علامت مثبت یا منفی ضریب همبستگی را از روی ضریب تخمین زده شده برای متغیر x می توان تشخیص داد. چون در اینجا ضریب x مقدار 3/53 مثبت می باشد، در نتیجه r= +0.92 مورد قبول است. یعنی در 92 درصد موارد مخارج تبلیغات و درآمد فروش با هم افزایش و یا کاهش می یابند.
اسلاید 7 :
نکته:
اگر r=1 باشد، x و y همبستگی خطی کامل مثبت دارند.
اگر r=-1 باشد، x و y همبستگی خطی کامل منفی دارند.
اسلاید 9 :
فصل چهارم:
مدل رگرسیون چند متغیره
اسلاید 10 :
تجزیه و تحلیل رگرسیون چند متغیره:
فروض جدید در رگرسیون چند متغیره:
فروضی که رگرسیون چند متغیره را از رگرسیون ساده دو متغیره متمایز می نماید این است که:
1) تعداد متغیرهای مستقل در رگرسیون باید کمتر از تعداد مشاهدات باشد.
2) همبستگی خطی کامل بین متغیرهای مستقل مدل وجود نداشته باشد.
در صورت نقض این دو فرض معادله رگرسیونی را نمی توان تخمین زد.
بدلیل اینکه برای تخمین ضرایب رگرسیون چند متغیره، محاسبات زیاد و پیچیده می باشد و وقت زیادی صرف می شود، برای اینکار از رایانه استفاده می کنیم. نرم افزارهای مختلف آماری مانند Eviews, SPSS, STATA, … وجود دارند که پس از تخمین ضرایب رگرسیون، بطور خودکار انحراف معیار ضرایب، آماره t، ضریب تعیین چند متغیره و سایر آماره های مورد نیاز را جهت تحلیل نتایج گزارش می نمایند.
اسلاید 11 :
مثال: فرض کنید درآمد حاصل از فروش به عواملی همچون هزینه تبلیغات و مخارج کنترل کیفیت کالا بستگی داشته باشد. می توان نوشت:
با استفاده از داده های جمع آوری شده برای یک دوره ده ساله ضرایب رگرسیون به صورت زیر بدست آمده است:
مقادیر داخل پرانتز، آماره t مربوط
به هر یک از ضرایب را نشان می دهد. بر اساس این نتایج به ازای افزایش هر واحد مخارج تبلیغات درآمد فروش 1/91 واحد به درآمد فروش اضافه می شود و به ازای هر واحد افزایش مخارج کنترل کیفیت 1/87 واحد به درآمد فروش اضافه می شود.
معنی داری ضرایب را در سطح معنی داری 5 درصد آزمون کنید.
اسلاید 12 :
ضریب تعیین تعدیل شده :
تابعی غیر کاهنده از متغیرهای مستقل مدل است. زیرا با اضافه شدن تعداد متغیرهای مستقل RSS یعنی مجذور مربعات جملات خطا کاهش می یابد و افزایش می یابد ولی لزوماً متغیرهای وابسته بیشتر موجب افزایش قدرت توضیح دهندگی متغیر وابسته نمی شود به عبارت دیگر برای اینکه افزودن متغیرهای مستقل نامربوط موجب افزایش نگردد، و به گزارشهای غلط منجر گردد، از معیار دیگری که آنرا ضریب تعیین تعدیل شده یا می نامند، استفاده می کنند.
اسلاید 13 :
رابطه ای بین و آماره t وجود دارد، به طوری که اگر نسبت t برای ضریب یک متغیر از یک کوچکتر باشد، در آن صورت حذف آن متغیر از مدل را افزایش می دهد.
در مثال فوق برابر 0/93 می باشد، n=10 و k=3 در نتیجه
این مسئله نشان می دهد که با اضافه شدن متغیر
هزینه کنترل کیفیت به عنوان متغیر مستقل اضافی در رگرسیون، درجه آزادی کاهش می یابد و نسبتی از کل تغییرات در فروش که بوسیله رگرسیون توضیح داده می شود، به جای 93 درصد، 91 درصد است. با این وجود هنوز هم این عدد بزرگتر از 85 درصدی است که در رگرسیون ساده بوسیله تنها متغیر مستقل مخارج تبلیغات توضیح داده شده است.
اسلاید 14 :
تجزیه و تحلیل واریانس:
به طور کلی قدرت توضیحی کلی رگرسیون را می توانیم با تجزیه و تحلیل واریانس بسنجیم. در تجزیه و تحلیل واریانس از آماره F استفاده می شود. در رگرسیون از آماره F برای آزمون فرضیه صفر مبنی بر اینکه همه ضرایب رگرسیونی به طور همزمان برابر صفرند در مقابل فرضیه ای که بیان می دارد همگی این ضرایب برابر صفر نیستند، استفاده می شود.
که در آن n تعداد مشاهدات و k تعداد پارامترهای مدل است.
تغییرات توضیح داده شده
تغییرات توضیح داده نشده
اسلاید 15 :
برای آزمون آماره F یا آنالیز واریانس باید مقدار F محاسباتی را با مقدار بحرانی F که از جدول توزیع F بدست می آید، مقایسه کنیم. آماره F دو نوع درجه آزادی دارد. درجه آزادی صورت کسر (k-1) و درجه آزادی مخرج کسر(n-k) .
برای تعیین مقدار بحرانی فرض کنید محقق خطای 5 درصدی را بپذیرد، در جدول F با فاصله اطمینان 5 درصد به صورت افقی درجه آزادی صورت را می یابیم و سپس در ستون کنار جدول، درجه درجه آزادی مخرج را می یابیم. نقطه تقاطع این دو، مقدار F بحرانی را نشان می دهد.
مثال: در مثال قبل ضریب تعیین برابر 0/93، n=10 و k=3 بود. ابتدا F محاسباتی را بدست آورده و سپس با مقدار بحرانی آن در جدول مقایسه کنید و نتیجه را بیان کنید.
اسلاید 16 :
نحوه تفسیر ضرایب رگرسیون خطی در مدلهای مختلف