بخشی از پاورپوینت
اسلاید 2 :
کالیبراسیون مدل
اسلاید 3 :
به فرایند تنظیم پارامترهای یک مدل، کالیبراسیون آن مدل گفته میشود. همانطور که میدانیم، یک مدل مفروض دارای یک متغیر وابسته، یک یا چند متغیر مستقل (بسته به اینکه مدل یک متغیره یا چند متغیره باشد) و یک مجموعه پارامتر و نیز ضریب ثابت است. بنابر تعریف کالیبراسیون، مدلساز باید بتواند مقادیر پارامترهای مدل را با استفاده از روشهای مناسب کالیبراسیون تعیین کند.
انتخاب روش کالیبراسیون به میزان پیچیدگی مدل بستگی دارد؛ به طوری که هر چه مدل پیچیدهتر شود، به روش کالیبراسیون پیشرفتهتری نیاز است و بهدنبال آن لازم است تا مدلساز از دانش و تجربه مورد نیاز برای کار با آن برخوردار باشد.
مدلهای ساده را میتوان با بهکارگیری روش حداقل مربعات برازش داد. در چنین مواردی، معمولا مدل دارای ساختار خطی است یا میتوان با تبدیل دادهها آنها را به شکل خطی درآورد. این نوع مدلها، محدود به شرایط نیستند و برای یک مدل مفروض، کمینه بودن مجموعه مربعات خطای مدل، تنها معیار تصمیمگیری در مورد مقدار پارامترهای تعیین شده است.
کالیبراسیون مدل
اسلاید 4 :
در مقایسه با مدلهای ساده، برازش مدلهای پیچیدهتر اغلب به صورت رفت و برگشتی است و نیازمند برآورد نادانستهها و تعداد گامهای بیشتر در فرآیند آزمون و خطاست.
هنگام برازش مدلهای پیچیدهتر که دربردارنده مجموعه دادههای بیشتری هستند، لازم است موارد مهم زیر مورد توجه بیشتری قرار گیرد:
1- مدلساز درک و فهم بهتری از فرایند برازش مدل مورد نظر خود داشته باشد.
2- بهکارگیری شرایط محدودکننده به دقت و به درستی انجام پذیرد.
3- بین معیارهای رقابت کننده برازش توازن برقرار شود.
4- توانایی بسیار بیشتری برای ارزیابی مقادیر خروجی لازم است.
قابل گفتن است که پارامترهای مدلهای ساده اغلب بدون درنظرگرفتن شرایط محدود کننده، برازش داده میشوند، این در حالی است که در برازش مدلهای پیچیده امکان برقرای شرایط محدودکننده با هدف ایجاد زمینه منطقی و مستدل فراهم است.
اسلاید 5 :
کالیبراسیون مدل
برای برازش مدلهای پیچیده نیز میتوان از روش حداقل مربعات خطا استفاده کرد. مدلهای پیچیده برتری متعددی دارند، اما اگر برازش آنها بهدرستی انجام نگیرد، ممکن است به مدلی منتهی شود که بیان ضعیفتری از سیستم واقعی را در مقایسه با مدلهای ساده در اختیار مدلساز بگذارد.
امروزه با افزایش میزان دسترسی به نرمافزارهای محاسباتی بر روی کامپیوترهای شخصی، زمینهای فراهم شده است که کاربران آنها بهراحتی و در مدت زمانی کوتاه میتوانند با استفاده از یک مجموعه داده از یک سیستم مفروض، به کالیبراسیون مدل بپردازند. نکته مهم این است که پیش از به خدمت گرفتن ماشین در حل یک مسئله، دانستن منطق و رهیافت حل آن سبب میشود تا مدلساز از بهرهگیری کورکورانه از ماشین به دور بماند.
اسلاید 6 :
کالیبراسیون مدل
معرفی انواع مدلهای رگرسیونی
اسلاید 7 :
الف) برازش مدل رگرسیون یک متغیره
شکل 4-1 الف پراکنش فضایی یک مجموعه داده نقاط را نشان میدهد. برازش یک خط از میان آن نقاط داده باید به شکلی انجام پذیرد که فاصله عمودی نقاط تا خط برازش داده شده که همان میزان خطا محسوب میشود، حداقل باشد. آشکار است که خط برازش داده شده از پراکنش فضایی نقاط داده پیروی میکند.
در شکل 4-1 ب پراکنش فضایی نقاط داده از الگوی خطی پیروی میکند. همانطور که از شکل مذکور پیداست، خط برازش داده شده داری دو پارامتر است که به آنها شیب خط و فاصله از مبدأ گفته میشود. بطوریکه مقدار این دو پارامتر است که تعیین میکند نقاط داده با خط برازش داده شده، چقدر فاصله یا بهعبارت دیگر خطا دارند. از اینرو، مقدار این دو پارامتر باید بهاندازهای باشد که مجموع مربعات فاصله نقاط به کمترین حد خود برسد.
روش حداقل مربعات خطا
اسلاید 8 :
روش حداقل مربعات خطا
اسلاید 10 :
الف) مثال برآورد پارامتریک یک مدل ساده
جدول 4-1 زیر مقدار غلظت فسفر کل در آب رودخانه و درصد کاربری زمینهای شهری در حوزههای بالادست رودخانههای استان یاماگوچی ژاپن را نشان میدهد. چنانچه بخواهیم پارامترهای یک مدل خطی ساده را برای آن برآورد کنیم، بهطوری که با کمک مدل بدست آمده بتوان غلظت فسفر کل در آب رودخانه را بهعنوان متغیر وابسته از روی درصد زمینهای شهری به عنوان متغیر مستقل پیشبینی کرد، به روش زیر عمل میشود:
با استفاده از جدول 4-1، لازم است مقادیر x2، y2 و xy در جدول 4-2 محاسبه شود.
با توجه به محاسبات انجام گرفته در جدول 4-2 میتوان مقادیر شیب خط و فاصله از مبدأ را با استفاده از رابطههای 4-1 و 4-2 به شرح زیر محاسبه کرد:
اسلاید 11 :
جدول 4-1. دادههای غلظت فسفر کل (متغیر وابسته) و درصد زمینهای شهری (متغیر مستقل)
اسلاید 12 :
جدول 4-2. نحوه محاسبه شیب خط در معادله رگرسیون خطی
اسلاید 13 :
الف) روش گامبهگام
هدف از به کارگیری رهیافت تحلیل رگرسیونی گامبهگام ابداع یک معادله پیش بینی کننده است که در آن متغیر وابسته، به یک یا چند متغیر مستقل مرتبط میشود. اگر چه این نوعی تحلیل رگرسیون چندگانه است، اما متفاوت از آن است. در تحلیل رگرسیونی چندگانه، تمام متغیرهای مستقل وارد معادله میشوند و این کار بیشتر اوقات به ایجاد ضرایب رگرسیونی غیر قابل قبول منجر میشود. با به کارگیری تحلیل رگرسیونی گامبهگام، مدلساز علاوه بر کالیبره کردن مدل، از یک معیار آماری برای انتخاب اینکه آیا متغیر مستقل مورد نظر وارد مدل نهایی شود یا خیر، بهره میگیرد.
از آنجا که آن دسته از متغیرهای مستقلی که میان خود همبستگی بالایی دارند وارد مدل نهایی نمیشوند، در نتیجه تحلیل رگرسیونی گامبهگام مانع از بهوجود آمدن ضرایب رگرسیونی غیر منطقی میشود. در تحلیل رگرسیونی گامبهگام، از دو آزمون فرض به نام آزمون فیشر کلی و آزمون فیشر جزیی استفاده میشود.
رهیافت تحلیل رگرسیونی
اسلاید 14 :
هدف از آزمون فیشر کل آن است که مشخص کند آیا متغیر وابسته ارتباط معنیداری با متغیرهای مستقلی که وارد معادله شده اند دارد یا خیر. از آزمون فیشر جزیی نیز برای آزمون معنیدار بودن یک متغیر مستقل بهره گرفته میشود. همچنین این آزمون برای تعیین معنیدار بودن آخرین متغیری که به مدل اضافه شده یا برای حذف هر یک از متغیرهایی که در مدل هستند، بهکار میرود.
در حالی که این دو آزمون فرض، به مدلساز، امکان ارزیابی آماری مدل را در هر مرحله میدهد، نباید با چشمان بسته بهکار روند. بر اساس تجربیات، آمارههای این دو آزمون در سطح معنیداری 5 درصد، معیار خوبی نیستند. در چنین حالتی، بهتر است از آمارههای نکویی برازش همچون ضریب تعیین استفاده شود.
روش رگرسیون گام به گام به دو طریق زیر قابل انجام است:
اسلاید 15 :
ب) روش پیشرونده
این روش با یک مدل بدون متغیر مستقل آغاز می شود. سپس متغیری که کوچکترین مقدار عددی معنیدار بودن را داراست، وارد مدل میشود. در هر مرحله می توان مدل را ارزیابی کرد و این کار را تا زمانی ادامه داد که دقت مدل بالاتر نرود یعنی با تعدادی از متغیرهای مستقل موجود بالاترین دقت را داشته باشد.
ج) روش پس رونده
این روش برخلاف روش پیشرونده با مدلی شروع میشود که تمام متغیرهای داوطلب را در خود دارد. سپس متغیری که بزرگترین مقدار عددی معنیدار بودن را با متغیر وابسته دارد، کنار گذاشته میشود، و فرایند مذکور تا زمانی ادامه پیدا خواهد کرد تا مدل حاصله به اندازه کفایت مقدار P (p<0.05 یا p>0.10)کمتر داشته در واقع دقت بالاتر داشته باشد.
اسلاید 16 :
برازش بیرویه، مشکل شناختهشدهای در مدلسازی است که هنگام کالیبراسیون مدل رخ میدهد، ولی مدلساز در مرحله صحت سنجی مدل (فصل 5) از وجود آن آگاهی مییابد. در مقابل برازش بیرویه مدل مشکل دیگری نیز وجود دارد که به آن برازش تفریطی مدل گفته میشود. در چنین حالتی، خطای مدل در هر دو گام کالیبراسیون و صحت سنجی بالاست. ارزش تفریطی مدل، اریبی زیاد مدل هم نامیده میشود. شکل 4-2 رابطه میان میزان پیچیدگی مدل و میانگین خطای مدل را با توجه به رابطه متقابل واریانس و اریبی مدل نشان میدهد.
این شکل نشان میدهد با افزایش میزان پیچیدگی مدل، اگر چه ممکن است میانگین خطای مدل کاهش یابد، به همان اندازه از توانایی استنتاج مدلساز از مدلی که ساخته است کم شده و همچنین مدل دچار برازش بیرویه میشود. برعکس، با کاهش میزان پیچیدگی مدل، بر میزان میانگین خطای مدل افزوده میشود و احتمال اینکه مدل دچار برازش تفریطی شده باشد، وجود دارد. از اینرو لازم است بین اریبی و واریانس مدل که بهترتیب به معنای برازش تفریطی و برازش بیرویه است، میزان پیچیدگی بهینه یا مطلوب را یافت.
برازش بیرویه مدل
داده و پردازش آن
اسلاید 18 :
الف) ساختار نامناسب مدل
همانطور که میدانیم انتخاب ساختار مناسب برای یک مدل، یکی از کارهای مهمی است که یک مدلساز باید انجام دهد. به بیان دیگر، انتخاب ساختار نامناسب برای مدل آن است که مدلساز از بین مدلهای معرفی شده در بخش 4-2، مدلی را به اشتباه برگزیند و آن را با استفاده از دادههای کالیبراسیون، کالبیره کند؛ بدین معنا که این کار میتواند براساس دانش و تجربیات پیشین مدلساز یا با بهره گیری از روش آزمون و خطا به انجام برسد.
شکل 4-3 نمونهای از تأثیر ساختار انتخابی مدل را نشان میدهد. شکل 4-3 (الف)، یک مدل خطی را نشان میدهد که برازش خوبی با نقاط دادهها ندارد. شکل 4-3 (ب)، یک مدل چندجملهای درجه سه را نشان میدهد که برازش خوبی با نقاط دادهها دارد. شکل 4-3 (ج)، نیز یک مدل چندجملهای درجه شش را نشان میدهد که در مقایسه با شکل 4-3 (ب) بسیار خوب برازش شده است. با توجه به مطالب پیشتر گفته شده، میتوان گفت که مدل (الف) دچار برازش تفریطی و مدل (ج) دستخوش برازش بیرویه شده است.
اسلاید 19 :
داده و پردازش آن
اسلاید 20 :
ب) طراحی سیستم
مدلساز باید پس از تعریف مسئله و تعیین هدف یا هدفهای خود از مدلسازی، در گامهای بعد به تعیین محدودههای سیستم مورد نظر، تعیین نیازهای اطلاعاتی و بر اساس آن طراحی سیستم ادراکی بپردازد. در این گامهای برشمرده شده، مدل ساز تعیین میکند که متغیر وابسته یا همان متغیر پاسخ در سیستم موردنظر او تحت تأثیر چه متغیرهای مستقلی است و به چه تعداد مشاهده یا اندازهگیری از سیستم موردنظر خود نیاز دارد تا بتواند در پایان به ابداع یک مدل از سیستم خود دست یابد.
دلیل اهمیت گامهای برشمرده شده آن است که بر اساس آنها، مدلساز تعیین میکند چند متغیر مستقل را با چند تکرار باید اندازهگیری کند. از اینرو، لازم است بین تعداد متغیرهای مدل و تعداد مشاهدات نسبت (1:5) یا (1:10) برقرار باشد (کلاین بائوم و همکاران، 2013). چنانچه این نسبت هنگام مدلسازی رعایت نشود و تعداد متغیرهای مستقل معرفیشده در مدل نسبتاً زیادتر از تعداد مشاهدات باشد، احتمال ابداع مدلی که دچار برازش بیرویه شده باشد، زیاد است.

