بخشی از پاورپوینت

اسلاید 2 :

کالیبراسیون مدل

اسلاید 3 :

به فرایند تنظیم پارامترهای یک مدل، کالیبراسیون آن مدل گفته میشود. همانطور که میدانیم، یک مدل مفروض دارای یک متغیر وابسته، یک یا چند متغیر مستقل (بسته به اینکه مدل یک متغیره یا چند متغیره باشد) و یک مجموعه پارامتر و نیز ضریب ثابت است. بنابر تعریف کالیبراسیون، مدلساز باید بتواند مقادیر پارامترهای مدل را با استفاده از روشهای مناسب کالیبراسیون تعیین کند.

انتخاب روش کالیبراسیون به میزان پیچیدگی مدل بستگی دارد؛ به طوری که هر چه مدل پیچیدهتر شود، به روش کالیبراسیون پیشرفتهتری نیاز است و بهدنبال آن لازم است تا مدلساز از دانش و تجربه مورد نیاز برای کار با آن برخوردار باشد.

مدلهای ساده را میتوان با بهکارگیری روش حداقل مربعات برازش داد. در چنین مواردی، معمولا مدل دارای ساختار خطی است یا میتوان با تبدیل دادهها آنها را به شکل خطی درآورد. این نوع مدلها، محدود به شرایط نیستند و برای یک مدل مفروض، کمینه بودن مجموعه مربعات خطای مدل، تنها معیار تصمیمگیری در مورد مقدار پارامترهای تعیین شده است.

کالیبراسیون مدل

اسلاید 4 :

در مقایسه با مدلهای ساده، برازش مدلهای پیچیدهتر اغلب به صورت رفت و برگشتی است و نیازمند برآورد نادانستهها و تعداد گامهای بیشتر در فرآیند آزمون و خطاست.

هنگام برازش مدلهای پیچیدهتر که دربردارنده مجموعه دادههای بیشتری هستند، لازم است موارد مهم زیر مورد توجه بیشتری قرار گیرد:

1- مدلساز درک و فهم بهتری از فرایند برازش مدل مورد نظر خود داشته باشد.
2- بهکارگیری شرایط محدودکننده به دقت و به درستی انجام پذیرد.
3- بین معیارهای رقابت کننده برازش توازن برقرار شود.
4- توانایی بسیار بیشتری برای ارزیابی مقادیر خروجی لازم است.

قابل گفتن است که پارامترهای مدلهای ساده اغلب بدون درنظرگرفتن شرایط محدود کننده، برازش داده میشوند، این در حالی است که در برازش مدلهای پیچیده امکان برقرای شرایط محدودکننده با هدف ایجاد زمینه منطقی و مستدل فراهم است.

اسلاید 5 :

کالیبراسیون مدل

برای برازش مدلهای پیچیده نیز میتوان از روش حداقل مربعات خطا استفاده کرد. مدلهای پیچیده برتری متعددی دارند، اما اگر برازش آنها بهدرستی انجام نگیرد، ممکن است به مدلی منتهی شود که بیان ضعیفتری از سیستم واقعی را در مقایسه با مدل‎های ساده در اختیار مدلساز بگذارد.

امروزه با افزایش میزان دسترسی به نرمافزارهای محاسباتی بر روی کامپیوترهای شخصی، زمینهای فراهم شده است که کاربران آنها بهراحتی و در مدت زمانی کوتاه میتوانند با استفاده از یک مجموعه داده از یک سیستم مفروض، به کالیبراسیون مدل بپردازند. نکته مهم این است که پیش از به خدمت گرفتن ماشین در حل یک مسئله، دانستن منطق و رهیافت حل آن سبب میشود تا مدلساز از بهرهگیری کورکورانه از ماشین به دور بماند.

اسلاید 6 :

کالیبراسیون مدل
معرفی انواع مدلهای رگرسیونی

اسلاید 7 :

الف) برازش مدل رگرسیون یک متغیره

شکل 4-1 الف پراکنش فضایی یک مجموعه داده نقاط را نشان میدهد. برازش یک خط از میان آن نقاط داده باید به شکلی انجام پذیرد که فاصله عمودی نقاط تا خط برازش داده شده که همان میزان خطا محسوب میشود، حداقل باشد. آشکار است که خط برازش داده شده از پراکنش فضایی نقاط داده پیروی میکند.

در شکل 4-1 ب پراکنش فضایی نقاط داده از الگوی خطی پیروی میکند. همانطور که از شکل مذکور پیداست، خط برازش داده شده داری دو پارامتر است که به آنها شیب خط و فاصله از مبدأ گفته میشود. بطوریکه مقدار این دو پارامتر است که تعیین میکند نقاط داده با خط برازش داده شده، چقدر فاصله یا بهعبارت دیگر خطا دارند. از اینرو، مقدار این دو پارامتر باید بهاندازهای باشد که مجموع مربعات فاصله نقاط به کمترین حد خود برسد.
روش حداقل مربعات خطا

اسلاید 8 :

روش حداقل مربعات خطا

اسلاید 10 :

الف) مثال برآورد پارامتریک یک مدل ساده

جدول 4-1 زیر مقدار غلظت فسفر کل در آب رودخانه و درصد کاربری زمین­های شهری در حوزه­های بالادست رودخانه­های استان یاماگوچی ژاپن را نشان می­دهد. چنانچه بخواهیم پارامترهای یک مدل خطی ساده را برای آن برآورد کنیم، به­طوری که با کمک مدل بدست آمده بتوان غلظت فسفر کل در آب رودخانه را به­عنوان متغیر وابسته از روی درصد زمین­های شهری به عنوان متغیر مستقل پیش­بینی کرد، به روش زیر عمل می­شود:

با استفاده از جدول 4-1، لازم است مقادیر x2، y2 و xy در جدول 4-2 محاسبه شود.

با توجه به محاسبات انجام گرفته در جدول 4-2 می­توان مقادیر شیب خط و فاصله از مبدأ را با استفاده از رابطه­های 4-1 و 4-2 به شرح زیر محاسبه کرد:

اسلاید 11 :

جدول 4-1. داده­های غلظت فسفر کل (متغیر وابسته) و درصد زمین­های شهری (متغیر مستقل)

اسلاید 12 :

جدول 4-2. نحوه محاسبه شیب خط در معادله رگرسیون خطی

اسلاید 13 :

الف) روش گام­به­گام

هدف از به کارگیری رهیافت تحلیل رگرسیونی گام­به­گام ابداع یک معادله پیش بینی کننده است که در آن متغیر وابسته، به یک یا چند متغیر مستقل مرتبط می­شود. اگر چه این نوعی تحلیل رگرسیون چندگانه است، اما متفاوت از آن است. در تحلیل رگرسیونی چندگانه، تمام متغیرهای مستقل وارد معادله می­شوند و این کار بیشتر اوقات به ایجاد ضرایب رگرسیونی غیر قابل قبول منجر می­شود. با به کار­گیری تحلیل رگرسیونی گام­به­گام، مدل­ساز علاوه بر کالیبره کردن مدل، از یک معیار آماری برای انتخاب اینکه آیا متغیر مستقل مورد نظر وارد مدل نهایی شود یا خیر، بهره می­گیرد.

از آنجا که آن دسته از متغیرهای مستقلی که میان خود همبستگی بالایی دارند وارد مدل نهایی نمی­شوند، در نتیجه تحلیل رگرسیونی گام­به­گام مانع از به­وجود آمدن ضرایب رگرسیونی غیر منطقی می­شود. در تحلیل رگرسیونی گام­به­گام، از دو آزمون فرض به نام آزمون فیشر کلی و آزمون فیشر جزیی استفاده می­شود.

رهیافت تحلیل رگرسیونی

اسلاید 14 :

هدف از آزمون فیشر کل آن است که مشخص کند آیا متغیر وابسته ارتباط معنی­داری با متغیرهای مستقلی که وارد معادله شده اند دارد یا خیر. از آزمون فیشر جزیی نیز برای آزمون معنی­دار بودن یک متغیر مستقل بهره گرفته می­شود. همچنین این آزمون برای تعیین معنی­دار بودن آخرین متغیری که به مدل اضافه شده یا برای حذف هر یک از متغیرهایی که در مدل هستند، به­کار می­رود.

در حالی که این دو آزمون فرض، به مدل­ساز، امکان ارزیابی آماری مدل را در هر مرحله می­دهد، نباید با چشمان بسته به­کار روند. بر اساس تجربیات، آماره­های این دو آزمون در سطح معنی­داری 5 درصد، معیار خوبی نیستند. در چنین حالتی، بهتر است از آماره­های نکویی برازش همچون ضریب تعیین استفاده شود.

روش رگرسیون گام به گام به دو طریق زیر قابل انجام است:

اسلاید 15 :

ب) روش پیش­رونده

این روش با یک مدل بدون متغیر مستقل آغاز می شود. سپس متغیری که کوچکترین مقدار عددی معنی­دار بودن را داراست، وارد مدل می­شود. در هر مرحله می توان مدل را ارزیابی کرد و این کار را تا زمانی ادامه داد که دقت مدل بالاتر نرود یعنی با تعدادی از متغیرهای مستقل موجود بالاترین دقت را داشته باشد.

ج) روش پس رونده

این روش برخلاف روش پیش­رونده با مدلی شروع می­شود که تمام متغیرهای داوطلب را در خود دارد. سپس متغیری که بزرگترین مقدار عددی معنی­دار بودن را با متغیر وابسته دارد، کنار گذاشته می­شود، و فرایند مذکور تا زمانی ادامه پیدا خواهد کرد تا مدل حاصله به اندازه کفایت مقدار P (p<0.05 یا p>0.10)کمتر داشته در واقع دقت بالاتر داشته باشد.

اسلاید 16 :

برازش بی­رویه، مشکل شناخته­شده­ای در مدلسازی است که هنگام کالیبراسیون مدل رخ می­دهد، ولی مدلساز در مرحله صحت سنجی مدل (فصل 5) از وجود آن آگاهی می­یابد. در مقابل برازش بی­رویه مدل مشکل دیگری نیز وجود دارد که به آن برازش تفریطی مدل گفته می­شود. در چنین حالتی، خطای مدل در هر دو گام کالیبراسیون و صحت سنجی بالاست. ارزش تفریطی مدل، اریبی زیاد مدل هم نامیده می­شود. شکل 4-2 رابطه میان میزان پیچیدگی مدل و میانگین خطای مدل را با توجه به رابطه متقابل واریانس و اریبی مدل نشان می­دهد.

این شکل نشان می­دهد با افزایش میزان پیچیدگی مدل، اگر چه ممکن است میانگین خطای مدل کاهش یابد، به همان اندازه از توانایی استنتاج مدل­ساز از مدلی که ساخته است کم شده و همچنین مدل دچار برازش بی­رویه می­شود. برعکس، با کاهش میزان پیچیدگی مدل، بر میزان میانگین خطای مدل افزوده می­شود و احتمال اینکه مدل دچار برازش تفریطی شده باشد، وجود دارد. از این­رو لازم است بین اریبی و واریانس مدل که به­ترتیب به معنای برازش تفریطی و برازش بی­رویه است، میزان پیچیدگی بهینه یا مطلوب را یافت.

برازش بیرویه مدل
داده و پردازش آن

اسلاید 18 :

الف) ساختار نامناسب مدل

همان­طور که می­دانیم انتخاب ساختار مناسب برای یک مدل، یکی از کارهای مهمی است که یک مدل­ساز باید انجام دهد. به بیان دیگر، انتخاب ساختار نامناسب برای مدل آن است که مدل­ساز از بین مدل­های معرفی شده در بخش 4-2، مدلی را به ­اشتباه برگزیند و آن را با استفاده از داده­های کالیبراسیون، کالبیره کند؛ بدین معنا که این کار می­تواند براساس دانش و تجربیات پیشین مدل­ساز یا با بهره گیری از روش آزمون و خطا به انجام برسد.

شکل 4-3 نمونه­ای از تأثیر ساختار انتخابی مدل را نشان می­دهد. شکل 4-3 (الف)، یک مدل خطی را نشان می­دهد که برازش خوبی با نقاط داده­ها ندارد. شکل 4-3 (ب)، یک مدل چندجمله­ای درجه سه را نشان می­دهد که برازش خوبی با نقاط داده­ها دارد. شکل 4-3 (ج)، نیز یک مدل چندجمله­ای درجه شش را نشان می­دهد که در مقایسه با شکل 4-3 (ب) بسیار خوب برازش شده است. با توجه به مطالب پیشتر گفته شده، می­توان گفت که مدل (الف) دچار برازش تفریطی و مدل (ج) دستخوش برازش بی­رویه شده است.

اسلاید 19 :

داده و پردازش آن

اسلاید 20 :

ب) طراحی سیستم

مدل­ساز باید پس از تعریف مسئله و تعیین هدف یا هدف­های خود از مدل­سازی، در گام­های بعد به تعیین محدوده­های سیستم مورد نظر، تعیین نیاز­های اطلاعاتی و بر اساس آن طراحی سیستم ادراکی بپردازد. در این گام­های برشمرده­ شده، مدل ساز تعیین می­کند که متغیر وابسته یا همان متغیر پاسخ در سیستم موردنظر او تحت تأثیر چه متغیرهای مستقلی است و به چه تعداد مشاهده یا اندازه­گیری از سیستم موردنظر خود نیاز دارد تا بتواند در پایان به ابداع یک مدل از سیستم خود دست یابد.

دلیل اهمیت گام­های برشمرده ­شده آن است که بر اساس آنها، مدل­ساز تعیین می­کند چند متغیر مستقل را با چند تکرار باید اندازه­گیری کند. از این­رو، لازم است بین تعداد متغیر­های مدل و تعداد مشاهدات نسبت (1:5) یا (1:10) برقرار باشد (کلاین بائوم و همکاران، 2013). چنانچه این نسبت هنگام مدل­سازی رعایت نشود و تعداد متغیرهای مستقل معرفی­شده در مدل نسبتاً زیادتر از تعداد مشاهدات باشد، احتمال ابداع مدلی که دچار برازش بی­رویه شده باشد، زیاد است.

در متن اصلی پاورپوینت به هم ریختگی وجود ندارد. برای مطالعه بیشتر پاورپوینت آن را خریداری کنید