بخشی از مقاله

چکیده

در این مقاله با استفاده از منطق روشهای خطی بهینهیابی و رویکرد ریاضی برنامهریزی آرمانی - GP - ، بدیلی برای مدلهای رگرسیون معمولی - LSM - ارائه شده که کمتر به توزیع دادهها حساس بوده و در مقابل توزیعهای غیرنرمال و بویژه دادههای پرت، نتایج معتبرتری ارائه میدهد.

با استفاده از مدل مذکور با عنوان رگرسیون حداقل مقادیر مطلق خطا - LAV - ، توابع انتقالی خاک برای 120 نمونه تصادفیِ از عمق صفر تا20 سانتیمتری از دو واحد همگون نقشه خاک با سریهای شهرک و چهار محال در اطراف شهرکرد بدست آمد، و ظرفیت تبادل کاتیونی بر اساس مشخصههای بافت خاک - شن، لای و رس - و درصد مواد آلی برآورد شد. نتایج، حاکی از افزایش دقت برآوردهای مدل LAV در مقایسه با رگرسیون LSM بوده و خطای برآورد یا ماندههای رگرسیونی کمتر در مدل LAV باعث شده که خط رگرسیون برازش داده شده بین مقادیر مشاهده شده و مقادیر برآورده شده در رویکرد LAV انطباق بیشتری با خط y=x داشته باشد.

مقدمه

فنّاوریهای آماری جزء جدا نشدنی پژوهشهای علمی و توانایی بهرهگیری از استنباطهای آماری برای هر پژوهشگری ضروری است. این امر برای همه مراحل انجام یک پژوهش مانند برآورد حجم نمونه، روش نمونهبرداری، طرح آزمایشی و غیره دارای اهمیت بوده و بویژه انجام و اعتبار تفسیر و نتیجهگیری،بدون آمار تقریباً امکانپذیر نیست. الگوهای رگرسیونی از کاربردیترین روشهای آماری برای برآورد و پیشبینی متغیر یا متغیرهایی وابسته از روی مجموعهای از متغیرهای مستقل استهدف. اصلیِ این مدلها، برازاندن بهترین خط یا منحنی به مجموعهای از نقاط مشاهداتی با کمترین انحراف است.

رایجترین وسادهترین روش ریاضی برای یافتن خط رگرسیونی رهیافت کمترین مجموع مربعات - LSM: Least Square Method - است. از جمله موارد مشکلساز در این رویکرد - LSM - وجود دادههای دورافتاده و پرت در مجموعه دادههای مشاهداتی است؛ چرا که مجذور کردن اختلاف این مقادیر از برآوردهای بدست آمده از رگرسیون، منجر به پدیدآمدن اعداد بزرگی میشود که با سنگینتر کردن وزن این نقاط سبب انحراف خط رگرسیون به سمت آنها میگردد و در نتیجه به اعتبار نتایج نهایی مدل خدشه وارد میسازد.

از طرفی رویکرد LSM وابسته به فرض نرمال بودن توزیع خطاهای تصادفی است و بنابراین وقتی توزیع خطاها نرمال نیست این رویکرد ممکن است کارآیی خود را به شدت کاهش دهد - امینی فسخودی و دیگران، . - 1387 در عمل چنین دادههایی پیش ازتجزیه و تحلیل حذف میشوند. لیکن باید توجه داشت این دادهها همیشه ناشی از خطا نیستند و گاهی به دلایل مختلف چنین تغییرات شدیدی بین دادهها به طور طبیعی وجود دارد - مانند تغییرات شدید در ناپیوستگیهای لایههای خاک، گسلها و غیره - . بنابرین حذف دادههای پرت باید با احتیاط و توجیهپذیر باشد. با توجه به آنچه گفته شد استفاده از روشهایی که حتی با وجود دادههای پرت تحلیلهای معتبری را بدست بدهد امری ضروری به نظر میرسد.

مدلهای رگرسیون در خاک: مدلهای رگرسیون در خاک در بخشهای گوناگونی بکار میرود ولی یکی از بخشهای بسیار کاربردی که اساس آنرا مدلهای رگرسیونی تشکیل میدهد توابع انتقالی خاک - Pedo Transfer Functions = PTFs - میباشد.

این نام را بوما - 1989 - برای روابطی که بین خصوصیات هیدرولیکی و خصوصیات زود یافت خاک مانند توزیع اندازه ذرات، کربن آلی و جرم مخصوص ظاهری بدست آورده بود، بکار برد.

در مدلسازی این توابع روش معمول همان رویکرد کمترین مجموع مربعات در مدلهای رگرسیونی است؛ هر چند همگام با پیشرفتهای رایانهایو فنّاوری، روشهای دیگری مانند شبکههای عصبی - مهاجر و همکاران، - 1387، فازی - تقیزاده و همکاران، - 1394، الگوریتم ژنتیک - پالیزوانزند و احمدی، - 1394 و غیره نیز مورد استفاده قرار گرفته است، لیکن به دلیل سهولت انجام محاسبات در رویکرد رگرسیونی، این روش - LSM - همچنان بیشترین کاربرد را دارا است. بنابراین مشکلهای گفته شده بالا - برای رویکرد - LSM در توابع انتقالی خاک نیز وجودخواهد داشت.

مدلهای برنامهریزی آرمانی - Goal Programming - در دهه 1960 توسط چارنز و کوپر معرفی شد و مونوگرافی و مقالههای علمی زیادی را بخود اختصاص داده است . - Aouni and Kettani, 2000 - در این مدلها تابع هدف میتواند به منظور کمینهسازی انحرافها از حالت بهینه تعریف و به جای بکارگیری مربع خطاها از قدر مطلق آنها استفاده گردد.

مدلGP امکان در نظر گرفتن همزمان چندین هدف برای یافتن بهترین راه حل از بین مجموعهایاز راه حلهای ممکن را فراهم میآورد. از مزایایGP میتوان به انعطافپذیری بیشتر آن برای مدل سازی فرآیند برآورد و ارزیابی اشاره کرد. بنابراین با چنین دیدگاه و رویکردی میتوان به حل مدلها رگرسیونی و تعین ضرایب مورد نظر پرداخت و به رهیافتی نوین و آسان در راستای بر طرف نمودن مشکلهای گفته شده برای LSM دست یافت

مقاله حاضر معرفی رویکردی نوین برای مدلهای رگرسیونی و نشان دادن دقت و تواناییهای کاربردی آن میباشد . برای این منظور به طور آزمایشی توابع انتقالی جهت برآورد ظرفیت تبادل کاتیونی خاک - CEC - خاک مورد برسی قرار گرفته است.

مواد و روشها

منطقه مورد مطالعه، محدودههای مختلف از دو واحد همگون نقشه خاک با دو سری خاک شهرک و چهار محال را شامل می شود که در اطراف شهرکرد و حومه آن در استان چهار محال و بختیاری واقع شده است. ردهبندی دو خاک غالب انتخاب شده به شرح زیر گزارش شده است: خاک اول: سری شهرک با فامیل:

خاک دوم: سری چهارمحال با فامیل: Fine, Carbonatic, Mesic Typic Calcixerepts

تعداد 120 نمونه خاک ازعمق صفر تا20 سانتی متری به طریق تصادفی برداشت شد. پس از آماده سازی نمونهها، علاوه بر تعیین ظرفیت تبادل کاتیونی، مشخصه های بافت خاک - شن، لای و رس - و درصد مواد آلی با روش استاندارد تعیین شد. تابع انتقالی خاک به منظور برآورد CEC با استفاده از روش رگرسیون معمولی - LSM - و روش پیشنهادی - کمترین مجموع مقادیر مطلق - LAV: Least Absolute Values بدست آمد.

چون هدف اصلی مطالعه مقایسه توانایی و دقت برآورد دو مدلLSM وLAV است، بنابراین یکبار بدون توجه به معنیدار بودن یا نبودن ضرایب B از نظر آماری، تمامی متغیرهای مستقل وارد تجزیه و تحلیل شدند و یکبار نیز با توجه به معنیدار بودن ضرایب در روش رگرسیون معمولی مقایسه دو روش گفته شده LSM - و - LAV انجام گرفت.

در رویکرد رگرسیون معمولی مدل مربوطه در محیط Excel به صورت زیر فرمول گردید:

که در آن y متغیر وابسته - CEC - و اندیس i معرف iامین مشاهده و اندیس j برای متغیر مستقل - x - یا ویژگی jام است. درGP میتوان تابع یا تابعهایی را برای رسیدن به هدفی مشخص تعریف کرد. به این توابع، تابع هدف گفته میودش . معمولاً تابع هدف درGP به منظور کمینهسازی مجموع خطاها - انحراف از حالت بهینه - فرموله میگردد و در این راستا به جای مجذور نمودن خطاها از مقادیر مطلق آنها - LAV - استفاده میشود. چون حل مدلهای GP در بیشتر موارد مستلزم انجام عملیات تکراری برای رسیدن به بهترین جواب است، استفاده از رایانه بسیار ضروری میباشد و بدون آن بویژه برای حالات پیچیده تقریباً حل این مدلها غیر ممکن است.

با توجه به رویکرد رگرسیونی کمترین مقادیر مطلق خطا - LAV - مدل برنامهریزی آرمانی زیر - فرمول - 2 در قالب یک برنامه خطی فرموله گردید و در محیط EXCEL با انجام عملیات تکرار حل شد - امینی فسخودی و دیگران، : - 1387

که در این مدل :

= PVi برآورد بدست آمده برای مشاهده iام CEC = - برآورد شده iام - = AVi مقدار واقعی برای مشاهدهiام CEC = - واقعی iام -

= | i| =|PVi- AVi| قدر مطلق خطا = قدر مطلق انحراف مقدار برآورد شده از مقدار واقعی

در پایان مقدار متغیر وابسته و به عبارتیCEC برآورد شده توسط توابع انتقالی خاک بر اساس مدل خطی معمول در رگرسیون به صورت فرمول 3 بدست آمد:

CECi = B0 + B - S - *Xi - S - + B - Si - *Xi - Si - + B - C - *Xi - C - + B - OC - *Xi - OC -      - 3 -

که در آن:

= B0 ضریب ثابت، = B ضرایب مربوط به هر متغیر مستقل شن - S - ، سیلت - Si - ، رس - C - و کربن آلی - - OC و = Xi مقدار اندازهگیری شده برای هر متغیر مستقل است.

برای ارزیابی مدلها از ضریب تبیین - R2 - ، ضریب x خط برازش برآوردها با مشاهدات، معیارهای میانگین خطا - Mean Error: - ME، مجذور میانگین مربعات خطا - Root Mean Square Error: RMSE - و مربع مطلق خطا - Mean Absolut Error: MAE - استفاده شد. در ارزیابی مدل هرچه معیارهای ME، RMSE و AME کوچکتر، ضریب x نزدیکتر به یک و R2 بزرگتر باشند نشان دهنده مدل بهتر و دقیقتر است.

نتایج و بحث

جدول 1 مقادیر آمارههای توصیفی دادهها را نشان میدهد. براساس یافتهها خاکهای منطقه مورد مطالعه دارای دامنه تغییرات CEC زیاد برابر 61/71 میباشند. مقادیر چولگی و کشیدگی نشان دهنده نزدیک بودن دادهها به توزیع نرمال است. این موضوع با فراوانی دادهها در شکل 2 نیز قابل مشاهده است. همان طور که دیده میشود دادهها تا حدودی از توزیع نرمال فاصله دارند لیکن چون انجام تبدیل داده - مانند لگاریتمی - نتایج را بهبود نبخشید از دادههای اصلی در ادامه کار استفاده شد.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید