بخشی از مقاله
*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***
پیشبینی و پتانسیل سنجی عملکرد گیاه کلزا با استفاده از مدل ماشین بردار پشتیبان (SVM) و جنگل تصادفی (RF) در منطقه قزوین
چکیده:
کلزا Brasica napus L یکی از مهمترین گیاهان روغنی جهان میباشد که کشت و تولید آن به دلیل سازگاری با
شرایط اقلیمی اغلب نقاط کشور گسترش یافته است. بهمنظور بررسی پیشبینی و پتانسیل سنجی عملکرد این گیاه در
منطقه قزوین، تحقیقی در سال 1391 بر اساس دادههای سال زراعی 89-90 با استفاده از روشهای ماشینبردار پشتیبان (SVM) و جنگل تصادفی (RF) انجام شد. در این تحقیق با بهرهگیری از دادههای متغیرهای عوامل اقلیمی، بافت خاک، کیفیت آب آبیاری و خصوصیات گیاهی، مناطق برتر کشت این محصول برای دستیابی به حداکثر عملکرد در هکتار مشخص شد. همچنین اهمیت هر یک از عوامل اثرگذار و کارایی و ارتباط دادهها با عملکرد دانه مورد بررسی قرار گرفت. سپس روشهای یاد شده مورد مقایسه قرار گرفت و بهترین روش برای پیشبینی عملکرد دانه مشخص گردید. در محاسبه تغییرات میزان عملکرد دانه در هکتار با استفاده از مدل جنگل تصادفی((RF، بالاترین ضریب تبیین و کمترین
انحراف معیار مربوط به محاسبه مدل با ورود %75 دادهها در حالت آموزش، به ترتیب 0/98 و 0/006 به دست آمد. این مقادیر در مرحله تست 0/93 و 0/04 بود. همچنین تجزیه واریانس نتایج نشان داد مقادیر بهدست آمده با ورود %50 داده-ها، از نظر آماری اختلاف معنیداری با ورود %75 دادهها نشان نمیدهد. لذا برتری روش استفاده از مدل جنگل تصادفی((RF نسبت به مدل ماشین بردار پشتیبان (SVM) در محاسبه پیش بینی عملکرد دانه کلزا در هکتار کاملا مشهود است.
کلمات کلیدی: پیش بینی عملکرد، کلزا، ماشین بردار پشتیبان (SVM)، جنگل تصادفی .(RF)
مقدمه
دانه های روغنی پس از غلات، دومین ذخایر غذایی جهان و منبع مهم تأمین انرژی مورد نیاز جوامع انسانی را تشکیل می دهند. این محصولات علاوه بر دارا بودن ذخایر غنی اسید های چرب، حاوی پروتئین نیز می باشند 8)،.(11 در این میان کلزا )Brasica napus L.( به عنوان یکی از مهمترین گیاهان روغنی در سطح جهان مطرح میباشد .(11) در سالهای اخیر توجه به تولید مبتنی بر کشاورزی پایدار و ارتقاء بهرهوری منابع مورد توجه قرار گرفته است. لذا الگو و ترکیب کشت بهینه محصولات زراعی و جایگاه هر محصول بهویژه در تناوب غلات پائیزه، سهم بالایی در دستیابی به اهداف مذکور دارد. در این میان کشت دانه روغنی کلزا با توجه به ویژگیهای خاص و سازگاری این گیاه با شرایط آب و هوایی اکثر مناطق کشور و انطباق دوره رشدی آن با الگوهای اقلیمی ایران، در کنار دیگر محصولات زراعی پائیزه، سبب شده است که توسعه کشت کلزا در افزایش تولید روغن خوراکی مورد توجه ویژه قرار گیرد 1)،2،4،.(9
تعیین پتانسیل تولید در هر منطقه یکی از مهمترین مسائل در زمینه تولید محصولات زراعی میباشد. کلاسبندی ماشینهایبردار پشتیبان (System Vector Machine) و جنگل تصادفی (Random Forest) شیوههای نوینی برای پیشبینی تولید محصولات زراعی مانند کلزا میباشند 16)،13،.(4 ماشینهای بردار پشتیبان ابزار جدید و قدرتمندی برای دسته بندی و رگرسیون میباشند. کارایی این روش پیشنهادی، با استفاده از اطلاعات کمی و کیفی جمع آوری شده از نقاط پایش، در ارتباط با متغیرها ارزیابی میشود 13)،15،.(18
-1 مدل ماشین بردار پشتیبان (System Vector Machine)
این الگوریتم از روشهای یادگیری با ناظر است که از آن برای طبقهبندی و رگرسیون استفاده میکنند. الگوریتم ماشینهای بردار پشتیبان اولیه، در سال 1963 توسط Vapnik ابداع شد و در سال 1995 توسط Vapnik و Corinna Cortes برای حالت غیرخطی تعمیم داده شد. این روش از جمله روشهاینسبتاً جدیدی است که در سالهای اخیر کارایی خوبی نسبت به روشهای قدیمیتر برای طبقهبندی از جمله شبکههای عصبی پرسپترون نشان داده است 17)،16،.(13
-2 مدل جنگل تصادفی (Random Forest)
از جمله دستهبندیهایی که متد Bagging را به کار میگیرد Random Forest است که حاوی چندین درخت تصمیم میباشد و خروجی آن از خروجیهای درختهای انفرادی به دست میآید. این الگوریتم متد Bagging را با انتخاب تصادفی ویژگیها ترکیب میکند تا مجموعهای از درختهای تصمیم با تنوع تحت کنترل، ایجاد گردد. دقت بسیار بالای دستهبندی از مزایای این مدل است، ضمن اینکه میتواند با تعداد زیادی ورودی بهخوبی عمل کند .(19) جنگل-های تصادفی (RF) یک نوع مدرن از روشهای درخت پایه هستند که شامل انبوهی از درختهای کلاسبندی و
رگرسیون میباشند. مهمترین ویژگی جنگلهای تصادفی عملکرد بالای آنها در اندازهگیری اهمیت متغییرها برای مشخص
کردن نقش هر متغیر در پیشبینی پاسخ میباشد .(14) در این روش بر اساس اطلاعات اقلیمی مختلف مانند درجه حرارت، میزان بارندگی، رطوبت نسبی هوا، ساعات آفتابی، میزان تبخیر و منطقه جغرافیائی و همچنین پارامترهای گیاهی مانند رقم، طول دوره رشد، پارامترهای بافت خاک و EC آب، به مطالعه پیشبینی و پتانسیلسنجی عملکرد گیاه زراعی با استفاده از دو مدل ماشین بردار پشتیبان و جنگل تصادفی پرداخته میشود. الگوریتمهای عملکرد و متغییرهای وابسته به آن در گیاه زراعی، با توجه به متغیرهای یاد شده مورد استفاده قرار گرفته و پردازش متغیرها و پیشبینی عملکرد با توجه به برآوردهای انجام شده و با استفاده از روش ماشینهای بردار پشتیبان و جنگل تصادفی به صورت خودکار اجرا میشود،
همچنین میتوان کارکرد این روش پیشبینی عملکرد را با روش طبقه بندی حداکثر احتمال، مقایسه کرد 1)،18،20،.(21 با توجه به کارکردهای این دو مدل، هدف این تحقیق تعیین مناطق مناسب جهت کاشت کلزا با بهرهبرداری بهینه از منابع پایه (آب و خاک ، اقلیم گیاه) در جهت رسیدن به حداکثر عملکرد کلزا در استان قزوین میباشد همچنین هدف دیگر کاربردی آن عبارت است از انتخاب بهترین روش تعیین الگوریتم مورد نظر، برای پیشبینی عملکرد محصول کلزا در سالهای آینده، از میان دو مدل ماشینبردار پشتیبان و جنگل تصادفی بهعنوان یک روش نوین برنامهریزی کشاورزی درآینده میباشد.