بخشی از مقاله


کاربرد تکنیک های داده کاوی در مهندسی کشاورزی

خلاصه
داده کاوی فرایند تحلیل داده ها از دیدگاه های مختلف و خلاصه آن به اطلاعات مفید است ، اطلاعاتی که می تواند برای افزایش درآمد و کاهش هزینه ها مورد استفاده قرار گیرد. یکی از دلایلی که باعث شد داده کاوی در صنعت اطلاعات مورد توجه قرار بگیرد، در دسترس بودن حجم وسیعی از دادهها و استخراج اطلاعات و دانش سودمند از این داده هاست. اطلاعات بهدست آمده در کاربردهای وسیعی از طراحی مهندسی و تحقیقات علمی مورد استفاده قرار میگیرد.نرم افزار های داده کاوی، داده ها را آنالیز میکنند و الگوهای دادهای را کشف میکنند که میتوان از آن در کاربردهایی نظیر علوم کشاورزی نیز استفاده کرد.در این تحقیق، تجزیه و تحلیل داده ها با روش رگرسیون اثر تعداد برگ گیاهان گلدار و اثر وزن خشک برگ روی طول دوره گل دهی را بررسی میکند. داده هایی که در این پژوهش استفاده شد، داده هایی است که از گیاهان زینتی در قسمت های مختلف جزیره کیش بدست آمد که نتایج این تحقیق میتواند مزایای زیادی در بخش کشاورزی داشته باشد.

کلمات کلیدی: داده کاوی،رگرسیون،دوره گل دهی،کشاورزی

.1 مقدمه

داده کاوی به معنای استخراج دانش از مقدار زیادی داده خام است. »دانش کاوی « به عنوان یک عبارت کوتاه تر جایگزین، نمیتواند بیانگر تاکید و اهمیت بر داده کاوی مقدار زیادی داده باشد. داده کاوی عبارتی است که انسان را به یاد فرآیندی میاندازد که به دنبال یافتن مجموعه کوچکی از اطلاعات ارزشمند از حجم وسیعی از مواد خام است.البته اسامی دیگری نیز برای این فرآیند پیشنهاد شده که تا حدودی متفاوت با واژه داده کاوی است، نظیر استخراج دانش از پایگاه داده، استخراج دانش (Knowledge Extraction)، آنالیز داده/الگو، باستان شناسی داده (Data archaeology)، و لایروبی دادهها .(Data dredging) با توجه به مطالب فوق، با اینکه این فرآیند تا حدی دارای نامگذاری ناقص است ولی این نامگذاری ،یعنی داده کاوی، دارای عمومیت است.

داده کاوی نتیجه سیر تکاملی طبیعی تکنولوژی اطلاعات است، که این سیر تکاملی حاصل پیشرفت در صنعت پایگاه داده می باشد.[1] پیشرفت تکنولوژی پایگاه داده و استفاده از آن در علوم مختلف سبب جمع آوری حجم فراوانی داده مشود. از آنجایی که داده های جمع آوری شده خام هستند احتیاج به ابزارهای قدرتمند برای تحلیل داده ها میباشد. زیرا در این مرحله داده ها زیاد بوده ولی دچار کمبود اطلاعات میباشیم.


داده کاوی شامل مراحل زیر میباشد:[2]

-1 استخراج داده ها: شامل انتخاب یک مجموعه داده ای و تمرکز بر روی قسمتی از داده ها. -2 پاکسازی دادهها :از بین بردن نویز و ناسازگاری دادههاکه شامل عملیات حذف و تغییر داده های دارای اشکال است

.[3]
-3 انتخاب دادهها: داده های مرتبط با آنالیزازپایگاه داده بازیابی می شود که شامل تعمیم و تقلیل ، طبقه بندی ، رگرسیون ، گروه بندی ، وب کاوی ، بازیابی تصویر ، کشف قوانین پیوندی و وابستگی های تابعی ، استخراج قوانین و یا ترکیبی از اینها .[3]

-4 خلاصهسازی دادهها: تبدیل دادهها به فرمی که مناسب برای داده کاوی باشد. [4]
-5ارزیابی الگو: الگوهای صحیح و مورد نظربه وسیله معیارهای اندازه گیری شده مشخص میشوند . [5, 6]
6. تفسیر: شامل تفسیر و آنالیز الگوی کشف شده است.

7. استفاده از دانش کشف شده : شامل پیاده سازی دانش کشف شده در سیستم های اجرایی میباشد .[7]

روش های دسته بندی (Classification)و رگرسیون (Regression)دو روش یادگیری مدل در داده کاوی با ماهیت پیش بینی هستند.

رگرسیون از قدیمی ترین و معروف ترین مدل یادگیری در دادهکاوی است. رگرسیون اطلاعات و داده ها را در اختیار گرفته و یک فرمول ریاضی متناسب با آن داده ها ایجاد می کند و زمانی که شما بخواهید از نتایج دادههایتان آینده را پیشبینی کنید، کافی است داده های جدید خود را به فرمول تولید شده توسط رگرسیون داده و نتایج حاصل را که همان پیشبینیهای مورد نظر شما است، دریافت دارید. رگرسیون در علوم آمار بطور وسیعی مورد بررسی و مطالعه قرار میگیرد. پیش بینی مقدار یک متغیر پیوسته بر اساس مقادیر سایر متغیرها بر مبنای یک مدل وابستگی خطی یا غیر خطی رگرسیون نامیده میشود.[8] روش رگرسیون شامل تکنیک های بسیاری برای مدل سازی و تجزیه و تحلیل چند متغیر، زمانی که تمرکز بر رابطه بین متغیر وابسته و یک یا چند متغیر مستقل است میباشد.

اگر دادهها طبقهبندی شده و یا ترکیبی از دادههای عددی و دستهبندی شده باشند، روش دسته بندی ، نیاز است. این روش، توانایی پردازش مجموعههای وسیعتری از دادهها را نسبت به فن رگرسیون دارد. همچنین خروجیای که در این حالت دریافت می شود، راحتتر تفسیر میشود. رگرسیون و طبقهبندی، دو مورد از پرکاربردترین روشهای طبقهبندی اطلاعات هستند؛ اما این دو، تنها تکهای از یک مجموعه بزرگ می باشند.

این مقاله به بررسی روش استخراج داده ها از طریق رگرسیون میپردازد که یک مدل فرایند را برای تجزیه و تحلیل داده ها از طریق نرم افزارSPSS فراهم می کند .در این مقاله ما عوامل موثر در پرورش و سبز نگه داشتن گیاهان زینتی که منجر به بهبود و حفظ چشم انداز جزیره کیش میشود میپردازیم.


.2 روش تحقیق

:1-2 موقعیت تحقیق

داده هایی که در این پژوهش استفاده شد، داده هایی است که از گیاهان زینتی در جزیره کیش بدست آمد، جزیره کیش که در مختصات جغرافیایی 53 درجه و 53 دقیقه تا 54 درجه و 3 دقیقه طول شرقی از نصف النهار گرینویچ و 26 درجه و 34 دقیقه عرض شمالی می باشد . جزیره کیش دارای آب و هوای گرم و مرطوب است و متوسط دمای سالانه آن 27 درجه سانتیگراد می باشد .با توجه به اهمیت منطقه از لحاظ گردشگری و اقتصادی لازم است که توسعه فضای سبز و جنگل کاری مصنوعی در دستور کار قرار گیرد زیرا شرایط اکولوژیک و رویشی جزیره کیش به طور طبیعی دارای آن چنان توانی نیست که بتواند پوشش گیاهی مورد نظر را فراهم نماید.

داده ها از مناطق مختلف جمع آوری شده اند این مناطق شامل:


منطقه : 1 سنایی منطقه :2 صدف منطقه : 3 پاویون منطقه :4 صفین
:2-2× جمع آوری داده ها

داده ها از گیاهان مختلف زینتی در سال 2014 از مناطق مختلف انتخاب شده اند . شماره گونه ها به صورت زیر می باشد:

×کل گیاهان:

(1× خرزهره (2چریش (3 تکوما (4لور (5تی وی تیا (6کونوکارپوس (7ابریشم (8بنجامین (9شمشاد ×گیاهان گل دار:

(1× خرزهره (2تکوما (3تی وی تیا (4شمشاد × شماره فصل ها :
(1× فصل سرما (2فصل گرم
:3-2 فاکتور های رشد گونه ها

فاکتورهای رشد گونه ها برای بررسی اثر تعداد برگ گیاهان گلدار و اثر وزن خشک برگ رو ی طول دوره گل دهی گیاهان گل دار در جدول 1 آورده شده است.

X3 تعداد برگ
X4 طول گل دهی
X6 وزن برگ خشک
X9 تعداد برگ گیاهان گل دار در فصل سرما (1)
X10 طول گل دهی گیاهان گل دار در فصل سرما (1)
X12 وزن برگ خشک گیاهان گل دار در فصل سرما (1)
X15 تعداد برگ گیاهان گل دار منطقه (1) در فصل 1
X16 طول گل دهی گیاهان گل دار منطقه (1) در فصل 1
X18 وزن برگ خشک گیاهان گل دار منطقه (1) در فصل 1
X21 تعداد برگ گیاهان گل دار منطقه (1)، فصل((1، گونه((1
X22 طول گل دهی گیاهان گل دار منطقه (1)، فصل((1، گونه((1
P1 فاصله پیش بینی
C1 فاصله اطمینان
جدول -1فاکتورهای رشد گونه ها

 


:3بررسی اثر تعداد برگ گیاهان گلدار روی طول دوره گل دهی با استفاده از تکنیک رگرسیون

تعداد برگ گیاهان گل دار روی طول دوره گل دهی طبق آنالیزی که با نرم افزار SPSS انجام گرفت تاثیر پذیر است اعدادی برای تعداد برگ گیاهان در نظر گرفته شد که پارامتر های مقدار دقیق، فاصله اطمینان،مقدار خطا و مقدار پیش بینی شده برای این مشاهدات در جدول 2 بدست آمد.

 

جدول-2اثر تعداد برگ گیاهان گلدار روی طول دوره گل دهی


شکل-1 اثر تعداد برگ گیاهان گلدار روی طول دوره گل دهی با استفاده از نرم افزار spss

با توجه به جدول و شکل 1 با افزایش تعداد برگ طول دوره گل دهی نیز افزایش پیدا می کند، علت افزایش طول دوره گل دهی را می توان به ساخت هیدرات کربن بیشتر که حاصل از عمل فتوسنتز در برگها می باشد، نسبت داد. برای هرکدام از مشاهدات فاصله اطمینانی در نظر گرفته شده است که مشخص می کند مقدار عددی پاسخ (طول دوره گلدهی) در چه بازه ایی می تواند تغییر کند. فاصله پیش بینی تعیین می کند که در آینده با توجه به این مشاهدات طول دوره گل دهی چه تغییراتی دارد.
:1-3 بررسی اثر تعداد برگ گیاهان گل دار روی طول دوره گل دهی در فصل((1 با استفاده از تکنیک رگرسیون


با توجه به اعداد به دست آمده از جدول 3و شکل 2 در تکنیک رگرسیون تعداد برگ گیاهان گلدار روی طول دوره گل دهی در فصل سرما تاثیر گذار است.

مقدار پیش بینی شده فاصه اطمینان مقدار خطا مقدار دقیق پاسخ تعدادبرگ مشاهده شده
پاسخ(آینده)

جدول-3اثر تعداد برگ گیاهان گل دار روی طول دوره گل دهی در فصل((1

شکل-2اثر تعداد برگ گیاهان گل دار روی طول دوره گل دهی در فصل((1

 

به طور مثال اگر تعداد برگ مشاهده شده 4 عدد باشد به مدت 5/40 ماه در طول سال گل برروی گیاه مشاهده خواهد شد. و مقدار خطا 0/25 ودر فا صله اطمینان 4/55 -5/54 قرار می گیرد و در اینده پیش بینی می شود که طول دوره گل دهی 0/5 -9/59 ماه باشد.

:2-3بررسی اثر تعداد برگ گیاهان گل دار روی طول دوره گل دهی منطقه (1) در فصل((1


مقدار پیش بینی شده فاصه اطمینان مقدار خطا مقدار دقیق پاسخ ×تعداد برگ مشاهده شده
پاسخ(آینده) ×

جدول-4اثر تعداد برگ گیاهان گل دار روی طول دوره گل دهی منطقه (1) در فصل(× (1
با توجه به اعداد به دست آمده ازجدول 4 و شکل3 در تحلیل رگرسیون تعداد برگ گیاهان گل دار با طول دوره گل دهی در فصل سرما و در منطقه سنایی رابطه مستقیم دارد. که با مشاهداتی از تعداد برگ مقدار پاسخ دقیق، مقدارخطا، فاصله اطمینان و فاصله پیش بینی که طول دوره گل دهی گیاهان گل دار منطقه سنایی در فصل سرما می تواند داشته باشد،مشخص شده است.

شکل-3اثر تعداد برگ گیاهان گل دار روی طول دوره گل دهی منطقه (1) در فصل((1:3-3 بررسی اثر تعداد برگ گیاهان گل دار روی طول دوره گل دهی منطقه (1) در فصل((1 ، گونه (1)

×
مقدار پیش بینی شده فاصه اطمینان مقدار خطا مقدار دقیق پاسخ ×تعداد برگ مشاهده شده
پاسخ(آینده) ×

جدول-5اثر تعداد برگ گیاهان گل دار روی طول دوره گل دهی منطقه (1) در فصل((1 ، گونه × (1)


×شکل-4 اثر تعداد برگ گیاهان گل دار روی طول دوره گل دهی منطقه (1) در فصل((1 ، گونه (1)

تعداد برگ گیاهان گل دار روی طول گل دهی گیاه خرزهره در فصل سرما و در منطقه سنایی با توجه به جدول 5 و شکل 4 تاثیر گذار بود و رابطه مستقیمی داشت. برای مشاهداتی که از تعداد برگ گیاهان گل دار داشتیم مقدار دقیق ،میزان خطا، فاصله پیش بینی و فاصله اطمینانی برای طول دوره گل دهی مشخص شد.به عنوان مثال مشاهده تعداد 6 برگ از گیاه خرزهره طول دوره گل دهی به طور دقیق برابر با7/63ماه می باشد که به مقدار 2/51 درصد خطا وجود دارد.و فاصله اطمینانی در فاصله.0/66-14/61 ماه برای طول دوره گل دهی مشخص شده است. فاصله پیش بینی 0-17/72 ماه نیز برای طول دوره گل دهی محاسبه شده است.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید