بخشی از مقاله

چکیده

توفان حارهای گونو در ماه جون سال 2007 میلادی وارد جنوب و جنوبشرق ایران شد. دادههای کمیتهای هواشناسی ایستگاههای سینوپتیکی از سازمان هواشناسی اخذ گردید و دادهکاوی بر روی اطلاعات این توفان با استفاده از روشهای تحلیل مولفههای اصلی، تحلیل عاملی، جستجوی پیدرپی پیشرو و جستجوی پیدرپی پسرو مورد بررسی قرار گرفت. نتایج نشان دادند که میتوان برای پیش بینی سرعت باد توفان از دو پارامتر هواشناسی: دمای خشک و سمت باد، برای رطوبت از سرعت باد، دمای تر و دمای نقطه شبنم و برای تغییرات فشار از سرعت باد، دمای خشک و سمت باد استفاده کرد.

مقدمه

دادهکاوی ترجمه عبارت Data mining به معنای جستجو در حجم عظیمی از داده است. وظیفه دادهکاوی جستجو و استخراج در منبع عظیمی از دادهها برای بدست آوردن اطلاعاتی که در آن دادهها نهفته هستند. تفاوت اصلی دادهکاوی و علم آمار، در حجم دادههای مورد تحلیل، روش مدلسازی دادهها و استفاده از هوش مصنوعی است.

تاکنون مطالعات متعددی با استفاده از این روش در سایر رشتهها انجام شده است به عنوان مثال: کورتز و مورایز با استفاده از روش دادهکاوی بر روی دادههای هواشناسی امکان پیش بینی آتش سوزی را بررسی کردند، و نشان دادند که با استفاده از تکنیک SVM - ماشین بردار پشتیبان - Support Vector Machine و چهار پارامتر هواشناسی: دما، رطوبت نسبی، باد و باران میتوان آتش سوزیهای کوچک را پیشبینی کرد.

بدهای و همکاران - 2012 - به بررسی آنالیز دادههای هواشناسی با استفاده از روش خوشهبندی برای پیشبینیهای آینده پرداختند، و به این نتیجه رسیدند که خوشهبندی به روش K- - K-Nearest Neighbor technique - NN دقت پیشبینی دما و رطوبت را تا حدود 100 درصد افزایش میدهد. اولایا و ادیمو - 2012 - با استفاده از روش دادهکاوی توانستند که دمای بیشینه، بارش، تبخیر و سرعت باد را پیشبینی کنند، روش آنها تلفیقی از داده کاوی و شبکه عصبی  مصنوعی  و  الگوریتم  درخت  تصمیمگیری  بود که  روی   دادههای شهر ایبادان نیجریه پیاده کردند.            

روش تحقیق                    

منطقه  مطالعاتی در  این پژوهش شامل استانهای سیستان وبلوچستان، هرمزگان و کرمان است که به دلیل ورود توفان گونو در ماه جون سال 2007 به جنوب و جنوبشرق ایران انتخاب شد. اطلاعات پارامترهای هواشناسی منطقه : رطوبت، دمای خشک و تر، دمای نقطه شبنم، هوای حاضر، فشار ایستگاه و فشار ایستگاه در سطح متوس دریا، میزان ابرناکی، بارش، سمت و سرعت باد و دید افقی در بازه زمانی از 15می تا 30 جون از سازمان هواشناسی کشور اخذ و مورد بررسی قرار گرفته است.

به دلیل اینکه تعداد ایستگاهها زیاد بود هر استان به سه بخش تقسیم شده است و با استفاده از روش همبستگی از بین هر بخش یک ایستگاه به عنوان نماینده آن بخش انتخاب شده است. در مجموع 9 ایستگاه مورد بررسی قرار گرفتند. از بین روشهای دادهکاوی برای انجام این پژوهش چهار روش به شرح ذیل انتخاب شد: تحلیل مولفه اصلی - PCA - ، تحلیل عاملی - PFA - ، جستجوی پیدرپی پیشرو و جستجوی پیدرپی پسرو. روشهای نامبرده بر روی دادهها اعمال شدند که برای نمونه در اینجا روش تحلیل مولفه اصلی ارائه شده است

تحلیل مولفه اصلی از روشهای آماری چندمتغیره است که میتوان از آن برای کاهش پیچیدگی تحلیل متغیرهای اولیه مسئله در مواردی که با حجم زیادی از اطلاعات روبرو هستیم و همچنین برای تفسیر بهتر اطلاعات استفاده نمود - کامدویرین و همکاران، . - 2005 در ذیل نتایج روش تحلیل مولفه اصلی که برای دادههای ایستگاه چابهار انجام شده است ارائه شده است.

به منظور تشخیص توزیع نرمال بودن دادهها از ضریب KMO استفاده شد که مقدار آن برای دادههای ایستگاه چابهار 0/71 بود که امکان اجرای این روش را بر روی دادهها تایید کرد.

در جدول زیر مشخصات هر مولفه آورده شده است. مقدار اولین مولفه برابر 3/693 میباشد که 30/771 درصد از کل واریانس موجود در سری دادهها را توجیه میکند. دومین مقدار ویژه نیز 19/941 درصد از کل واریانس را توجیه مینماید. سومین و چهارمین مولفه نیز به ترتیب مقدارهای 16/977 و 9/292 درصد از کل واریانس را شامل میشوند. و این چهار مولفه حدود77 درصد از کل پراکندگی دادههای اصلی را بیان میکنند.

بنابراین میتوان چهار مولفه اول را به عنوان مولفه اصلی قلمداد نمود. با توجه به نمودار 1 مشاهده میشود که از عامل چهارم به بعد تغییرات مقدار ویژه کم میشود. پس میتوان چهار عامل را به عنوان عوامل مهم که بیشترین نقش را در تبیین واریانس دادهها دارند، استخراج کرد. به ازای هر مقدار ویژه 12 بردار ویژه، حاصل میشود که با استفاده از آنها، مولفههای اصلی از متغیرهای اولیه به دست میآید. مشخصات هرمولفه در جدول 2 آورده شده است. با استفاده از مقادیر این جدول میتوان به مولفههایی دست یافت که از آنها به جای متغیرهای اولیه استفاده کرد. مانند زیر:

PC1= - 1.6263 × DEW - + - 1.0539 × HUM - + - 0.8970 × WET - + - 0.4908 × QFE - + - 0.4302× QFF - + - 0.2940 × DRY - + - 0.2911 × VV - + - 0.2174 × N - + - 0.0780 × WW - + - 5.209×10-3  × DD - + - 8.682×10-4 ×FF - + - 0 × RR -

جدول .1 مشخصات مولفههای ایجادی از        

جدول .2 ضرایب ایستگاه چابهار - بردار ویژه - جهت تعیین مولفه ها

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید