بخشی از مقاله
مدیریت و بهینه سازی میزان مصرف برقی با استفاده ار داده کاوی - مطالعه موردی استان یزد
چکیده
انرژی برق از عوامل مهم در توسعه اقتصاد کشور به حساب می آید. از طرفی این انرژی به گونه ای است که امکان ذخیره کردن آن وجود نداشته و می بایست در هر لحظه، تولید آن با مقدار تقاضا متناسب باشد. هدف از انجام این تحقیق این است که با استفاده از روشهای داده کاوی، میزان مصرف برق استان یزد را تحلیل و پیش بینی نموده و تاثیر عوامل مختلف در مصرف را بدست آوریم تا از این پیش بینی جهت مدیریت و بهینه سازی برق مصرفی استفاده شود. مجموعه دادههای جمع آوری شده مربوط به استان یزد بوده که بین سال های ۱۳۷۱ تا ۱۳۹۱ شمسی توسط مرکز آمار، اداره توزیع برق و اداره هواشناسی استان یزد بدست آمده است. به منظور رسیدن به این پیش بینی از نرم افزار ۱ WEKA استفاده شد. براساس پیش بینی انجام شده از سال ۱۳۹۱ تا ۱۴۰۱، میزان مصرف برق حدوداً برای هر سال به طور میانگین ۳/۸ درصد افزایش خواهد یافت. مصرف برق در بخش خانگی تا سال ۱۴۰۱ حدود ۲۴ درصد افزایش خواهد یافت. مصرف برق در بخش کشاورزی ۲۹ درصد، در بخش صنعت ۳۱ درصد و در بخش تجاری ۱۹ درصد افزایش خواهد یافت.
۱. مقدمه
عموماً، داده کاوی عملیات تجزیه و تحلیل دادهها از جهات مختلف و جمع بندی آنها در قالب اطلاعات مفید و مختصر میباشد. اطلاعاتی که می تواند به افزایش درآمد، کاهش هزینه ها یا هر دو منجر شود. نرم افزار داده کاوی ابزاری تحلیلگر برای بررسی و تحلیل دادهها می باشد. این ابزار امکان تحلیل دادهها را از ابعاد و زوایای بسیار متفاوتی فراهم ساخته، آنها را دسته بندی و روابط آشکار و نهان میان آنها را مشخص و جمعبندی میکند. اگر چه داده کاوی عبارت نسبتا جدیدی است، اما خود این فن آوری آن چنان جدید نمی باشد. سازمان های بسیاری از رایانه های قدرتمند برای بررسی و غربال حجم انبوهی از داده های مربوط به سوپرمارکتها و تحلیل بازار و تهیه گزارشات تحقیقی در سالهای اخیر استفاده کردهاند. در این مقاله سعی بر این است تا با استفاده از روشهای داده کاوی، میزان مصرف برق استان یزد را تحلیل و پیشبینی نموده و تاثیر عوامل مختلف در میزان مصرف را بدست آوریم. مجموعه دادههایی که برای این تحقیق جمع آوری شده است مربوط به استان یزد بوده که بین سال های ۱۳۷۱ تا ۱۳۹۱ شمسی توسط مرکز آمار، اداره توزیع برق و اداره هواشناسی استان یزد جمع آوری شده است. این داده ها شامل متغیرهای مستقل جمعیت، دمای هوا، رطوبت و بهای مصرف برق می باشد. متغیر هدف، میزان مصرف برق بوده که خود شامل مصرف کل، مصرف خانگی، مصرف صنعتی، مصرف کشاورزی و مصرف تجاری است. این دادهها به صورت سالیانه جمع آوری و مورد پردازش قرار گرفته است. در این تحقیق به کمک مدل رگرسیون خطی، پیشبینی مصرف برق انجام شده است. ساختار کلی این مقاله بدین صورت است: در بخش دوم کارهای پیشین ذکر می شود. بخش سوم شامل فرضیات مسئله و روش تحقیق می باشد. بخش چهارم به تحلیل دادهها و پیش پردازش میپردازد و بخش پنجم شامل یافته ها و بحث میباشد. در بخش آخر، نتایج بدست آمده بیان خواهد شد.
۲. کارهای پیشین
محققان زیادی در زمینه پیش بینی مصرف برق از روشهای گوناگونی استفاده نموده اند. برای پیش بینی میزان توان توربینهای بادی با استفاده از روش های داده کاوی در ۶ ] ارائه شده است. در این مقاله از پنج الگوریتم داده کاوی برای پیش بینی استفاده شده است که این پنج الگوریتم شامل ۱ SVR۲ ،MLP3، جنگل تصادفی، کلاس بندی و رگرسیون گام به گام می باشد. بررسیهای انجام شده نشان میدهد که الگوریتم SVR نتایج بهتری نسبت به الگوریتمهای دیگر داشته است.
پیش بینی بلندمدت مصرف برق در کشور یونان با استفاده از شبکههای عصبی در ۳ بیان شده است. از روش ۳MLP برای پیش بینی استفاده شده است. ورودی شبکه شامل داده هایی است که از سال های ۱۹۹۲ تا ۲۰۰۸ جمع آوری شده است. هدف، پیشبینی مصرف برق در سال های بین ۲۰۰۹ تا ۲۰۱۵ می باشد. خطای نسبی مقادیر تخمین زده شده با مقادیر واقعی برابر با ۲ درصد می باشد. از دادههای دراز مدت (سالانه) برای پیش بینی مصرف برق در ایتالیا استفاده شده است [۱]. مدل استفاده شده در این تحقیق رگرسیون خطی بوده و دادههای آنها از سال ۱۹۷۰ تا ۲۰۰۷ درنظر گرفته شده است. در این تحقیق میزان مصرف برق خانگی، غیرخانگی و کلی مصرف مورد بررسی قرار گرفت. نتایج نشان میدهد که در آینده در بخش های خانگی و غیرخانگی به ازای هر سال دو درصد میزان مصرف برق افزایش پیدا خواهد کرد.
در ۴] تحقیقی پیرامون پیش بینی مصرف برق با استفاده از سه مدل رگرسیون خطی، شبکههای عصبی و درخت تصمیم در کشور هنگ کنگ ارائه شده است. نتایج کار آنها نشان داد که با اضافه کردن فاکتورهایی چون دمای هوا و سرعت باد می توان مدل ارائه شده را بهبود بخشید. با مقایسه خروجی مدلها به این نتیجه رسیدند که به ترتیب درخت تصمیم و شبکه های عصبی پیشبینی صحیح تری دارند.
در ۵]، میزان مصرف برق ترکیه براساس چهار شاخص جمعیت، تولید ناخالص ملی، واردات و صادرات مدل سازی شده است. پیشبینی انجام شده در این تحقیق از سال ۲۰۰۷ تا ۲۰۲۶ بوده است. براساس پیشبینی انجام شده میزان مصرف برق در سال 2026 برابر 284 تراوات ساعت خواهد رسید.
پیشبینی کوتاه مدت مصرف برق با استفاده از روش خاکستری برای کشورهای عضو سازمان همکاری اقتصادی آسیا و اقیانوسیه در ۲] ارائه شده است. این تئوری زمانی کاربرد دارد که اطلاعات، ناکافی و نامعلوم باشد. زمانی که مجموعه داده کم باشد، مدل خاکستری می تواند مفید باشد. نتایج نشان می دهد که میانگین خطای مطلق مدل پیش بینی کمتر از ۳/۱ درصد می باشد.
۳. فرضیات مسئله و روش تحقیق
فرضیاتی که دراین مقاله بررسی می شود شامل مواردی چون میزان مصرف برق در سال های آینده، پیدا کردن مهمترین عامل در افزایش مصرف، کشف نوع روابط دادههای بین متغیرهای موثر در مصرف برق و وضعیت مصرف برق در آینده میباشد. مراحل انجام کار در این تحقیق بدین گونه است که در ابتدا یک سری داده از شرکت توزیع برق استان یزد شامل میزان کل مصرف برق و میزان مصرف برق به تفکیک نوع مصرف در ۲۰ سال گذشته جمع آوری شد. سپس داده های مرتبط با میزان مصرف برق مانند دمای هوا و میانگین رطوبت از اداره هواشناسی، جمعیت از مرکز آمار ایران و بهای مصرف برق از اداره برق استان یزد جمع آوری گردید. بعد از جمع آوری دادهها و نرمال سازی، مجموعه ی دادهها برای پردازش اصلی آماده شدند. سپس منابع مختلف داده با هم ترکیب و دادههای مربوط به آنالیز انتخاب شدند. در مرحله بعد روابط بین دادهها بررسی گردید. در این تحقیق از مدل رگرسیون خطی استفاده شده و به کمک آن خروجی که همان مقادیر پیش بینی شده تجزیه و تحلیل میزان مصرف برق در سالهای اخیر در استان یزد می باشد محاسبه شده و ارتباط منطقی میزان مصرف با فاکتورهای مستقلی از قبیل جمعیت، دمای هوا، رطوبت و بهای مصرف برق بدست می آید.
۴. دادهها و پیش پردازش دادههای مورد مطالعه در این پایان نامه مربوط به استان یزد می باشد که این دادهها از مراکز مختلف مانند اداره برق استان، اداره آمار و اداره ثبت احوال استان یزد بدست آمده است. مجموعه داده ی مورد استفاده در این مقاله به صورت سالیانه می - باشد و مربوط به سالهای ۱۳۹۱ - ۱۳۷۱ می باشد. این دادهها به دو گروه متغیرهای مستقل و متغیر هدف تقسیم می شوند.
گروه اول شامل متغیرهای مستقل (پیش بینی کننده) هستند و در میزان مصرف برق تاثیرگذار می باشند. متغیرهای مستقل شامل جمعیت، دمای هوا، رطوبت و بهای مصرف برق می باشند. میزان دمای هوا و میزان رطوبت از اداره هواشناسی استان یزد تهیه شده و جمعیت استان و بهای مصرف برق برای هر سال، از مرکز آمار استان جمع آوری گردید. گروه دوم شامل متغیر هدف یعنی میزان مصرف کلی برق در استان میباشد. میزان مصرف برق خود شامل مصرف برق خانگی، مصرف برق صنعتی، مصرف برق تجاری و مصرف برق کشاورزی می باشد. دادههای مربوط به میزان مصرف برق از شرکت توزیع برق استان یزد جمع آوری شد.
قبل از عمل تحلیل دادهها، باید دادهها را پیش پردازش کرد. پیش پردازش داده به آماده کردن داده برای شروع پردازش اصلی که کشف دانش می باشد می گویند. در این مرحله دادهها را از لحاظ وجود خطا مانند مقادیر گم شده، دادههای نویزدار، دادههای تکراری و دادههای غلط بررسی می کنیم. در صورتی که در هر کدام از این موارد خطا وجود داشت باید آن را رفع کرد. برای رفع این خطاها در این تحقیق ابتدا داده های مصرف برق در ۲۰ سال گذشته جمعآوری شد و بدلیل در دسترس نبودن بعضی از دادههای چند سال گذشته، با استفاده از فرمول های آماری مقادیر گم شده محاسبه شد و اعداد بدست آمده جایگزین گردید. از ذکر بعضی از داده ها مانند روشنایی معابر و مصارف آزاد به دلیل ناچیز بودن سهم آنها در کل مصرف برق خودداری کردیم و آنها را حذف نمودیم. یکپارچگی داده ها، انتخاب دادهها و تبدیل دادهها از کارهای دیگری است که باید در مرحله پیش پردازش انجام داد. در تحقیق پیش رو تبدیل دادهها روی میزان مصرف برق از نظر واحد استاندارد انجام شده است.
یافته ها و بحث
در این تحقیق با توجه به نرم افزار WEKA که یکی از نرم افزار های داده کاوی است و مدل رگرسیون خطی بر روی داده ها پیش بینی مصرف برق انجام شده است. تغییرات مربوط به جمعیت، دما، رطوبت و قیمت برق از سال 1371 - 1391 در نمودارهای (۱) تا (۴) نشان داده شده است.