بخشی از مقاله

روشی به منظور پیش بینی و تحلیل الگوی مصرف آب با استفاده از شبکه عصبی و روش خاکستری، مطالعه موردی استان یزد

چکیده
در دنیای امروز با توجه به حجم وسیع و پیچیدگی دادههای موجود، بیش از پیش نیاز به ابزاری کارا، مؤثر و مطمئن به منظور کشف دانش سودمند و مورد نیاز در دادهها، حس می شود. در دهه های اخیر با توجه به مشکل کمبود منابع آبی، مسأله استفاده و مدیریت بهینه از این منابع اهمیت خاصی پیدا کرده است. یکی از مواردی که در این زمینه مورد بررسی قرار گرفته است، تهیه مدل پیش بینی کننده مصرف آب می باشد. وجود چنین مدل هایی باعث میگردد که تصمیم گیریهای مربوطه، به مدیریت بهینه منجر شود. نوسانات موجود در مصرف روزانه آب ناشی از عوامل مختلفی است که مهمترین آنها، عوامل آب و هوایی هستند. لذا با شناخت تغییرات و نوسانات عوامل آب و هوایی مؤثر بر مصرف آب می توان نوسانات احتمالی در مصرف آب را پیشبینی نمود. به علاوه وجود همبستگی زیاد بین مقادیر مصرف آب در روزهای متوالی، تهیه یک مدل پیش بینی براساس این همبستگی را امکان میدهد. داده کاوی مجموعه ای از تکنیک های آماری برای کشف روند ناشناخته و الگوهای موجود از پایگاه دادههای بزرگ می باشد. داده کاوی به یک ابراز مفید در دنیای تجارت تبدیل شده است که فرصت بهبود توانمندی ها در راستای مدیریت و بهره بردای از دانش را به همراه دارد. یکی از کاربردهای مهم داده کاوی پیشبینی میباشد که تکنیکهای مختلفی برای انجام این کار وجود دارد. در این مقاله به منظور پیشبینی مصرف آب از سه تکنیک داده کاوی شامل شبکه عصبی، ماشین بردار پشتیبان و تئوری خاکستری استفاده شده است. مجموعه دادههایی که برای این پیشبینی جمع آوری شد مربوط به استان یزد میباشد. این دادهها به صورت روزانه می باشد. هدف از این مقاله تحلیل میزان مصرف آب و پیش بینی مصرف آن در آینده با بکارگیری تئوری خاکستری، شبکه عصبی و ماشین بردار پشتیبان می باشد. از روشهای پیش بینی موجود، بهترین مدل، مدل شبکه عصبی با دقت 22 و 94% می باشد.

1 - مقدمه
روند افزایشی تقاضا برای آب در همه مناطق جهان مسئلهای اجتنابناپذیر است. آب به عنوان یک کالای اقتصادی و اجتماعی است و هر چند که از منابع تجدید شونده بشمار میرود ولی مقدار آن محدود است. با توجه به رشد جمعیت، گسترش صنعت، بالا رفتن سطح بهداشت و رفاه عمومی، سرانه منابع تجدید شونده رو به کاهش است. تضاد بین عرضه و تقاضا به طور فزایندهای در حال تبدیل شدن به یک مشکل برجسته میباشد.
در دهه های اخیر با توجه به مشکل کمبود منابع آبی، مساله استفاده و مدیریت بهینه از این منابع اهمیت خاصی پیدا کرده است. یکی از مواردی که در این زمینه مورد بررسی قرار گرفته است، تهیه مدل پیشبینی کننده مصرف اب می باشد که به صورت کوتاه مدت، میان مدت و بلند مدت صورت میگیرد|14] موجود در مصرف روزانه آب ناشی از عوامل مختلفی است که مهمترین آنها، عوامل آب و هوایی و جمعیت هستند. لذا با شناخت تغییرات و نوسانات عوامل آب و هوایی مؤثر بر مصرف آب می توان نوسانات احتمالی در مصرف آب را پیش بینی نمود. به علاوه وجود همبستگی زیاد بین مقادیر مصرف آب در روزهای متوالی، تهیه یک مدل پیش بینی براساس این همبستگی را امکان می دهد]3].
ایده اصلی داده کاوی حاوی اطلاعاتی هستند که درآینده مورد استفاده قرار گرفته و مفید خواهند بود امر استوار است که داده های قدیمی. هدف داده کاوی یافتن الگوهایی در دادههای پیشین است که نیازها، ترجیحات و تمایلات را روشنتر می نماید. این حقیقت که الگوها همواره واضح نیستند و علائم دریافت شده از دادهها گاهی مبهم و گیج کننده هستند کار را سختتر می نماید. لذا جداکردن علائم از چیزهای به درد نخور یعنی تشخیص الگوهای اساسی در بطن متغیرهای به ظاهر تصادفی، یکی از نقش های مهم داده کاوی است. مطالعات زیادی در مورد پیش بینی مصرف آب با استفاده از روش های داده کاوی صورت گرفته است Xingtong و همکارانش در سال 2012 تحقیقی با استفاده از شبکههای عصبی ارائه دادند طبق بررسی آنها دقت پیشبینی مصرف آب شهری بر اساس شبکههای عصبی پایه شعاعی کم و همچنین سرعت همگرایی این شبکهها بسیار کم بوده است. آنها پیشنهاد جدیدی با استفاده از روش شبکههای عصبی QPSO-RBF ارائه دادند. در این روشی پارامترهای شبکه عصبی پایه شعاعی توسط QPSO بهینه شده بود. نتایج نشان داده که سرعت همگرایی و دقت پیش بینی در این روش از روش مبتنی بر -PSO RBF و RBF| بهتر بوده است. در سال 2012 وی بیگیو و همکارانش با استفاده از مدل خاکستری بر روی دادههای آب انجام دادهاند. برای افزایش دقت مدل خاکستری از مدل T-GM" استفاده شده بود. با استفاده از مدل T-GM میانگین خطای مطلق برابر با m/a"10*077. متوسط درصد خطای مطلق 356 ٪ و درصد خطای ماکزیمم مطلق 1258٪ بود. بنابراین دقت روش مدل T-GM بیشتر از روش خاکستری بوده است |6|تحقیقی توسط زنگ و همکارانش در سال 2011 برای پیشبینی تقاضای آب از سال 2010 تا 2018 در چین انجام شد. آنها ترکیبی از مدل خاکستری و میانگین متحرک پس رونده خودکار (ARAM)" استفاده کرده بودند. مدل جدید دارای خطای کمتر و دقت بیشتری بود. نتایج نشان داد که مصرف آب صنعتی و خانگی افزایش داشته و مصرف آب کشاورزی کاهش خواهد داشت. این روش مناسب برای دادههای کوچک و نامنظم می باشد|10 || جان هیو و همکاران پیش بینی کوتاه مدت مصرف آب شهری با استفاده از سه روش پیش بینی میانگین حسابی، روش تجزیه و تحلیل رگرسیون و شبکه عصبی انجام داده بودند. این مطالعه نشان داده است که روش رگرسیون و شبکه عصبی نتایج بهتری نسبت به روش میانگین حسابی داشته است. همچنین اگر مصرف آب در واحد کوچک زمان نیاز باشد روش شبکه عصبی بهتر عمل میکند. متوسط درصد خطای مطلق 4,77٪ بوده است [ 11]

2 - موارد و روشها
در این مقاله، سه الگوریتم داده کاوی یعنی ماشین بردار پشتیبان و شبکه های عصبی مصنوعی و مدل خاکستری برای پیش بینی مصرف آب تجزیه و تحلیل شد و بهترین مدل برای پیش بینی انتخاب شد. اطلاعات لازم برای بررسی و تحلیل آماری عوامل مؤثر بر تقاضای آب و تهیه مدل پیش بینی تقاضای آب، شامل دادههای هواشناسی، جمعیت و مصرف آب است. دادههای هواشناسی از سازمان هواشناسی استان یزد تهیه گردید که شامل پارامترهای هواشناسی روزانه از سال 1389 تا 1333 و برای دوازده ایستگاه هواشناسی استان یز می باشد. دادههای مربوط به آب از شرکت آب و فاضلاب استان یزد تهیه شد که شامل : تاریخ قبض، مصرف قبض، تاریخ قرائت قبلی، تاریخ قرائت فعلی، نوع کاربری، تعداد روز قبض، نوع اشتراک بود. دادههای جمع آوری شده برای د حداکثر دادههایی است که در زمان مطالعه موجود بود. - سایت آمار استان یزد جمع آوری شده است. بعد از جمع آوری داده ها در فاز اول این تحقیق، به شناسایی پارامترهای تاثیرگذار در میزان مصرف آب پرداخته شد سپس از میان آنها عواملی که بیشترین تاثیرگذاری را داشته انتخاب شدند. در مرحله بعد به تحلیل دادهها و بررسیرفتارهای مختلف بر روی مصرف آب پرداخته میشود بعد از اینکه ورودیهای مورد نیاز تشخیص داده شد و پیش پردازشهای لازم انجام شد با استفاده از شبکه های عصبی مصنوعی، مدل خاکستری و ماشین بردار پشتیبان پیشبینی صورت میگیرد و سپس نتایج حاصل بررسی میشود. در این تحقیق از نرم افزار کلمنتاین و متلب استفاده شده است.

2 - 1 - شبکه عصبی مصنوعی
شبکه های عصبی مصنوعی بعنوان یکی از روشهای محاسباتی در هوش مصنوعی سیستمها و روشهای محاسباتی نوینی هستند برای یادگیری ماشینی، نمایش دانش، و در انتها اعمال دانش به دست آمده در جهت پیشبینی پاسخهای خروجی از سامانههای پیچیده. ایده اصلی این گونه شبکهها تا حدودی الهام گرفته از شیوه کارکرد سیستم عصبی زیستی، برای پردازش داده ها، و اطلاعات به منظور یادگیری و ایجاد دانش قرار دارد. عنصر کلیدی این ایده، ایجاد ساختارهایی جدید برای سامانه پردازش اطلاعات است. این سیستم از شمار زیادی عناصر پردازشی فوق العاده بهم پیوسته با نام نورون تشکیل شده که برای حل یک مسأله با هم هماهنگ عمل می کنند و توسط سیناپسها(ارتباطات الکترومغناطیسی) اطلاعات را منتقل می کنند || 2 | در این شبکهها اگر یک سلول آسیب ببیند بقیه سلولها می توانند نبود آنرا جبران کرده، و نیز در بازسازی آن سهیم باشند. این شبکه ها قادر به یادگیری اند. یادگیری در این سیستمها به صورت تطبیقی صورت می گیرد، یعنی با استفاده ازمثال ها وزن سیناپسها به گونهای تغییر می کند که در صورت دادن ورودیهای جدید، سیستم پاسخ درستی تولید کند. ساختار عادی یک شبکه عصبی مصنوعی، معمولاً از لایه ورودی، لایه های میانی یا پنهان و لایه خروجی تشکیل شده است. لایه ورودی یک لایه انتقال دهنده و وسیلهای برای تهیه کردن دادههاست. لایه خروجی شامل مقادیر پیشبینی شده به وسیله شبکه است و لایه پنهان محل پردازش داده - هاست. شمار لایه ها و شمار نرونها در هر لایه پنهان، به طور معمولی به وسیله روش آزمون و خطا مشخص میشود|7|

2 - 2 - ماشین بردار پشتیبان
الگوریتم ماشین بردار پشتیبان اولیه در 1963 توسط Wapmlk ابداع شد. ماشین بردار پشتیبان، مرزیست که با داشتن بردارهای پشتیبان، بهترین دسته - بین دادهها را برای ما مشخص می کند. یکی از روشهای یادگیری بانظارت است. مبنای کاری دسته بندی - کننده ماشین بردار پشتیبان دسته بندی خطی دادهها است. و در تقسیم خطی دادهها سعی میکنیم خطی را انتخاب کنیم که حاشیه اطمینان بیشتری داشته باشد. حل معادلهٔ پیدا کردن خط بهینه برای دادهها به وسیله روش های QP که روشهای شناخته شدهای در حل مسائل محدودیت دار هستند صورت میگیرد||12]. ماشین بردار پ دادهها استفاده می کند و سپس بر اساس از یک تکنیک که کرنل نامیده می شود، برای تبدیل یلی، مرز بهینه بین خروجی - های ممکن را پیدا می کند. به عبارت ساده تبدیلات بسیار پیچیده را انجام میدهد، سپس مشخص میکند چگونه داده هایتان را بر اساس برچسبها یا خروجی هایی که تعریف کردهاید، جدا کنید.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید