مقاله ارزیابی کارایی تکنیکهای SVM و KNN در پیش بینی نرخ شکست لوله های شبکه توزیع آب

word قابل ویرایش
14 صفحه
دسته : اطلاعیه ها
12700 تومان
127,000 ریال – خرید و دانلود

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***

ارزیابی کارایی تکنیکهای SVM و KNN در پیش بینی نرخ شکست لوله های شبکه توزیع آب
چکیده
شناخت مکانیزم فرسودگی و شکست لوله های آب در شبکه های توزیع آب و توسعه مدل های پیش بینی شکست امری ضروری است که تدوین سیاست های بازسازی و نوسازی بهینه شبکه های توزیع آب ، بدون آن امکان پذیر نخواهد بود.در این تحقیق از تکنیک های ماشین بردار پشتیبان (SVM) و K-نزدیکترین همسایگی (KNN) جهت ساخت مدل پیش بینی نرخ شکست لوله ها استفاده شده و به ارزیابی کارایی آنها پرداخته شد. پارامترهای سن ، قطر، طول ، عمق نصب لوله و فشار هیدرولیکی متوسط نیز به عنوان پارامترهای مؤثر در نرخ شکست لوله ها در نظر گرفته شد که اطلاعات آماری این پارامترها مربوط به بخشی از شبکه توزیع آب شهر مشهد می باشد.معیارهای میانگین در صد خطای مطلق (MAPE)، جذر میانگین مجذورات خطای نرمال (NRMSE) و ضریب تعیین (R٢) برای ارزیابی مدل های ساخته شده بکار گرفته شدندو نتایج به دست آمده نشان داد که تکنیک SVM عملکرد بهتری در پیش بینی نرخ شکست لوله های شبکه توزیع آب داشته و نسبت به تکنیک KNN برتری دارد.
واژه های کلیدی : شبکه توزیع آب ، پیش بینی نرخ شکست لوله ها، SVM،ANN

۱- مقدمه
بهینه سازی عملیات بازسازی و نوسازی شبکه های توزیع آب امری است که انجام آن نیازمنددرک و شناخت فرایند فرسودگی و شکست لوله های آب و توسعه مدل های پیش بینی شکست می باشد. پدیده ترکیدگی و شکست لوله ها درشبکه های توزیع آب کم و بیش اتفاق می افتد و در صورتی که مقاومت باقیمانده لوله های فرسوده برای تحمل نیروهای وارده کافی نباشد، این پدیده به طور مکرر رخ خواهد داد [١]. در اغلب تحقیقات قبلی برای پیش بینی نرخ شکست ١(تعداد سالانه شکست در هر کیلومتر طول لوله ) از مدل های رگرسیونی ساده استفاده شده است ,۶ ,۵ ,۴ ,٣ ,٢]
[ ٨ ,٧. در برخی از آنها نیز یا یک مدل داده کاوی بنام مدل رگرسیون چند جمله ای تکاملی (EPR) بکار گرفته شده ,٩,١ ,١٠و یا از شبکه های بیزین ١استفاده شده است [١٢ ,١١]. در موارد بسیار کمی نیز تکنیک شبکه عصبی مصنوعی ٢ [١۶ ,١۵ ,١۴ ,١٣]و همچنین سیستم استنتاج تطبیقی عصبی -فازی ٣[١۶]بکار گرفته شده است .
در این تحقیق برای ساخت مدل پیش بینی نرخ شکست از تکنیک های ماشین بردار پشتیبان (SVM)و K- نزدیکترین همسایگی (KNN) استفاده شده و به بررسی کارایی و عملکرد آنهاپرداخته شده است . SVM یک روش نسبتاً جدید برای یادگیری توابع با داده های آموزشی پراکنده در تشخیص الگو (طبقه بندی ) یا تشخیص توابعی برای تقریب های رگرسیونی می باشد که برگرفته از نظریه یادگیری آماری (SLT) است [١٧]. این تکنیک درشناسایی الگو، برآورد رگرسیون ،پیش بینی های سری های زمانی ، طبقه بندی متن ،تشخیص چهره بااستفاده ازتصویر و شناسایی دست خط درمقایسه باسایرتکنیک های یادگیری عملکردبهتری دارد [١٨].KNN نیز یک الگوریتم مشاهده و یادگیری از طریق نظارت و بررسی می باشد که هدف آن دسته بندی یک عضو یا شیئ جدید براساس ویژگی نمونه های آموزش دهنده می باشدو در آن یک نمونه جدید بر اساس اکثریت Kگروه و دسته که نزدیکترین همسایگی ها را با آن نمونه داشته باشند، تقسیم بندی می شود [١٩].لازم به ذکر است این تکنیکهاتا کنون برای پیش بینی نرخ شکست لوله های شبکه توزیع بکار گرفته نشده اند.
٢- معرفی تکنیک ها
SVM -١-٢
ماشین های بردار پشتیبان سامانه های یادگیری خاصی هستند که از یک فضای فرضیه به نام فضای مشخصه ۶شامل توابع خطی با بعدزیاد استفاده می کنند. هدف یک ماشین یادگیر یافتن یک تابع پیوسته با مقدار حقیقی است که بتواند به ازای مقادیر ورودی ، پیش بینی دقیقی از مقدار خروجی داشته باشد. این سامانه ها توسط الگوریتم یادگیری که بر اساس تئوری بهینه سازی استوار است ، آموزش داده می شوند [٢٠]. SVM در ابتدا برای تشخیص الگو توسعه یافت وسپس سعی شد از این سامانه به منظور رگرسیون استفاده شود. در شکل رگرسیونی ماشین بردار پشتیبان (SVR) الگوی ورودی (x) با استفاده از یک تابع انتقال غیرخطی به فضای مشخصه با ابعاد بالانگاشت داده می شودو در نتیجه یک رگرسیون خطی در این فضا خواهیم داشت [٢١].

که در آن صمشخصه نامیده شده ضرایبی هستند که با استفاده از داده های موجود تعیین می شوند. بنابراین رگرسیون غیر خطی در فضای ورودی با ابعاد پایین به یک رگرسیون خطی در فضای مشخصه با ابعاد بالا تبدیل می شود.ضرایب می توان با کمینه کردن تابع ذیل تعیین کرد.

که در آن ثابت هموار سازی و تابع خطای وپنیک بوده وبه صورت زیر تعریف می شود.

می توان نشان داد که تابع تخمین به صورت زیر خواهد بود.

که در آن بوده و تابع کرنل می باشدو بیان کننده ضرب داخلی در فضای مشخصه
Dبعدی است .

از متداول ترین توابع کرنل مورد استفاده می توان به توابع چند جمله ای ، پایه شعاعی گوسین و سیگموئیدی اشاره کرد. مقدار ضرایب نیز بابیشینه سازی تابع زیر به دست می آید.

فقط تعدادی از ضرایب مغایر صفر خواهد بود که داده های متناظر آنها بردارهای پشتیبان نامیده می شوند.
پارامترهای C و نیز توسط کاربر تعیین می شوند [٢١].
KNN -٢-۲
تکنیک K-نزدیکترین همسایگی یک روش تشخیص الگوهای آماری غیر پارامتری می باشد که تعداد K از نزدیکترین الگوهای مشابه را پیدا کرده و براساس آنها ارزش نمونه مورد مطالعه را پیش بینی می کند. نحوه عمل کرداین الگوریتم بسیار ساده می باشد. این الگوریتم براساس حداقل فاصله نمونه مورد بررسی تا نمونه های موجود دیگر برای تعیین K-نزدیکترین همسایگی ها کار می کند. پس از تعیین Kدسته از نزدیکترین همسایگی ها به راحتی قادر خواهد بود ترکیب وزنی آن همسایگی ها را به عنوان پیش بینی نمونه مورد بررسی انتخاب کند.مراحل روش الگوریتم K-نزیکترین همسایه به شرح ذیل می باشد:
۱-مشخص کردن داده ها، اطلاعات و نمونه های مورد استفاده برای آموزش (xj)
۲-تعیین تعداد دسته های همسایگی ها.
۳-مشخص کردن فاصله نمونه مورد بررسی (xi)تا هر دسته و گروه از نمونه های مشخص از طریق محاسبه فاصله اقلیدسی
از رابطه (۷):

۴-مشخص کردن وضعیت نمونه مورد بررسی .
از مزایای این روش به طور خلاصه می توان به موارد ذیل اشاره نمود:
الف -اجرای ساده .
ب -مؤثر بودن و کارکرد بهینه و عملکرد با بازدهی بالا در برخورد با تعداد دسته های زیاد از داده ها و اطلاعات .
ج -استفاده از اطلاعات محلی برای سازگاری هرچه بیشتر رفتار مدل با واقعیت ها.
د-غیر پارامتری بودن .
ه -این مدل به راحتی این امکان را دارد که محاسبات را به طور موازی انجام دهد [١٩].
۳- مطالعه موردی
در این تحقیق ناحیه چهار آبفای مشهد (شکل ١)به عنوان مطالعه موردی در نظر گرفته شده است . حداقل و حداکثر تراز ارتفاعی این ناحیه از سطح دریا به ترتیب ١٠٢١و ١٢١۴متر بوده ودارای مساحتی بالغ بر ٢۴١٨هکتار و حدود ٩٣٧١٩فقره انشعاب آب می باشد.طول کل لوله های شبکه توزیع آن ۵٧٩٨۶٠متر شامل لوله های آهنی با قطرهای ۶٠٠، ٧٠٠و ٨٠٠میلیمتر و لوله های آزبست و چدن با قطرهای ٨٠، ١٠٠، ١۵٠، ٢٠٠، ٢۵٠، ٣٠٠و ۴٠٠میلیمتر است . نصب و اجرای لوله های شبکه در این ناحیه عموماً از سال ١٣۶٠شروع شده است . بر اساس آمار ثبت شده این ناحیه دارای بیشترین نرخ شکست بوده که اکثریت آن هم مربوط به لوله های آزبست سیمانی می باشد و برای لوله های آهنی و چدنی اطلاعات کافی جهت ساخت مدل پیش بینی نرخ شکست وجود نداشته ، لذا از این ناحیه فقط اطلاعات مربوط به لوله های آزبست سیمان مورد استفاده قرار گرفته است [١٠].

۴- متدولوژی
در این تحقیق ساخت مدل ماشین بردار پشتیبان در محیط نرم افزار ٧.۶.٠.٣٢۴ Version)MATLAB ((Ra٢٠٠٨)صورت پذیرفته و آنالیز و محاسبات مربوط به ماشین بردار پشتیبان نیز با استفاده از نرم افزار LIBSVM انجام شده است . این نرم افزار توسط [٢٢]ارائه شده است . برای ساخت مدل KNN نیزدر محیط برنامه نویسی فرترن کدنویسی شده است . ورودی های مدل پیش بینی نرخ شکست شامل قطر لوله ، طول ، سن ، عمق نصب لوله و فشار هیدرولیکی متوسط بوده و خروجی آن نیز نرخ شکست لوله های شبکه توزیع آب (P.B.R) می باشد.جهت نرمال سازی داده های ورودی و خروجی مدل از رابطه ذیل استفاده شده است .

که در آن xمقدار غیر نرمال ، xn مقدار نرمال شده ، xmax و xmin به ترتیب بیشترین و کمترین مقدار مربوط به متغیر می – باشند. با استفاده از این رابطه مقادیر متغیر xدر بازه [٠.١,٠.٩]قرار خواهد گرفت [٢٣].
معیارهای ارزیابی در نظر گرفته شده در این تحقیق عبارتند از میانگین در صد خطای مطلق (MAPE)، جذر میانگین مجذورات خطای نرمال (NRMSE) و ضریب تعیین R2 که به صورت زیر نوشته می شوند [٢۴].

این فقط قسمتی از متن مقاله است . جهت دریافت کل متن مقاله ، لطفا آن را خریداری نمایید
word قابل ویرایش - قیمت 12700 تومان در 14 صفحه
127,000 ریال – خرید و دانلود
سایر مقالات موجود در این موضوع
دیدگاه خود را مطرح فرمایید . وظیفه ماست که به سوالات شما پاسخ دهیم

پاسخ دیدگاه شما ایمیل خواهد شد