بخشی از مقاله

*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***

ارزيابي کارايي تکنيکهاي SVM و KNN در پيش بيني نرخ شکست لوله هاي شبکه توزيع آب
چکيده
شناخت مکانيزم فرسودگي و شکست لوله هاي آب در شبکه هاي توزيع آب و توسعه مدل هاي پيش بيني شکست امري ضروري است که تدوين سياست هاي بازسازي و نوسازي بهينه شبکه هاي توزيع آب ، بدون آن امکان پذير نخواهد بود.در اين تحقيق از تکنيک هاي ماشين بردار پشتيبان (SVM) و K-نزديکترين همسايگي (KNN) جهت ساخت مدل پيش بيني نرخ شکست لوله ها استفاده شده و به ارزيابي کارايي آنها پرداخته شد. پارامترهاي سن ، قطر، طول ، عمق نصب لوله و فشار هيدروليکي متوسط نيز به عنوان پارامترهاي مؤثر در نرخ شکست لوله ها در نظر گرفته شد که اطلاعات آماري اين پارامترها مربوط به بخشي از شبکه توزيع آب شهر مشهد مي باشد.معيارهاي ميانگين در صد خطاي مطلق (MAPE)، جذر ميانگين مجذورات خطاي نرمال (NRMSE) و ضريب تعيين (R٢) براي ارزيابي مدل هاي ساخته شده بکار گرفته شدندو نتايج به دست آمده نشان داد که تکنيک SVM عملکرد بهتري در پيش بيني نرخ شکست لوله هاي شبکه توزيع آب داشته و نسبت به تکنيک KNN برتري دارد.
واژه هاي کليدي : شبکه توزيع آب ، پيش بيني نرخ شکست لوله ها، SVM،ANN

۱- مقدمه
بهينه سازي عمليات بازسازي و نوسازي شبکه هاي توزيع آب امري است که انجام آن نيازمنددرک و شناخت فرايند فرسودگي و شکست لوله هاي آب و توسعه مدل هاي پيش بيني شکست مي باشد. پديده ترکيدگي و شکست لوله ها درشبکه هاي توزيع آب کم و بيش اتفاق مي افتد و در صورتي که مقاومت باقيمانده لوله هاي فرسوده براي تحمل نيروهاي وارده کافي نباشد، اين پديده به طور مکرر رخ خواهد داد [١]. در اغلب تحقيقات قبلي براي پيش بيني نرخ شکست ١(تعداد سالانه شکست در هر کيلومتر طول لوله ) از مدل هاي رگرسيوني ساده استفاده شده است ,٦ ,٥ ,٤ ,٣ ,٢]
[ ٨ ,٧. در برخي از آنها نيز يا يک مدل داده کاوي بنام مدل رگرسيون چند جمله اي تکاملي (EPR) بکار گرفته شده ,٩,١ ,١٠و يا از شبکه هاي بيزين ١استفاده شده است [١٢ ,١١]. در موارد بسيار کمي نيز تکنيک شبکه عصبي مصنوعي ٢ [١٦ ,١٥ ,١٤ ,١٣]و همچنين سيستم استنتاج تطبيقي عصبي -فازي ٣[١٦]بکار گرفته شده است .
در اين تحقيق براي ساخت مدل پيش بيني نرخ شکست از تکنيک هاي ماشين بردار پشتيبان (SVM)و K- نزديکترين همسايگي (KNN) استفاده شده و به بررسي کارايي و عملکرد آنهاپرداخته شده است . SVM يک روش نسبتاً جديد براي يادگيري توابع با داده هاي آموزشي پراکنده در تشخيص الگو (طبقه بندي ) يا تشخيص توابعي براي تقريب هاي رگرسيوني مي باشد که برگرفته از نظريه يادگيري آماري (SLT) است [١٧]. اين تکنيک درشناسايي الگو، برآورد رگرسيون ،پيش بيني هاي سري هاي زماني ، طبقه بندي متن ،تشخيص چهره بااستفاده ازتصوير و شناسايي دست خط درمقايسه باسايرتکنيک هاي يادگيري عملکردبهتري دارد [١٨].KNN نيز يک الگوريتم مشاهده و يادگيري از طريق نظارت و بررسي مي باشد که هدف آن دسته بندي يک عضو يا شيئ جديد براساس ويژگي نمونه هاي آموزش دهنده مي باشدو در آن يک نمونه جديد بر اساس اکثريت Kگروه و دسته که نزديکترين همسايگي ها را با آن نمونه داشته باشند، تقسيم بندي مي شود [١٩].لازم به ذکر است اين تکنيکهاتا کنون براي پيش بيني نرخ شکست لوله هاي شبکه توزيع بکار گرفته نشده اند.
٢- معرفي تکنيک ها
SVM -١-٢
ماشين هاي بردار پشتيبان سامانه هاي يادگيري خاصي هستند که از يک فضاي فرضيه به نام فضاي مشخصه ٦شامل توابع خطي با بعدزياد استفاده مي کنند. هدف يک ماشين يادگير يافتن يک تابع پيوسته با مقدار حقيقي است که بتواند به ازاي مقادير ورودي ، پيش بيني دقيقي از مقدار خروجي داشته باشد. اين سامانه ها توسط الگوريتم يادگيري که بر اساس تئوري بهينه سازي استوار است ، آموزش داده مي شوند [٢٠]. SVM در ابتدا براي تشخيص الگو توسعه يافت وسپس سعي شد از اين سامانه به منظور رگرسيون استفاده شود. در شکل رگرسيوني ماشين بردار پشتيبان (SVR) الگوي ورودي (x) با استفاده از يک تابع انتقال غيرخطي به فضاي مشخصه با ابعاد بالانگاشت داده مي شودو در نتيجه يک رگرسيون خطي در اين فضا خواهيم داشت [٢١].

که در آن صمشخصه ناميده شده ضرایبی هستند که با استفاده از داده هاي موجود تعيين مي شوند. بنابراين رگرسيون غير خطي در فضاي ورودي با ابعاد پايين به يک رگرسيون خطي در فضاي مشخصه با ابعاد بالا تبديل مي شود.ضرايب مي توان با کمينه کردن تابع ذيل تعيين کرد.

که در آن ثابت هموار سازي و تابع خطاي وپنيک بوده وبه صورت زير تعريف مي شود.

مي توان نشان داد که تابع تخمين به صورت زير خواهد بود.

که در آن بوده و تابع کرنل مي باشدو بيان کننده ضرب داخلي در فضاي مشخصه
Dبعدي است .

از متداول ترين توابع کرنل مورد استفاده مي توان به توابع چند جمله اي ، پايه شعاعي گوسين و سيگموئيدي اشاره کرد. مقدار ضرايب نيز بابيشينه سازي تابع زير به دست مي آيد.

فقط تعدادي از ضرايب مغاير صفر خواهد بود که داده هاي متناظر آنها بردارهاي پشتيبان ناميده مي شوند.
پارامترهاي C و نيز توسط کاربر تعيين مي شوند [٢١].
KNN -٢-2
تکنيک K-نزديکترين همسايگي يک روش تشخيص الگوهاي آماري غير پارامتري مي باشد که تعداد K از نزديکترين الگوهاي مشابه را پيدا کرده و براساس آنها ارزش نمونه مورد مطالعه را پيش بيني مي کند. نحوه عمل کرداين الگوريتم بسيار ساده مي باشد. اين الگوريتم براساس حداقل فاصله نمونه مورد بررسي تا نمونه هاي موجود ديگر براي تعيين K-نزديکترين همسايگي ها کار مي کند. پس از تعيين Kدسته از نزديکترين همسايگي ها به راحتي قادر خواهد بود ترکيب وزني آن همسايگي ها را به عنوان پيش بيني نمونه مورد بررسي انتخاب کند.مراحل روش الگوريتم K-نزيکترين همسايه به شرح ذيل مي باشد:
۱-مشخص کردن داده ها، اطلاعات و نمونه هاي مورد استفاده براي آموزش (xj)
۲-تعيين تعداد دسته هاي همسايگي ها.
۳-مشخص کردن فاصله نمونه مورد بررسي (xi)تا هر دسته و گروه از نمونه هاي مشخص از طريق محاسبه فاصله اقليدسي
از رابطه (۷):

۴-مشخص کردن وضعيت نمونه مورد بررسي .
از مزاياي اين روش به طور خلاصه مي توان به موارد ذيل اشاره نمود:
الف -اجراي ساده .
ب -مؤثر بودن و کارکرد بهينه و عملکرد با بازدهي بالا در برخورد با تعداد دسته هاي زياد از داده ها و اطلاعات .
ج -استفاده از اطلاعات محلي براي سازگاري هرچه بيشتر رفتار مدل با واقعيت ها.
د-غير پارامتري بودن .
ه -اين مدل به راحتي اين امکان را دارد که محاسبات را به طور موازي انجام دهد [١٩].
۳- مطالعه موردي
در اين تحقيق ناحيه چهار آبفاي مشهد (شکل ١)به عنوان مطالعه موردي در نظر گرفته شده است . حداقل و حداکثر تراز ارتفاعي اين ناحيه از سطح دريا به ترتيب ١٠٢١و ١٢١٤متر بوده وداراي مساحتي بالغ بر ٢٤١٨هکتار و حدود ٩٣٧١٩فقره انشعاب آب مي باشد.طول کل لوله هاي شبکه توزيع آن ٥٧٩٨٦٠متر شامل لوله هاي آهني با قطرهاي ٦٠٠، ٧٠٠و ٨٠٠ميليمتر و لوله هاي آزبست و چدن با قطرهاي ٨٠، ١٠٠، ١٥٠، ٢٠٠، ٢٥٠، ٣٠٠و ٤٠٠ميليمتر است . نصب و اجراي لوله هاي شبکه در اين ناحيه عموماً از سال ١٣٦٠شروع شده است . بر اساس آمار ثبت شده اين ناحيه داراي بيشترين نرخ شکست بوده که اکثريت آن هم مربوط به لوله هاي آزبست سيماني مي باشد و براي لوله هاي آهني و چدني اطلاعات کافي جهت ساخت مدل پيش بيني نرخ شکست وجود نداشته ، لذا از اين ناحيه فقط اطلاعات مربوط به لوله هاي آزبست سيمان مورد استفاده قرار گرفته است [١٠].

٤- متدولوژي
در اين تحقيق ساخت مدل ماشين بردار پشتيبان در محيط نرم افزار ٧.٦.٠.٣٢٤ Version)MATLAB ((Ra٢٠٠٨)صورت پذيرفته و آناليز و محاسبات مربوط به ماشين بردار پشتيبان نيز با استفاده از نرم افزار LIBSVM انجام شده است . اين نرم افزار توسط [٢٢]ارائه شده است . براي ساخت مدل KNN نيزدر محيط برنامه نويسي فرترن کدنويسي شده است . ورودي هاي مدل پيش بيني نرخ شکست شامل قطر لوله ، طول ، سن ، عمق نصب لوله و فشار هيدروليکي متوسط بوده و خروجي آن نيز نرخ شکست لوله هاي شبکه توزيع آب (P.B.R) مي باشد.جهت نرمال سازي داده هاي ورودي و خروجي مدل از رابطه ذيل استفاده شده است .

که در آن xمقدار غير نرمال ، xn مقدار نرمال شده ، xmax و xmin به ترتيب بيشترين و کمترين مقدار مربوط به متغير مي - باشند. با استفاده از اين رابطه مقادير متغير xدر بازه [٠.١,٠.٩]قرار خواهد گرفت [٢٣].
معيارهاي ارزيابي در نظر گرفته شده در اين تحقيق عبارتند از ميانگين در صد خطاي مطلق (MAPE)، جذر ميانگين مجذورات خطاي نرمال (NRMSE) و ضريب تعيين R2 که به صورت زير نوشته مي شوند [٢٤].

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید