بخشی از مقاله
خلاصه
تخمين آبشستگي در پايين دست سرريزها يكي از مسائل مهم مهندسي هيدروليك ميباشد. در اين مطالعه با كاربرد شبكه عصبي مصنوعي،درختان رگرسيون و دسته بندي ،الگوريتم M5 و يك مدل تركيبي و با استفاده از دادههاي ميداني، پيشبيني عمق آبشستگي در پايين دست اين نوع سرريزها انجام شده است. نتايج نشان داد كه مدل تركيبي ارائه شده در مقايسه با ديگر مدلها دقت بيشتري در پيشبيني عمق آبشستگي دارد.
١. مقدمه
سرريزها در ساختمان يك سد به منظور تخليه آب مازاد بر ظرفيت مخزن سد در مواقع سيلابي ساخته ميشوند. از سرريزهايي كه عمدتا در بدنه سدها به كاربرده ميشوند، ميتوان به سرريزهاي ريزشي آزاد و جاميشكل اشاره كرد. در سرريزهاي شوت منتهي به پرتاب كننده جامي١ جريان به صورت آزاد در هوا تخليه شده و جت آب به صورت مايل وبا سرعت زياد به نقطه اي در پايين دست بستر رودخانه برخورد ميكند. اگر تنش برشي اعمال شده توسط اين جت آبي، بيشتر از تنش برشي بحراني رسوبات بستر باشد، منجر به جابجايي رسوبات به سمت پايين دست شده، كه در نتيجه باعث ايجاد گودال آبشستگي ميگردد، كه به طرق زير ممكن است براي سد ايجاد خطر نمايد.
الف - به خطر انداختن پايداري بخشي يا كل سازه به علت فرسايش بستر رودخانه و خالي شدن زير پي. ب - تهديد پايداري شيب كانالها و كف رودخانه در پايين دست سد. از اينرو پيش بيني ميزان آبشستگي ايجاد شده يكي از مسايل مهم براي مهندسان هيدروليك است. از آنجا كه اين پديده تابع عوامل مختلفي نظير : مكانيسم انتقال رسوب، مشخصات جريان و ... مي باشد، تخمين دقيق عمق آبشستگي عملا كار دشواري است.
از اينرو محققين بسياري به ارائه روابطي تجربي براي محاسبه عمق آبشستگي پرداخته اند، به عنوان مثالمي توان به : Franke ,Martins ,Wu ,Veronese ,kotlus ,Sofrelec ، Incyth و ]...١[ اشاره كرد. روابط ارائه شده توسط اين محققين قادرند عمق آبشستگي را پيش بيني كنند كه ممكن است در موادي به طور قابل توجهي با مقادير واقعي تفاوت داشته باشد، و هنوز هم نمي توان ادعا كرد كه يك رابطه خاص شناخته شده ميتواند نتايج بهتري را نسبت به ديگر روابط ارائه دهد. بخشي از اين مشكل به خاطر پيچيدگي خود پديده و بخشي ديگر به دليل محدوديت هاي ابزار تحليلي رگرسيوني مي باشد.
در سالهاي اخير همزمان با افزايش سرعت پردازش كامپيوترها و بالا رفتن قابليت محاسباتي آنها استفاده از مدلهاي شبيه سازي هوشمند به عنوان روش هاي جايگزين براي روابط سنتي و تجربي موجود براي مدلسازي پديده هاي فيزيكي پيچيده رواج بيشتري يافته است. از جمله ميتوان استفاده از ابزارهاي محاسباتي نرم همچون شبكههاي عصبي را نام برد، كه ابزار كارآمدي براي تخمين عمق آبشستگي بوده ونتايج نسبتا خوبي را ارايه كرده است. ] ٢-٤ درختان تصميمگيري يكي از روشهاي نسبتا جديدي است، كه در سالهاي اخير استفاده از آنها رشد چشمگيري داشته است، كه قادرند در فرآيند آموزش خود توليد يكسري قوانين نمايند. در اين مطالعه از دو الگوريتم CART و M5 درخت تصميمگيري براي پيشبيني عمق نهايي آبشستگي در پايين دست سرريز جامي شكل استفاده شده است.
٢. درختهاي تصميم گيري
درختانتصميم١ از متداولترين روش منطقي طبقه بندي مي باشند كه در دو دهه اخير توسعه زيادي يافتهاند. تعداد زيادي از الگوريتمهاي استقرايي درخت تصميم وجود دارند كه عمدتا در مراجع يادگيري ماشيني ]٥[ تشريح شدهاند. از جمله آنها مي توان به الگوريتم ID3،C4.5 ،M5 وCART اشاره كرد؛كه از ابزارهاي مناسب و قدرتمند جهت پيشبيني ودستهبندي ميباشند. دراين الگوريتم ها با روشهاي جستجويي، كه بر پايه رشد و هرس ساختارهاي درختي مي باشد، براي اكتشاف دانش از فضاي نمونه بكار گرفته ميشوند .
يك صفت براي تقسيم اين نمونهها انتخاب ميشود، براي هر مقدار از صفت يك شاخه ايجاد شده و زيرمجموعهاي از نمونهها كه مقدار آن صفتشان توسط شاخه مشخص شده، به طرف گره تازه ايجاد شده حركت كرده تا در يك كلاس قرار گيرند. در واقع ميتوان گفت كه يك درخت تصميم شامل گرههايي است كه صفات، را مورد آزمون قرار داده و شاخه هاي خروجي هر گره نيز متناسب با تمام نتايج ممكن آزمون آن گره خواهند بود. يك درخت تصميم ساده براي طبقهبندي نمونههايي با دوصفت ورودي X و Y در شكل ١ ارئه شده است.
٣. الگوريتم CART
يكي از روشهاي انجام درخت تصميمگيري كه براي پيشبيني مقادير حقيقي استفاده ميشود، الگوريتم٢CART ميباشد، كه منجر به توليد درختان رگرسيوني مي شود. تفاوت عمده درختان رگرسيوني با M5 در اين است كه برگهاي يك درخت رگرسيوني به جاي مدلهاي خطي مقادير عددي را در خود جاي مي دهند. همچنين، درختان رگرسيوني در برابر متغيرهاي غير مؤثر بسيار مقاوم بوده و زيرمجموعه مناسبي از متغيرهاي معرفي شده به مدل را در پيشبيني بكار ميبرند.
عموما الگوريتمهاي درختي، ساختار تقريبا مشابهي دارند و هدف همه آنها بدست آوردن درختي با كيفيت بالا و نرخ خطاي كم براي دستهبندي دادهها ميباشد و بيشتر تفاوتها در شيوه شاخه زدن و برش شاخهها مي باشد. نتايج CART به صورت يك درخت مرتبهاي دودويي بودهكه فضاي مساله را به قسمتهاي جز تقسيم ميكند. روش CART شاخههاي خود را بصورت دو تايي و تنها بر اساس يك فيلد - متغير مستقل - ايجاد ميكند، يعني هر گروه غير برگ آن، به دو گروه ديگر تفكيك مي شود.يك گره بر اساس جوابهاي بله يا خير درباره مقادير پيشبيني كننده بر اساس يك متغير منفرد به دو گروه ديگر تفكيك ميشود.
بعضي متغيرها ممكن است به دفعات استفاده شوند و در مقابل بعضي ديگر ممكن است، كه اصلا به كار نروند. در مرحله بعد هم دو شاخه وجود دارد كه هركدام داراي يكسري ركورد مي باشند - هر يك از ركوردهاي گره بالاتر در يكي از شاخهها قرار گرفته است - حال براي هر شاخه مثل قبل عمل ميشود يعني براي هر يك از آنها مجددا يك صفت به گونهاي انتخاب ميشود، كه بتواند بهترين شاخههاي جديد را ايجاد نمايد.
٤. الگوريتم M5
يك مسئله مدل سازي چند متغيره را ميتوان با تقسيم آن به چند زير مسئله كوچكتر و تركيب نتايج آن راحتترتحليل كرد. اين ايده براي ساخت الگوريتم M5 انجام شده است، به اين صورت كه فضاي مسئله به زير فضاهايي تقسيم شده و براي هر زير فضا يك مدل رگرسيون خطي چند متغيره برازش داده ميشود، در واقع با اين روش يك مجموعه از مدلها خواهيم داشت، كه هر كدام فقط براي يك قسمت از فضاي مسئله كابرد دارند.
اين الگوريتم جداسازيهاي ممكن را در فضاي چند متغيره انجام داده و به صورت اتوماتيك مدلهايي براي اين فضاها ميسازد در نتيجه يك درخت مرتبهاي با جداسازي قوانين در گرههاي داخلي، و خروجي آن در برگها خواهيم ساخت. الگوريتم M5 براي آموزش مدلهاي پيشبيني مقادير عددي بكار رفته ولي برگهاي آن بر خلاف درختان رگرسيوني CART كه شامل مقادير عددي هستند، حاوي مدلهاي خطي چند متغيري مي باشند و از اين ديدگاه، مي توان مدل درختي M5 را متشابه با توابع خطي چندضابطهاي دانست. در مقايسه با درختان رگرسيوني مانند CART، عموما M5 در يك كاربرد مشخص، كوچكتر، قابل فهم تر و از كارايي بالاتري برخوردار است.
در اين الگوريتم براي ايجاد شاخه در يك گره تقسيم از پارامتر انحراف معيار مقادير متغير هدف استفاده شده، و آزموني براي انجام عمليات تقسيم در گره مذكور برگزيده ميشود كه موجب كاهش بيشتر انحراف معيار گردد.كاهش انحراف معيار با استفاده از رابطه زير محاسبه ميشود. در رابطه فوق T شامل نمونههايي است كه به گره رسيدهاند و Ti ها مجموعههايي هستند كه از تقسيم كردن گره براساس صفت انتخابي به دست آمده اند. sd نيز انحراف معيار است.
اين عمل تا زماني كه مقدار متغير هدف تمام نمونههاي يك گره تفاوت كمي داشته يا اين كه گره حاوي تعداد اندكي از نمونه هاي آموزشي باشد، ادامه خواهد يافت. سپس براي نمونههاي موجود درهرگره داخلي ، يك مدل رگرسيون خطي چندمتغيري برازش داده مي شود. اين مدل، براساس دادههاي وابسته به آن گره و تمام صفاتي كه در زيردرخت با ريشه آن گره مورد استفاده قرار گرفتهاند، ايجاد ميشود.درمرحله بعد با شروع از پائين درخت، هر گره غير برگ مورد بررسي قرار گرفته و خطاي مدل خطي سادهشده آن با خطاي زيردرخت حاصل از گره مقايسه مي شود.
در صورتي كه خطاي مدل خطي گره كمتر باشد، زيردرخت مذكور هرس شده و گره ريشه آن با يك برگ جايگزين ميگردد. بعد از اين مرحله يكسري شكستگي - ناپيوستگي - بين مدلهاي خطي مجاور در برگهاي درخت هرس شده، ايجاد شده و يكپارچگي سيستم را از بين مي برد، در فرايند هموارسازي كه براي همواركردن و از بين بردن اين نقاط شكستگي است ابتدا خروجي محاسبه شده، و مقادير به صورت بازگشتي از برگ به ريشه هموار وبرميگردند، يعني هر مقدار در هر گره با تركيب مقدار پيشبيني شده توسط مدل و مقدار پيشبيني شده در آن گره هموار شده به ريشه درخت حركت ميكند.