بخشی از مقاله
خلاصه
تخمين آبشستگي در پايين دست سرريزها يكي از مسائل مهم مهندسي هيدروليك ميباشد. در اين مطالعه با كاربرد شبكه افزايشي درختهاي رگرسيوني، و رگرسيون تطبيقي چند متغيره توابع اسپلاين و فرمولهاي تجربي وو، ورونزه- B، سوفرلك ، اينس و با استفاده از دادههاي بابعد آزمايشگاهي سرريز جام پرتابي، عمق آبشستگي در پايين دست اين نوع سرريزها تخمين زده شده است. در بين فرمولهاي تجربي، رابطه وو، بالاترين دقت را داشته، ودر نهايت شاخصهاي آماري نشان داد كه مدل رگرسيون تطبيقي چند متغيره توابع اسپلاين با بالاترين ضريب همبستگي - R=0.967 - بهترين عملكرد را در بين مدلهاي ارائه شده در تحقيق حاضر دارد.
١. مقدمه
بحث آبشستگي هر چند قدمت طولاني درعلم هيدروليك دارد، اما به دليل پيچيدگيهاي خاص و متغيرهاي زيادي كه در آن دخيلند، بررسي توام آنها به سادگي ميسر نميباشد. از اين رومحققين بسياري به ارائه روابطي تجربي براي محاسبه عمق آبشستگي پرداخته اند، به عنوان مثال ميتوان به : وو١ سوفرلك٢، ورونزه٣، اينس٤ و ]...١[ اشاره كرد؛ كه روابط ارائه شده توسط اين محققين براي محدوده خاصي از دادهها پاسخگو ميباش ند؛ و هنوز هم نمي توان ادعا كرد كه يك رابطه خاص شناخته شده ميتواند نتايج بهتري را نسبت به ديگر روابط ارائه دهد.
در سالهاي اخير همزمان با افزايش سرعت پردازش كامپيوترها و بالا رفتن قابليت محاسباتي آنها استفاده از مدلهاي شبيه سازي هوشمندبه عنوان روش هاي جايگزين براي روابط سنتي و تجربي موجود براي مدلسازي پديدههاي فيزيكي پيچيده رواج بيشتري يافته است. در اين تحقيق از دو مدل شبكه افزايشي درختهاي رگرسيوني و رگرسيون تطبيقي چند متغيره توابع اسپلاين كه اخيرا معرفي شده براي تخمين عمق نهايي آبشستگي در پايين دست سرريز جام پرتابي استفاده شده است؛ و با برخي از روابط تجربي معروف نيز مقايسه شده است.
٢. مدل شبكه افزايشي درختهاي رگرسيوني
مدل شبكه افزايشي درختهاي رگرسيوني٥ كه به شبكه درختي١ هم مشهور است يك ابزار جديد داده كاوي است كه توسط فردمن٢ ]٢[ در دانشگاه1 استنفورد معرفي شد. اخيرا اين مدل به عنوان يك پيشرفت جديد در دادهكاوي و براي توسعه و بهبود مدل درختان رگرسيوني٣ با كاربرد تكنيك گردايان تقويتكننده٤ براي آموزش يك درخت رگرسيوني يا طبقه بندي به طور موفقيت آميزي در حوزه هايي از قبيل كشف كلاهبرداري ، امراض شناسي ،بيمه و علوم پزشكي و زيستي به كار رفته است.از ويژگيهاي برجسته اين مدل مي توان به موارد زير اشاره كرد:
١ - انتخاب خودكار متغيرهاي زيرمجموعه دادهها
٢ – توانايي به كاربردن دادهها بدون پيشپردازش
٣ – مقاومت در برابر دادههاي نادرست.
٣. مدل رگرسيون تطبيقي چند متغيره توابع اسپلاين
رگرسيون تطبيقي چند متغيره توابع اسپلاين٥ تكنيك دادهكاوي نسبتا جديدي ميباشد، كه رگرسيونهاي خطي ساده را تركيب ميكند . تاكنون از اين روش در تحليل اقتصادي مديريتمالي، پيشبيني حركت آفتكشها در خاك، پيشبيني رونآب،استفاده شده ونتايج موفقي را ارايه كرده استبرخي. مطالعات نيز نشان داده كه اين مدل نتايج قابل رقابت يا حتي بهتري نسبت به شبكه عصبي مصنوعي دارد. ]٤[ مدل MARS بهوسيله تقسيم فضايج واب به بازه هايي از متغير هاي پيشبيني كننده - ورودي - وبرازش يك اسپلاين٦ - تابع پايه - در هر بازه مدلهاي رگرسيوني انعطافپذيري را براي پيشبيني متغير هدف ايجاد مينمايد.توابع پايه نشان دهنده اطلاعاتي در بردارنده يك يا چند متغير مستقل ميباشند.
در اولين گام MARS مقدار متغير هدف را با يك مقدار ثابت تخمين ميزند . - Y=a - سپس در مسيري رو به جلو با جستجو در ميان زوج هاي - متغير،گره - بهترين برازش را ايجاد مي نمايد. فرآيند جستجو تا زماني كه تمامي توابع پايه ممكن به مدل اضافه شوند، ادامه مييابد. در اين مرحله مدلي بسيار پيچيده ، بيش برازش شده و با تعدادگرههاي زيادي به دست ميآيد. در گام بعد،با يك فرآيند هرس كننده رو به عقب بر اساس مدل ايجاد شده، توابع پايه اي كه اهميت كمتري دارند را شناسايي كرده و حذف ميكند.اين فرآيند تا بررسي كامل همه توابع پايه ادامه مييابد و در پايان يك مدل بهينه با شمارههاي متفاوت توابع پايه منتخب حاصل خواهد شد.
٤. تكنيك 10-fold cross-validation
اين تكنيك از روشهاي رايج براي ارزيابي الگوريتمهاي يادگيري پايگاه داده است، كه براي ارزيابي توانايي عمومي مدل پيش بيني كننده استفاده ميشود.اين روش مجموعه دادهها را به طور تصادفي به ١٠ قسمت مساوي كه Fold ناميده مي شود تقسيم ميكند، وبراي ساخت مدل از ٩ قسمت دادهها براي آموزش و از يك قسمت باقيمانده كه براي ساخت مدل استفاده نشده، براي تست مدل استفاده مي كند. اين شيوه ساخت و تست مدل ١٠ بار تكرارشده ودرهربار داده هاي آموزش وتست تغيير مي كند، تا هر ١٠ گروه به عنوان گروه تست به كار روند.