بخشی از مقاله
چکیده
این تحقیق با شبکه های عصبی برگشتی جزئی - با ارجاع جزئی - و کاربردهای آن ها برای مدل سازی با رگرسیون خودکار غیرخطی سیستم های پویا سروکار دارد. این نوع خاص از شبکه عصبی میتواند به عنوان یک مدل داده محور در فضای حالت مورد توجه قرار گیرد که در آن از یک مدل شبکه عصبی استاندارد برای توضیح تابع تبدیل غیرخطی استفاده شده است؛ بنابراین هر پاسخ دارای همان فرم عمومی مکانیسم انتشار زمان است که در مدلهای مفهومی پویا و مدلهای جعبه سیاه خطی مدل ARMAX دیده میشوند. در این تحقیق، پیشزمینه نظری در مورد شبکه های عصبی برگشتی جزئی همراه با کاربرد آن در شبیه سازی تعادل آب مخزن سد زاینده رود در استان اصفهان در کشور ایران که نشاندهنده ارتباط عملی این ابزارها برای مدلسازی سیستمهای آبی پویا میباشد، ارائه شده است.
.1 مقدمه
در بخش های متعدد مربوط به استفاده از علم و فناوری، گرایش روزافزونی به سمت استفاده از شبکه های عصبی مصنوعی - NN - برای مدل سازی غیرخطی، کنترل، بهینه سازی، طراحی، تحلیل داده و طبقه بندی مشاهده شده است.
NN در بسیاری از موارد برای شناسایی روابط ورودی – خروجی استفاده میشوند و مفاهیم چند لایه - MLP - یا شبکههای تابعی شعاعی - RBFN - دو نمونه بسیار متداول از ابزارهای مورد استفاده در مطالعات میباشند
مدل سازی داده محور که شامل NN هم می باشد، اغلب زمانی مورد استفاده قرار می گیرد که در یک سیستم یا شناخت فرایندی که مانع از توسعه مدلهای مفهومی میشوند، وجود نداشته باشد. مدلسازی مفهومی مستلزم توضیح سیستم و اصول فیزیکی است که بایستی فرموله و سنجیده شوند. شیوه جعبه سیاه، همراه با میزان مناسبی از تقویت، میتواند راه حل مؤثر و انعطاف پذیرتری همراه با صرفهجویی هایی در زمان و هزینه انجام برای تعریف و تصحیح اطلاعات باشد، به این معنا که برای ایجاد یک مدل مفهومی به آن نیاز است.
NN می تواند به عنوان بخشی از مدل مفهومی یا برای ایجاد یک راه حل جایگزین مورد استفاده قرار گیرد. NN هم چنین می تواند تکنیک جذابی را برای کپیبرداری از مدلهای مفهومی ارائه کند، زیرا چنین ابزارهایی، پردازش دیجیتال را با سرعت های محاسباتی بالاتری انجام میدهند. نمونهسازها اولاً - - وقتی که بنا به دلایلی تعداد زیادی از ارزیابیهای مدل باید انجام شود، مثلاً برای انجام تحلیل حساسیت و نامعینی، ارزیابی وضعیت، ارزیابی ریسک، بهینهسازی، یا مدلسازی معکوس یاثانیاً - - زمانی که اجرای مدل سیگنال باید خیلی سریع باشد، مثلاً برای انجام ارزیابی سریع، پشتیبانی در تصمیم گیری، پیش بینی بلادرنگ، یا مدیریت عملیاتی و کنترل- احساس خوبی را ایجاد میکنند
انعطاف پذیری، اثربخشی و ظرفیت شبیهسازی مدلهای داده محور به طور خاص مربوط به حوزههای آبشناسی، هواشناسی و هیدرولیک است. با این وجود، در این موارد، یک موضوع مهم در مدل سازی، نیاز به سروکار داشتن با سیستم های پویا و فرایندهایی است که میتوانند در طی زمان مورد استفاده قرار گیرند. این موجب یک محدودیت جدی برای استاندارد NN می شود – این مدل ها استاتیک بوده و هیچ مکانیسم تلویحی برای گسترش زمان یا تسهیل »حافظه سیستم« در رابطه با حالت ها و رویدادهای قبلی وجود ندارد. در واقع در آموزش شبکه و عملیات اجرایی آن الگوهای ورودی – خروجی به شیوه های متفاوت مورد پردازش قرار میگیرند، به نحوی که پاسخ مدلسازی به الگوهای قبلی تأثیر مستقیمی بر روی پاسخ مدل سازی به الگوهای فعلی ورودی ندارد.
مجموعه داده های ورودی – خروجی باید از قبل در دسترس بوده و ترتیب ارائه الگوها اهمیتی ندارد، هر چند ترتیب تصادفی ترجیح داده شده است. این وضعیت هم چنین به شیوه های رگرسیون خطی و غیرخطی و تکنیک های درونیابی که در آنها منحنیها یا چند برابر کنندهها در درون مجموعه مشخصی از نقاط داده، قرار میگیرند، اعمال میشود؛ بنابراین NN استاندارد در واقع چیزی بیش از تقریبهای تابع عمومی بوده و شکلی از یک مجموعه تکنیکهای رگرسیون تعمیمیافته میباشد.
چنین ابزارهایی مدلهای استاتیکی رگرسیون غیرخطی است که هیچ موردی از زمان، رویدادهای گذشته، ارزیابی زمانی و یا تعامل ورودی – خروجی که باید بین الگوهای متفاوت یا ترتیبی موارد ورودی- خروجی رخ دهند را در نظر نمیگیرند. در این تحقیق مکانیسم فضای حالت مدل های پویا به محیط مدل سازی عصبی بسط داده شده تا مدلهای داده محوری که برای مدلسازی غیرخطی و تحلیل سیستم های پویا و داده های سری زمانی مناسب تر هستند، به دست آیند. این نتایج تعمیم منجر به ایجاد شبکههای عصبی با ارجاع بخشی - PRNN - شده است. چنین مدل هایی به یک مکانیسم گسترش زمان مجهز هستند که شامل بازخوردی از خروجیهای محاسبهشده در برابر خروجیهای مشاهدهشده میباشد.
.2 مواد و روش
.1-2 شبکههای عصبی برگشتی جزئی
NN با اتصالات بازخوردی موضوع تازه ای نبوده و میتوانند به صورت »شبکههای برگشتی« یا »شبکههای برگشتی جزئی« نام گذاری شوند؛ شبکه های برگشتی اتصال کامل بین هر نود و تمامی نودها را در شبکه به نمایش می گذارند، درحالیکه شبکه های برگشتی جزئی شامل تعداد محدودی از حلقههای بازخوردی مشخصشده میباشند. از واژه »شبکههای توری منظم« نیز زمانی استفاده می شود که نودهای منبع ورودی های خارجی منبع را نیز شامل شوند. - 1994 - Haykin نکته جالب در این شبکه ها را سروکار داشتن با ورودی ها و خروجی های متغیر با زمان ذکر کرده است؛ شبکههای برگشتی یا ترتیبی نیز توسط Hertz و همکارانش - 1989 - مورد توجه قرار گرفتند که آن ها را به دلیل یک مرحله بازخورد تأخیری در خروجیها، شبکههای Jordan نامگذاری کردند.
هم چنین باید خاطرنشان شود که نویسنده ترجیح می دهد از عبارت »شبکه های عصبی با رگرسیون خودکار« استفاده کند. این نام گذاری به حفظ - تا حد امکان - واژه های متداول و معانی که در تئوری سیستم، مدلهای مفهومی و تحلیلهای سری زمانی استفاده می شود، کمک میکند. شیوههای داده محور که شامل تمامی انواع شبیهسازی رگرسیون، زیرمجموعه کوچکی از طیف کلی شبیه سازیاز–یک شیوه کاملاً مفهومی تا یک شیوه کاملاً داده محور - را ایجاد میکنند که محاسبه عصبی داده محور را به صورت جعبهابزاری از تکنیکهای متمایز که ملاحظات تخصصی را متنوع میکنند، در نظر گرفته نشده است. از این دیدگاه نام شبکه عصبی با رگرسیون خودکار، شاید تأکید بیشتری باشد بر تعمیم غیرخطی مدل های میانگین حرکتی با رگرسیون خودکار خطی که ابزارهای متداولی در تحلیل سریهای زمانی همانند ARMA و ARMAX میباشند.
.2-2 کالیبراسیون PRNN با استفاده از شبیهسازی الحاقی
PRNN تلفیقی از یک NN استاندارد است که در هر فاصله زمانی اعمال شده و با استفاده از ارجاع، یک رشته موقتی از تغییرات در حالت مدل در طی زمان ایجاد می کند. با این وجود به دلیل بروز بازخورد در یک یا چند مرحله، استفاده از شیوه های متداول آموزش مبتنی بر انتشار به عقب، خطا باید به گونهای اصلاح شود تا یک تعمیم مناسب به دست آید. شیوه الحاقی که برای کالیبراسیون مدل های کاملاً پویا در مقیاس بزرگ استفاده می شوند برای این کار بسیار مناسب هستند. کالیبراسیون پیشرفته یا شیوههای یکسانسازی دادهها که برای مدلهای کاملاً عددی ساخته و اعمال شدهاند، میتوانند برای PRNN نیز استفاده شوند زیرا ابزار آخری، برداشتی مستقیم از ساختار عمومی شیوههای مدلسازی اولیه بوده است.
به طور کلی کالیبراسیون مدل و به خصوص آموزش NN شامل تعریف تابع هزینه یا یک معیار مناسب بودن است که برای ارزیابی میزان پذیرشی - عدم پذیرش - که بین پیشبینیهای مدل و مشاهدات واقعی رخ میدهد، استفاده میشود. این تابع هزینه بایستی با توجه به متغیرهای کنترل، حداقل شود. متغیرهای کنترل در بیشتر موارد ترکیبی از مجهولات در پارامترهای مدل، در شرایط اولیه، یا در عوامل خارجی است. در مورد مسایل حداقل سازی در مقیاس بزرگ، تکنیک های کاهش گرادیان یک راه حل عملی را ارائه می کنند که نشان می دهند جداسازی چنین گرادیان هایی چندان سخت و زمان بر نمیباشد. تکنیکهای مؤثر در کاهش گرادیان شامل شیوههای ترکیب گرادیان و شبه نیوتن است
برای ایجاد برآوردی از گرادیان در هر مرحله از فرایند کالیبراسیون ابزارهای متعددی در دسترس است؛ یکی از مهم ترین و مؤثرترین آن ها شبیه سازی الحاقی است. در این شیوه گرادیان مورد نظر از نتایج اجرای دو مدل که در تعداد متغیرهای کنترل مستقل از هم هستند، استفاده میشود. اولین اقدام شامل گسترش یک مدل »اصلی« در فواصل زمانی است درحالیکه دومین مرحله شامل ایجاد آن چه که »راه حل الحاقی« نامیده میشود، است. هدف از مدل دوم ایجاد یک مدل تانژانتی از راه حل اصلی است؛ بنابراین معادل با سیستم خطی پویایی است که دارای ابعاد فضایی و موقتی مشابه با مدل اصلی میباشد.
با این وجود در مقایسه با مدل اصلی، راه حل الحاقی باید با توجه به زمان گذشته حل شود. گرادیان تابع هزینه، به صورت حالت ها و نتایج پیش بینی شده مدل اصلی بیان شده است که همراه با حالت های مدل الحاقی، یک مجموعه کامل از مشتقات تحلیلی که برخلاف یک تقریب ناقص عددی است را ایجاد میکنند.
در نتیجه هر گرادیان، همراه با گرادیان های قبلی محاسبه شده در خلال تکرارهای اولیه، برای ایجاد ورودیهایی برای عملیات کاهش گرادیان استفاده شده و یک مقدار به روز شده را برای پارامترهای مجهول به دست میدهند و در ادامه عملکرد بهتری را برای مدل به همراه خواهند داشت؛ بنابراین مدل الحاقی بیش از یک بار اعمال شده و روند به روز رسانی آن قدر تکرار میشود تا این که تابع هزینه حداقل شده و پارامترها بعد از هر بار حرکت به جلوی - مدل - و برگشت به عقب - الحاقی - و نه در فواصل زمانی مجزا به صورت گروهی به روز شوند.
.3-2 یکسانسازی آنلاین یا ترتیب دادهها برای مدلهای PRNN
از امکانات یکسان سازی داده ها اغلب برای بهبود عملکرد مدل های مفهومی پویا - قطعی - استفاده شده است. فرایند وارد نمودن داده، نشاندهنده شکل سادهای از یکسانسازی ترتیبی آنلاین است. با این وجود در یک محیط پویا، این نکته نیز اهمیت دارد که هر مدل میتواند با تغییر شرایط انطباق پیدا کرده و به این ترتیب مهارت یا قدرت خود را بهبود بخشیده و افق های زمانی پیش بینی را کوتاه یا متوسط نماید.