بخشی از مقاله
چکیده
در این مقاله، اصلاح یک الگوریتم الهام گرفته از طبیعت بر اساس رفتار ذرات براي بهینه سازي کنترلکنندههاي فازي ارائه میگردد. PSO یک تکنیک فوق ابتکاري با الهام از رفتار ذرات در طبیعت است، که می تواند براي حل مسائل بهینه سازي استفاده شود. بنابراین در ابتدا، PSO کلاسیک با بهینه سازي کنترلکنندههاي فازي آزمایش شده است. سپس، اصلاح روش اصلی با گنجاندن یک یادگیر تقویتی به منظور تغییر پویاي مقادیر پارامتر اصلی الگوریتم حین اجرا ارائه شده است. در انتها نیز، اصلاح پیشنهادي الگوریتم PSO با رویکرد فازي براي بهینه سازي مشکلات کنترل محکزنی استفاده شده است. مقایسه نتایج نشان میدهد که روش PSO پیشنهادي- فازي بهتر از PSO کلاسیک در طراحی بهینه کنترلکنندههاي فازي عمل میکند.
.1 مقدمه
در مسائل بهینه سازي، هدف اصلی این است که بهترینجا یگزین در میان مجموعهاي از راهحلها يممکن را یافت. در برخی از موارد، فضاي راهحل براي مشکلات بیش از حد بزرگ است و میتواند باعث شود که زمان یافتن بهترین راهحل، بسیار زیاد باشد. از سو ي دگر،ی حوزه هاي مختلف هوش محاسباتی وجود دارد که مجموعه روش هایی را براي حل مسائل جستجو و بهینه سازي ارائه می کند .[1,2,3] این روش ها می تواند نتایج بسیار رقابتی تولید کند، اما نه بهتر ین راهحل ها را. علاوه بر این، با استفاده از الگور یتمها ي ابتکاري، روشها ي جایگزین وجود دارد، اما یافتن بهترین حلراه را تضم یننم یکند، هرچند آنها می توانند یک راهحل خوب را در مدت زمان معقولی پیدا کنند.
مطالعات بسیاري دربارة الگوریتمهاي جستجو و بهینه سازي وجود دارد که به مسائل فراوانی اعمال شده اند. براي مثال: در [4] یک الگوریتم کلونی زنبور عسل مصنوعی - شع - 0 میزانسازي قانون پایه مطلوب یک پایدارکننده سیستم قدرت فازي - ؛؛غک - ارائه شده است، که به نوسان فرکانس پایین میرایی پس از اختلال سیستمهاي قدرت منجر می شود.
در [5] بهینه سازي طراحی کنترل کننده فازي نوع 1 و نوع 2 براي مخزن آب با استفاده از روش بهینه سازي کلونی زنبور عسل ارائه شده است. در [6] طراحی یک کنترل کننده ًمغ منطقی قابل فازي بهینه با استفاده از بهینه سازي کلونی زنبور عسل براي کنترل فرکانس در یک سیستم دیزل باد جداشده ارائه شده است.
در [7] طراحی کنترل ًمغ منطقی مبتنی بر فازي بهینه سازي کلنی زنبور عسل الکترولایزر براي پایداري ریزشبکه ارائه شده است. در [8] یک کنترل کننده فرکانس بار فازي بهینه با توابع عضویت خودکار تنظیم شده همزمان و قواعد کنترل فازي ارائه شده است. در [9] بهینه سازي طراحی کنترلکنندههاي فازي با استفاده از الگوریتم کلونی زنبور عسل ارائه شده و الگوریتم فشع براي بهینه سازي پارامترهاي توابع عضویت یک کنترل کننده منطق فازي استفاده شده است.
.2 الگوریتم PSO
الگوریتم PSO یک الگوریتم جستجوي اجتماعی است که از روي رفتار اجتماعی دسته هاي پرندگان مدل شده است. در ابتدا این الگوریتم به منظور کشف الگوهاي حاکم بر پرواز همزمان پرندگان و تغییر ناگهانی مسیر آنها و تغییر شکل بهینه ي دسته به کار گرفته شد. درPSO ، particle ها در فضاي جستجو جاري میشوند. تغییر مکانparticle ها در فضاي جستجو تحت تأثیر تجربه و دانش خودشان و همسایگانشان است. بنابراین موقعیت دیگرparticle هاي Swarm روي چگونگی جستجوي یک particleاثر میگذارد .نتیجهي مدلسازي این رفتار اجتماعی فرایند جستجویی است که particle ها به سمت نواحی موفق میل میکنند.
Particle ها در Swarm از یکدیگر میآموزند و بر مبناي دانش بدست آمده به سمت بهترین همسایگان خود میروند. اساس کار PSO بر این اصل استوار است که در هر لحظه هر particle مکان خود را در فضاي جستجو با توجه به بهترین مکانی که تاکنون در آن قرار گرفته است و بهترین مکانی که در کل همسایگیاش وجود دارد، تنظیم میکند. . هر ذره یک مقدارشا یستگی دارد که توسط یک تابع شا ي ستگی محاسبهمیشود. هر چه ذره در فضا ي جستجو به هدف - غذا در مدل حرکت پرندگان- نزدکتر باشد، شا یستگی بیشتري دارد . همچنین هر ذره داراي یک سرعت است که هدا یت حرکت ذره را بر عهده دارد
. هرذره با دنبال کردن ذرات بهینه در حالت فعلی، به حرکت خود در فضاي مساله ادامه میدهد. به این شکل است که گروهی از ذرات PSO آغاز کار به صورت تصادفی به وجود می آیند و با به روز کردن نسلها سعی در یافتن راه حل بهینه مینمایند.
در هر گام، هر ذره با استفاده از دو بهترین مقدار به روز میشود. اولین مورد، بهترین موقعیتی است که تا کنون ذره موفق به رسیدن به آن شده است . موقعیت مذکورشناخته و نگهدار ي میشود. بهترین مقدار دیگري که pbest با نام توسط الگوریتم مورد استفاده قرار م یگیرد، بهترین موقعیتی است که تا کنون توسط جمعیت ذرات بدست آمده است.این موقعیت با gbest نمایش داده می شود.پ س از یافتن بهترین مقادیر، سرعت و مکان هر ذره به روز آوري می گردد.
.3 الگوریتم پیشنهادي
.A مدل پیشنهادي
مدل پیشنهادي RLMSPO، RL را در عملکردهاي PSOممتیک مشارکت میدهد. توضیحات تفضیلی به شرح ذیل است:.
اجزاء به عنوان عاملین RL فعالیت می کنند. حالات نشان دهندة عملکرد فعلی هر ذره است: استخراج، تبدیل، جهش بلند، جهش کوتاه یا تنظیم. این عمل مربوط به حالتی است که از حالتی به دیگري تغییر رخ می دهد
RL عملکرد هر ذره را در PSO نشان می دهد. به طور خاص، RL یک ذره را از یک عملکرد - حالت - به حالت دیگري وفق می دهد که این بر طبق دستیافته آن ذره است. پاداش هاي مثبت به ذره هایی داده می شود که خوب عمل کرده اند و پاداش هاي منفی - جریمه - براي ذرات غیر عملکردي است.
در یک الگوریتم استاندارد PSO ، عملیات استخراج در ابتدا براي هر ذره انجام می شود. سپس، این عملیات به تدریج به حالت تبدیل در انتهاي فرآیند تحقیق می رود. در RLMPSO، انتخاب مناسب ترین عملیات تحقیق براي هر ذره با استفاده از RL انتخاب شده است. الگوریتم 1 نشان دهندة شیوة تحقیق است. دستور کار تا زمانی تکرار می یابد که FES به بالاترین عدد خود برسد.
تعامل اصلی بین یادگیري Q و پنج عملیات ممکن تحقیق در سه گام خلاصه می شوند:
-1 بدست آوردن بهترین عملکردتحت اجراء بر اساس جدول Q براي ذرة فعلی
-2 اجراي عملیات انتخابی و محاسبه تابع تناسب. پاداش آنی اینگونه محاسبه می شود:
-3 جدول Q را براي ذرة فعلی به روزرسانی میکنیم.
در الگوریتم1، پس از عملیات متناسبسازي، یک هزینه - پاداش منفی - براي جریمه اجراي این عملیات داده می شود تا ارجحیت بالاتري به سایر عملیات هاي اجرایی داده شود.
B. عملیات تنظیم سازي
عملیات تنظیم براي هر دامنه diاز ذره Pbesti بدون وابستگی از سایر دامنه هاست. در این مطالعه، مدل ISPO براي عملیات تنظیم ایجاد شده است. جزئیات تنظیم سازي در الگوریتم 2 آمده است.
عملیات تنظیم در طی تمام دامنه هاي d و Pbesti انجام می شود و هر دامنه را به طور غیر وابسته تنظیم می کند. همانطور که در الگوریتم2 آمده، فرآیند تحقیق براي زمان هاي J ادامه دارد. در ISPO شتاب به صورت زیر محاسبه می شود:
که در آن a عامل سرعت،p پارامتر نزول است که تنزل شتاب را کنترل می کند، r یک عدد تصادفی یکسانی توزیع شده بین[-0/5+0/5] است و J عدد فعلیFES متغیر dوLi میزان یادگیري را نشان می دهد که اندازة جهش را کنترل می کند. مقدار آن در صورت افزایش مقدار تناسب، دو برابر می شود، در غیر این صورت کاهش می یابد.
تنظیم سازي براي نواحی جستجوي محتمل مفید است. به هر حال، داراي ارجحیت کمی است چرا که تعداد بالايFES را در مقایسه با سایر عملیات ها که تنها یک FES دارند، استفاده می کند اجراي تنظیم سازي باید تا عملیات فراگیر، عملیات شناسایی، تبدیل و جهش به اجرا برسد، ادامه داشته باشد . این باعث می شود که عملیات تنظیم سازي هم چنان به کشف و شناسایی در نواحی که توسط عملیات جستجوي فراگیر پیدا می شود. ادامه یابد. بنابراین، براي جلوگیري RLMPSO از اجراي عملیات تنظیم سازي در ابتداي فرآیند جستجو، تنظیم سازي در جدول Q با مقدار منفی شروع می شود تا اجرا به تأخیر بیفتد به علاوه، یک پارامتر هزینه معرفی می شود تا یک تأخیر درونی را بین عملیات هاي تنظیم دقیق متوالی ایجاد شود.