بخشی از مقاله
چکیده
یادگیری اجتماعی نقش مهمی را در یادگیری رفتار در میان جوامع بشری ایفا می کند. مزیت یادگیری اجتماعی، اجازه دادن به افراد برای یادگیری رفتارهایی از دیگران بدون تحمیل هزینه های فردی آزمون و خطاست. در این مقاله قصد داریم یک نوع اصلاح شده از الگوریتم بهینه سازی ازدحام ذرات مبتنی بر یادگیری اجتماعی معرفی کنیم. فرآیند یادگیری اجتماعی در الگوریتم معرفی شده بر مبنای انتخاب مسابقه ای است. این فرآیند با مرتب سازی مقادیر تابع برازندگی صورت می پذیرد. الگوریتم معرفی شده در توابع با ابعاد پایین نتایج یکسانی نسبت به الگوریتم pso نرمال در زمان کمتری نشان داده است و در مسائل غیر خطی با ابعاد بزرگتر نتایج قابل تحسینی از خود نشان داده است.
-1 مقدمه
رفتارشان حل میکنند؛ این تغییرات را می توان به طور نمونه به شکل حرکت الگوریتم بهینه سازی ازدحام ذرات در سال 1995 توسط kennedy و افراد به سوی یکدیگر در فضای آگاهی اجتماعی مجسم کرد. Pso یک الگوریتم محاسبه ای تکاملی الهام گرفته از طبیعت و بر اساس Eberhart معرفی گردید.با توجه به خصوصیات منحصر بفرد و عمر کمی که این الگوریتم بهینه سازی دارد؛توانسته است به سرعت جایگزین بسیاری از تکرار می باشد.منبع الهام این الگوریتم، رفتار اجتماعی حیوانات، مانند حرکت الگوریتم های بهینه سازی قدیمی ترمانند ژنتیک گردد. [1] دسته جمعی پرندگان و ماهی ها است.
از این جهت که pso نیز با یک تاثیر گذاری اجتماعی و یادگیری اجتماعی، یک شخص را قادر می سازد ماتریس جمعیت تصادفی اولیه، شروع می شود شبیه بسیاری دیگر از الگوریتم های تکاملی همچون الگوریتم ژنتیک پیوسته و الگوریتم رقابت تا ثبات دانستنی هایش را برقرار سازد. انسان ها مسائلشان را به کمک صحبت استعماری است. درpso فرض بر این است که هر ذره قادر به حفظ بهترین با دیگران و نیز به کمک بر هم کنش با باورهایشان، گرایش هایشان و تغییر موقعیت موجود در تاریخچه ذرات است. بهترین موقعیت که تا به حال توسط کل ازدحام یافت شده global-best و بهترین موقعیت که تا به حال توسط هر ذره یافت شده personal-best نامیده می شود.
برای یافتن global-best دررابطه با مشکل بهینه سازی، ذرات از بهترین های شخصی و جهانی موقعیت را یاد می گیرند. [2] در این مقاله نوع جدیدی از الگوریتم pso را معرفی خواهیم کرد که درآن global-best و personal-best مطرح نیست.[2] در عوض هرذره با توجه به موقعیت ذرات دیگر، موقعیت خود را به روز رسانی می کند؛ به این معنا که انتخاب در الگوریتم پیشنهاد شده به طور ضمنی در فرآیند مرتب سازی انجام می شود.
-2بهینه سازی ازدحام ذرات مبتنی بر نخبه گرایی
در ادامه مروری بر الگوریتم بهینه سازی ازدحام ذرات، مزایا و معایب این الگوریتم، شرح الگوریتم بهینه سازی ازدحام ذرات مبتنی بر نخبه گرایی همراه با تجزیه و تحلیل پیچیدگی زمانی می پردازیم. در الگوریتم بهینه سازی ازدحام ذرات روش کار به صورت زیر است: ابتدا تعدادی ذره - راه حل های پیشنهادی - در فضای مسئله توزیع می شود. مکان و سرعت ذرات - اندازه جواب و نرخ همگرایی - در لحظات بعدی محاسبه خواهد شد. هرذره یک پارامتر به نام بهترین موقعیت فردی 1 دارد. ازدحام ذرات یک پارامتر به نام بهترین مکان سراسری2 دارد.
ذرات پس از توزیع شدن، توسط تابع برازندگی ارزیابی می شوند. اگر بهبود یافته باشد، p-best جایگزین می شود و در غیر این صورت به مکان قبلی بازمی گردد. سپس بهترین p-best به عنوان g-best انتخاب می شود.پس از آن سرعت و مکان ذرات به روز رسانی شده و شرط پایانی چک می شود؛ اگر مطابقت پیدا کند، الگوریتم پایان می یابد و درغیر این صورت دوباره تابع برازندگی فراخوانی شده و روال قبلی تکرار می شود. با توصیفات گفته شده این الگوریتم دارای مزایا و معایبی نیز می باشد که در ادامه شرح می دهیم:
مزایای الگوریتم بهینه سازی ازدحام ذرات:
- سرعت همگرایی قابل قبول
- کارایی بهتر در مسائل بهینه سازی پیوسته
- قابلیت بهینه سازی مسائل دارای ابعاد زیاد معایب الگوریتم بهینه سازی ازدحام ذرات:
- عدم وجود نخبه گرایی در الگوریتم
- ضعف عملکرد در مسائل بهینه سازی با چندین هدف
- امکان محصور شدن ذرات در دام بهینه های محلی
- تعیین شرط توقف الگوریتم در بسیاری از موارد کار دشواری است.
-1-2معرفی الگوریتم بهینه سازی ازدحام ذرات مبتنی بر نخبه گرایی
ابتدا به شرح مفهوم یادگیری اجتماعی می پردازیم:
به تقلید و تکرار رفتار های افراد نخبه یک نسل یادگیری اجتماعی گفته می شود.عملکرد نخبه گرایی در الگوریتم ژنتیک مبتنی بر انتخاب مسابقه ای وجود دارد.قصد داریم با الهام از رفتار نخبه گرایانه انتخاب مسابقه ای، مفهوم نخبه گرایی را به الگوریتم بهینه سازی ذرات اضافه کنیم. به صورت مشابه با الگوریتم بهینه سازی ازدحام ذرات استاندارد، تعدادی ذره به عنوان راه حل های اولیه در فضای مسئله توزیع می شوند.تابع برازندگی برای تمام ذرات محاسبه شده - شکل - 1 و سپس بر اساس آن مرتب سازی صعودی صورت می گیرد.سایر ذرات از ذرات نخبه پیروی می کنند و شرط پایانی مسئله بررسی می شود - شکل. - 2 به مرور زمان بردار نخبگان کوچکتر شده و در نهایت نخبه ترین ذره به عنوان جواب مسئله بهینه سازی در نظر گرفته می شود.
-1-3تجزیه و تحلیل پیچیدگی زمانی
از نظر مرتبه زمانی هر دو الگوریتم، مرتبه زمانی مشترک - N^2 +N.D - دارند.در الگوریتم pso استاندارد این زمان صرف ارزیابی تابع برازندگی و به روز رسانی پارامتر ها می شود.در الگوریتم بهینه سازی ازدحام ذرات مبتنی بر نخبه گرایی این زمان صرف مرتب کردن تابع برازندگی و فرآیند یادگیری می شود.