بخشی از مقاله
چکیده
در این مقاله یک مسئله بهینه سازی آنلاین با استفاده از روش کنترل جستجوی اکسترمم تطبیقی برای دستهای از سیستم های غیرخطی زمانگسسته با دینامیک مجهول در نظر گرفته شده است. هدف اصلی از این مقاله استفاده از الگوریتم جستجوی اکسترمم به عنوان یک ابزار جهت تخمین یک پارامتر متغیربازمان مربوط به یک سیستم با دینامیک مجهول میباشد. روش پیشنهاد شده برای طراحی یک کنترلکننده پیش بین تطبیقی به کار برده شده است. کنترلکننده جستجوی اکسترمم به منظور تولید سیگنال مرجع و همچنین به روز رسانی مدل خطی شده مربوط به کنترلکننده پیش بین مورد استفاده قرار گرفته است. مقدار بهینه سیگنال مرجع که کمینهای از خروجی سیستم می باشد، در هر مرحله به کنترل پیش بین داده میشود و به طور همزمان مدل خطی شده سیستم با توجه به نقطه تعادل جدید به روز رسانی میگردد. روش پیشنهادی بر روی یک سیستم غیر خطی زمانگسسته متغیربازمان مورد آزمایش قرار گرفته و نتایج آن ارائه شده است.
کلید واژه- بهینه سازی آنلاین، جستجوی اکسترمم، کنترل پیش بین مدل.
-1 مقدمه
کنترل جستجوی اکسترمم1 یک روش بهینه سازی آنلاین2 است که برای ردیابی مقدار بهینه تابع هدف اندازهگیری شده مورد استفاده قرار میگیرد. این روش که توسط Leblanc معرفی شد[1]، الگوریتمی است که توسط آن میتوان یک تابع هزینه از یک سیستم با دینامک نامعلوم را بهینه سازی کرد.[6] اولین اثبات مربوط به همگرایی الگوریتم جستجوی اکسترمم با استفاده از سیگنال اختلال در [2] ارائه شده است . این اثبات همگرایی برای یک کلاس از سیستم های غیرخطی مطرح شده است. در واقع، سه پارامتر مهم در این روش جستجوی اکسترمم برای همگرا شدن به نقطه بهینه حائز اهمیت است. این پارامترها عبارتند از : دامنه و فرکانس سیگنال اختلال3 و بهره گرادیان.[5] انتخاب سیگنال اختلال میتواند به صورت تصادفی نیز صورت گیرد.[7]
هرچند روش کنترل جستجوی اکسترمم هم برای سیستمهای زمان پیوسته و هم برای سیستمهای زمان گسسته قابل اجرا است، ولی بیشتر برای سیستمهای زمان پیوسته به کار گرفته شده است.[9,5] برخی از روش های زمان گسسته را میتوان در [3,8] مشاهده کرد. این نکته نیز قابل توجه است که در روش-های بهینه سازی غیرخطی مبتنی بر جستجوی اکسترمم، یا از اطلاعات گرادیان استفاده نمیشود و یا در صورت نیاز گرادیان تخمین زده شده به کار گرفته میشود.یکی از قدرتمندترین الگوریتمهای کنترلی که برای سیستمهای غیرخطی ارائه شده، کنترل پیشبین غیرخطی است که همچنان یکی از موضوعات مورد توجه برای تحقیق و پژوهش می-باشد.[13]
در بسیاری از سیستمها، در نزدیکی نقطه کار سیستم با استفاده از خطیسازی، یک مدل خطی به سیستم نسبت داده میشود که با استفاده از این مدل میتوان یک کنترلکننده خطی با کارایی مناسب جهت کنترل سیستم پیشنهاد کرد. اما در بعضی فرآیندها به دلیل درجه غیرخطیگری بالای سیستم، پایداری و عملکرد حلقه بسته تحت تاثیر قرار گرفته به طوری که استفاده از مدل خطی به تنهایی پاسخگو نیست.در این مقاله، با رویکردی متفاوت، استفاده از جستجوی اکسترمم در ترکیب با کنترل پیشبین پیشنهاد شده است. روش جستجوی اکسترمم زمان گسسته استفاده شده، مبتنی بر تخمین گرادیان به عنوان یک پارامتر متغیر با زمان است. در این روش برای بدست آوردن گرادیان تخمینی متغیر با زمان نیازی به تقریب تابع هزینه نمیباشد.[4]
از آنجا که مدل مورد استفاده در این مقاله مربوط به یک سیستم غیرخطی میباشد، از این روش برای پیدا کردن نقطه اکسترمم - کمینه یا بیشینه - خروجی سیستم استفاده شده است. به عبارت واضح تر، الگوریتم جستجوی اکسترمم متغیر با زمان تغییرات خروجی سیستم را به صورت یک پارامتر متغیر با زمان مجهول، در نظرگرفته است. سپس در هر مرحله این پارامتر مجهول را حول یک نقطه تعادل تخمین میزند و این روند را تا زمان برقراری شرط همگرایی الگوریتم ادامه میدهد. در نهایت پارامتر تخمین زده شده به عنوان سیگنال مرجع برای کنترل پیش بین استفاده شده است.
اما این نکته قابل توجه است که این الگوریتم در هر مرحله اجرا با یک نقطه تعادل جدید اقدام به محاسبه و تخمین پارامتر مجهول مینماید؛ لذا مدل سیستم که در کنترل پیشبین استفاده شده است باید با توجه به نقطه تعادل در هر مرحله اصلاح گردد. بنابراین این کنترل پیشبین یک کنترلکننده تطبیقی میباشد که در هر مرحله مدل سیستم و سیگنال مرجع آن به روز رسانی میشود. نتایج حاصل از شبیه سازی، عملکرد مطلوب این روش را نشان داده است.فصل دوم این مقاله به تشریح صورت مساله و کلیات نظری مربوطه به آن میپردازد. در فصل سوم تئوری الگوریتم جستجوی اکسترمم متغیر با زمان مطرح شده است. نتایج حاصل از شبیه سازی بر روی سیستم van der vusse در فصل چهارم قابل مشاهده است. در پایان فصل پنجم به جمعبندی و نتیجهگیری میپردازد.
-2 تعریف مسئله
در اواسط قرن بیستم، ایدههای استفاده از بهینهسازی یک تابع هدف مشخص برای تعیین سیگنال کنترلی گسترش یافت. اولین سری از کنترل کنندههای بهینه به نام کنترل کنندههای خطی گوسی مربعی - LQG - شناخته شدند. در این نوع کنترل کننده یک تابع هدف به صورت مجموع وزنگذاری شدهای از دو عبارت تفاضل متغیرهای حالت از مقدار حالت مطلوب و سیگنال کنترلی تعریف میشود. اگرچه در این روش تئوری وسیعی به کارگرفته شد، اما در عمل چندان از ای ن روش کنترلی استفاده نشد. یکی از مشکلاتی که باعث شد از این روش استقبال چندانی نشود، استفاده از یک مدل فضای حالت در این کنترلکننده بود. زیرا اجزاء یک پروسه معمولا غیرخطی و پیچیده است و اکثر اوقات نمیتوان مدل دقیقی از فضای حالت سیستم در دست داشت. این مشکلات باعث ایجاد انگیزهای در جهت تلاش برای رفع این مشکل شد.
و بهینه سازی در هر زمان نمونهبرداری به صورت آنلاین به عنوان راه حل مطرح شد. اساس کار کنترل کننده جدید که کنترل پیشبین نامیده شد به گونهای است که با پیشبینی آینده سعی در کمینه کردن مربع خطای آینده دارد. در این روش یک تابع خطا تعریف میشود که باید در هر زمان نمونه برداری به صورت آنلاین کمینه شود. افق کنترل پیش بین حداکثر زمانی است که برای پیشبینی آینده در نظر گرفته می-شود. همچنین به دلیل محدودیتهای عملی و جلوگیری از نوسان سیگنال کنترلی یک جمله دیگر به صورت مربع تغییرات سیگنال کنترلی به معادله بهینه سازی اضافه میشود.[10]
در روشهای کنترل پیش بین، تابع هدف به صورت مشخص با استفاده از حل تحلیلی کمینه شده و سیگنال کنترل اعمالی به سیستم محاسبه میشود. اما در کنترل پیشبین غیرخطی مسئله متفاوت است. در این حالت غیرخطیبودن مدل منجر به یک تابع معیار غیرخطی شده که به راحتی قابل حل نبوده و برای حل آن از روشهای عددی استفاده میشود. تا به حال روشهای متفاوتی برای حل مسئله بهینهسازی در کنترل پیشبین غیرخطی مطرح شده است که از جمله آنها میتوان به شیب ماکزیمم یا برنامه ریزی خطی اشاره کرد. روش شیب ماکزیمم حجم محاسباتی کمتر و سرعت بیشتری دارند اما هیچ تضمینی وجود ندارد که به کمینه کلی منتهی شود.
با توجه به این که اساس کار کنترل پیشبین بر مبنای تخمین آینده بوده و این کار بر عهده مدل سیستم میباشد، لذا مدلسازی در فرآیند کنترل پیشبین از اهمیت بالایی برخوردار میباشد.برای حل این مشکل، استفاده از الگوریتم جستجوی اکسترمم متغیر با زمان به ما کمک میکند که بتوانیم نقطه کار بهینه یک سیستم با دینامیک مجهول را بدست آوریم. این نقطه بهینه به عنوان یک سیگنال مرجع در اختیار کنترل پیش بین قرار می-گیرد، تا سیستم مورد نظر را به نقطه کار بهینه برساند. در واقع در این مرحله کنترل و هدایت سیستم به عهده کنترل پیش بین است و پیدا کردن نقطه بهینه و محاسبات آن به عهدهی روش جستجوی اکسترمم میباشد.
از آنجایی که الگوریتم جستجوی اکسترمم یک روش جستجوی تکرار شونده است در هر مرتبه از اجرای الگوریتم نقطه کار سیستم با تخمین دقیق تری بدست می آید. بنابراین مدل خطی شده سیستم در کنترلر پیش بین با هر مرحله اجرای الگوریتم بر اساس نقطه کار جدید به روز رسانی میشود.در هر مرحله، کنترلر پیشبین با توجه به نقاط بهینه ای که توسط اکسترمم تولید میشود خطی شده است. این مدل خطی را میتوان به صورت که p , A Rn n Rn m , B Rn Cو R p uk بردار ورودیهای کنترل و Rq yk بردار خروجی سیستم است، در نظر گرفت. تابع هزینه کنترلر پیشبین را میتوان به صورت زیر تعریف کرد:[12]که N pو Nc به ترتیب افق پیشبین و افق کنترل است. در این مقاله از مدل GPC برای کنترلکننده پیشبین استفاده شده است.
-3 تئوری الگوریتم جستجوی اکسترمم متغیر با زمان
در این بخش، مسئله جستجوی اکسترمم بررسی شده است. سیستم غیرخطی زیر را در نظر بگیرید:به طوریکه xk Rn ، uk R و yk R به ترتیب عبارتند از بردار حالات سیستم، بردار ورودی کنترل و بردار خروجی اندازه گیری شده سیستم. - f - xk ,uk و - h - xk توابع غیرخطی نامعلوم هموار هستند. هدف اصلی، راندن سیستم به نقاط تعادلx* و u* جهت رسیدن به مقدار کمینه y - h - x * - - میباشد.نگاشت تعادل - حالت مانا - بردار n بعدی - u - است بطوریکه:تابع هزینه در حالت تعادل به صورت زیر در نظر گرفته می-شود: بنابراین در حالت تعادل مسئله به پیدا کردن u* کمینه کننده از y - u * - کاهش مییابد و فرضیات زیر را بایستیبرآورده کند.فرض :1 تابع هزینه - 4 - به این صورت است: