بخشی از مقاله
*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***
سیستم های کنترل یادگیر تکرار شونده بهینه
چکیده: در این مقاله با استفاده از تئوری کنترل بهینه یک قانون کنترل یادگیر تکرار شونده جدید بدست می آید. قانون کنترل بدست آمده قادر است فرآیندهای تکراری با شرایط اولیه دلخواه را که دارای ورودی اغتشاش نیز هستند کنترل نماید بطوریکه با افزایش تعداد تکرارها خروجی فرآیند در هر لحظه به مسیر مطلوب داده شده ای نزدیک شده و یک تابعی معیار مرتبه دو مینیمم شود. تعبیر فیزیکی تابعی معیار مورد نظر این است که می خواهیم بدون تغییر زیادی در ورودی فرآیند خروجی آنرا به مسیر مطلوب داده شده نزدیک کنیم. با ارائه یک مثال شبیه سازی عملکرد قانون یادگیری بهینه ارائه شده مورد ارزیابی قرار میگیرد.
واژه های کلیدی: یادگیری، سیستم های کنترل یادگیر تکرار شونده، کنترل بهینه ، فرآیندهای تکرار شونده.
۱ - مقدمه
بشر تلاش میکند تا قدرت یادگیری را به سیستم های مهندسی بسط دهد. طراحی و ساخت سیستم های کنترل یادگیر یکی از این تلاشهاست. از روشی های مهمی که در زمینه سیستمهای کنترل یادگیر وجود دارد و برای اولین بار در سال 1984 مطرح شده است [1] سیستمهای کنترل یادگیر تکرار شونده
... (Iterative Learning Control Systems) انگیزه طرح این روش این بوده است که نمونه های زیادی در صنعت وجود دارد که باید سیستم یا دستگاه تحت کنترل
وظیفه مشخصی را بطور متناوب تکرار کند. از موارد بارز چنین نمونه هایی میتوان به بازوی رباتیک اشاره کرد که قرار است یک وظیفه تکراری نظیر جوشکاری ، رنگ پاشی ، برش کاری و ... را در یک مسیر هندسی از قبل تعیین شده در هر تکرار انجام دهد. اگر شرایط کار سیستم در تمام تکرارها یکسان باشد خطای ایجاد شده (مثلا فاصله بین خروجی سیستم و مسیر مطلوب داده شده) نیز در همه تکرارها یکی خواهد بود. بنابراین با ذخیرهسازی ورودی سیستم و خطا در تکرار J ام میتوان از آنها در تعیین ورودی فرآیند در تکرار 1 + j به منظور بهبود عملکرد سیستم و کاهش خطا استفاده کرد. در دو دهه اخیر این مبحث بسیار مورد توجه محققان بوده و پیشرفت های خوبی هم در زمینه تئوری و هم عملی کسب کرده است، بطوریکه امروزه به یکی از رشته های تخصصی علم کنترل تبدیل شده است. خوانندگان علاقمند می توانند برای کسب اطلاع بیشتر از روند شکل گیری و پیشرفت این مبحث به مقاله های [14 - 1] رجوع کنند. اساس سیستمهای کنترل یادگیر تکرار شونده به این صورت می باشد که در آنها در حین اجرای آلگوریتم کنترل در تکرار j ام ، برخی اطلاعات نظیر خطای بین خروجی واقعی فرآیند تحت کنترل و خروجی ایده ال در حافظه سیستم ذخیره می شود. از این اطلاعات ذخیره شده به منظور کاهش خطا و بهبود عملکرد سیستم حلقه بسته برای تعیین ورودی فرآیند طبق قانونی که آلگوریتم یادگیری نامیده می شود در تکرار 1 + j استفاده میگردد. بالاخره بعد از چند تکرار ورودی
مناسب فرآیند بطوریکه منجر به ایجاد خروجی مطلوب گردد بدست میآید. بنابراین ورودی فرآیند تحت کنترل را می توان در تکرار 1 + J به صورت زیر نوشت:
که در آن یک عبارت اصلاحی بوده و نشان دهنده تغییرات ورودی فرآیند در تکرار 1 + j نسبت به تکرار j. است.
تفاوت روشهای ارائه شده در زمینه سیستم های کنترل یادگیر تکرار شونده در نحوه تعیین بوده است و نحوه تعیین بیانگر نوع قانون یادگیری استفاده شده می باشد. گرچه تاکنون آلگوریتمها و روش های مختلفی برای تعیین پیشنهاد شده اما در این زمینه از تئوری کنترل بهینه استفاده نشده است. البته مطالعات چندی در مراجع | 4.6.7.11] برای تعیین در قالب مسائل بهینه سازی پارامتری صورت گرفته است. بدین صورت که قوانین کنترلی خاصی برای پیشنهاد شده که در آن قوانین کنترل پارامترهای قابل انتخابی وجود دارند و این پارامترها به گونه ای تعیین شده اند که تابعی معیاری حداقل شود. هدف این مقاله استفاده از تئوری کنترل بهینه در تعیین و در نتیجه ارائه یک نوع جدیدی از سیستم های کنترل یادگیر تکرار شونده می باشد. مقاله چنین سازماندهی شده است: در قسمت ۲ مسئله مورد نظر تعریف میشود. در قسمت ۳ این مسئله به یک مسئله کنترل بهینه تبدیل شده و با استفاده از تئوری کنترل بهینه حل می شود. در قسمت : برای مشاهده عملکرد قانون یادگیری بهینه ارائه شده یک مثال شبیه سازی آورده می شود. در پایان نیز نتیجه گیری صورت می گیرد.
۲- تعریف مسئله
فرآیند پیوسته - زمان تکرار شونده زیر را در نظر می گیریم:
که در آن t نشان دهنده متغیر زمان و J شماره تکرار را نشان می دهد. بردار حالت ،
به ترتیب بردارهای ورودی و خروجی فرآیند، و
بردارهای اغتشاش هستند. عددی معلوم است که طول هر دوره (تکرار) را نشان میدهد. ماتریسهای A , B , C حقیقی بوده و دارای ابعاد مناسبند. مسئله مورد نظر چنین تعریف می شود: ورودی فرآیند یعنی
در فاصله زمانی ) را چنان تعیین کنید که با افزایش تعداد تکرارها خروجی فرآیند در هر لحظه به مسیر مطلوب داده شده ای مثل نزدیک شود، یعنی:
بطوریکه با فرض معلوم بودن خطا در تکرار j ام که به صورت زیر تعریف می شود:
تابعی معیار زیر در تکرار 1+ J مینیمم شود:
که در آن:
و T نشان دهنده ترانهاده (TranSpOSe) بوده ،
و ماتریس های متقارن و مثبت معین هستند.
تعبیر فیزیکی تابعی معیار داده شده این است که می خواهیم بدون تغییر زیادی در ورودی فرآیند خروجی فرآیند را به مسیر مطلوب داده شده نزدیک کنیم.
۳- حل مسئله مورد نظر
بردار را چنین تعریف می کنیم:
از روابط (1) و (5) دینامیک به صورت زیر بدست میآید:
با توجه به تعریف داریم:
در نتیجه:
یعنی:
با قرار دان از رابطه فوق در رابطه (4) داریم:
چونکه مستقل از بوده و مربوط به تکرار قبلی (تکرار j ام) است مینیمم کردن معادل با مینیمم کردن تابعی معیار زیر می شود:
رابطه (7) را در نظر می گیریم. این رابطه نشان دهنده یک سیستم دینامیکی می باشد که بردار حالت آن و برادر ورودی آن است. اکنون حل مسئله مورد نظر تعیین ورودی این سیستم است بطوریکه تابعی معیار مینیمم شود (این مسئله شبیه مسئله تعقیب است). برای تعیین ورودی این سیستم از تئوری کنترل بهینه استفاده می کنیم.
تابع هامیلتونین به صورت زیر میباشد:
که در آن شامل ضرب کننده های لاگرانژ است. شرایط بهینگی چنین است که در فاصله زمانی
روابط زیر برقرار باشند:
که در آن علامت * نشان دهنده مسیرهای بهینه است.
روابط (11) به صورت زیر نوشته می شوند:
از رابطه (12.3) داریم:
با قرار دان از رابطه فوق در رابطه (12.1)، روابط ( 1.12) و (12.2) به صورت زیر نوشته می شوند:
جواب معادله دیفرانسیل خطی ثابت با زمان غیر همگان فوق چنین است:
که در آن ماتریس به صورت زیر میباشد:
ماتریس را چنین در نظر میگیریم:
با قرار دان از رابطه فوق در رابطه (15) نتیجه میشود: