بخشی از مقاله
چکیده
این مقاله کنترل تطبیقی-ع صبی گ سترده چند رهبره را برای سی ستمهای چندعاملی برر سی میکند که در آن هر عامل دنبالهرو دارای دینامیک غیرخطی مرتبه بالا به فرم بازخورد غیر اکید است و سیگنال کنترلی برای هر عامل دنبالهرو، دارای محدودیت اشباع است. گراف ارتباطات بین عاملها جهتدار است و دینامیک عاملها متفاوت در نظر گرفته شدهاند. در این مقاله، بهمنظور کاهش محاسبات مربوط به روش گام به عقب تطبیقی قدیمی، روش شناخته شده گام به عقب تطبیقی دارای فیلتر فرمان، که برای سیستمهای تکعاملی به فرم بازخورد اکید طراحی شده است، به کنترل تطبیقی-عصبی گسترده در حضور چند رهبر برای سیستمهای چندعاملی غیرخطی به فرم بازخورد غیر اکید توسعه داده شده است. همچنین با بهکارگیری یک سیستم کمکی، تأثیر محدودیتهای سیگنال کنترلی عاملهای دنبالهرو جبران شده است. الگوریتم کنترلی ارائه شده ت ضمین میکند که تمام سیگنالها در سی ستم حلقه ب سته، کراندار نهایی یکنواخت نیمهفراگیر ه ستند و خطاهای توافقی به یک همسایگی کوچک از مبدأ همگرا میشوند. در نهایت کارایی الگوریتم کنترل ارائه شده بهوسیله یک مثال شبیهسازی نشان داده میشود.
کلید واژه- سیستم چندعاملی، شبکه عصبی، کنترل تطبیقی، کنترل گام به عقب، کنترل همکارانه.
-1 مقدمه
در دو دهه اخیر، طراحی کنترل گ سترده برای سی ستمهای چندعاملی به دلیل کاربردهای فراوان خود در ب سیاری از زمینهها همچون شبکههای سنسور بیسیم، کنترل آرایش رباتهای خودگردان و مدیریت انرژی در ریزشبکهها، توجه بسیاری را به خود جلب کرده ا ست. یکی از م سائل ا سا سی در سی ستمهای چندعاملی، مسئله توافق است که میتوان آن را به دو دسته تقسیم کرد. دسته اول توافق بدون رهبر است که در آن هدف، طراحی الگوریتم کنترل بهگونهای است که تمام دنبالهروها با گذشت زمان به یک مقدار مشترک برسند .[1] دسته دوم، توافق رهبر-دنبالهرو می باشد که هدف آن طراحی کنترلکننده ها بهگونهای است که تمام دنبالهروها در نهایت، هدف یا اهداف ثابت یا دینامیکی را، که رهبر نامیده میشوند، ردیابی کنند.
بسیاری از کارهای انجام شده بر روی مسئله توافق رهبر-دنبالهرو تاکنون، بر مسئله تک رهبر تمرکز کردهاند .[3 ,2] وقتی مسئله توافق دارای چندین رهبر است، نیاز است که کنترل گسترده بهگونهای طراحی شود که تمام دنبالهروها در نهایت به پوش محدبی که بهوسیله رهبرها ایجاد میشود، همگرا شوند.تاکنون مسئله توافق در حضور چندین رهبر برای سیستمهای چندعاملی متفاوتی همچون سیستمهای انتگرالگیر مرت به اول [4]، سیستم های انتگرالگیر مرت به دوم [5] و سیستمهای چندعاملی خطی عمومی [7 ,6] در نظر گرفته شدهاند. با این وجود، در عمل بسیاری از سیستمهای چندعاملی غیرخطی هستند و دینامیکهای ناشناخته و عدم قطعیت در آنها وجود دارد.
از همین رو در چند سال اخیر، نتایج مربوط به کنترل گسترده سیستمهای چندعاملی غیرخطی در حضور چندین رهبر مورد توجه محققان قرار گرفته است. نتایج مربوط برای سیستمهای شبکهای لاگرانژین در [9 ,8] و برای کنترل گ سترده زمان-محدود چندین ج سم سخت در [10] آورده شده است. با این وجود در [10-8] دینامیک غیرخطی یا ناشناخته همراه با سیگنال کنترلی در حالت آخر از دینامیک عاملها ظاهر می شود که این مو ضوع در ب سیاری از سی ستمهای چندعاملی با مراتب بالا، همچون سی ستمهای چندعاملی با فرم بازخورد اکید، بازخورد محض و بازخورد غیر اکید برقرار نی ست. به همین دلیل، ن تایج مرتبط برای سیستم های چ ند عاملی غیرخطی دارای عدمقطعیت به فرم بازخورد اکید و بازخورد محض به ترتیب در [11] و [12] مورد بررسی قرار گرفتهاند.
با این وجود، الگوریتم کنترل گسترده ارائه شده در [12 ,11] برای سیستمهای چندعاملی غیرخطی به فرم بازخورد غیراکید و دارای دینامیک ناشناخته، قابل بهکارگیری نیست و استفاده از آنها باعث به وجود آمدن م شکل حلقه جبری برای این د سته از سی ستمهای چندعاملی میشود. به این معنی که کنترلکنندههای مجازی و قوانین تنظیم تطبیقی در هر مرحله، تمام بردار حالت عامل ام را شامل میشوند که این موضوع در روش گام به عقب ممنوع است و باعث میشود که نتوان از لحاظ عملی کنترلکنندهها را پیادهسازی کرد. همچنین اگرچه در [12 ,11] بهمنظور کاهش محا سبات از فیلتر کردن کنترلکنندههای مجازی ا ستفاده شده است، اما اثرات خطاهای این فیلترها جبرانسازی نشدهاند. از طرفی در برخی از سیستمهای چندعاملی غیرخطی بهدلیل محدودیتهای فیزیکی، اشباع سیگنال کنترلی اجتنابناپذیر است و باید آن را نیز در روند طراحی الگوریتم کنترل گسترده در نظر گرفت.
این مقاله کنترل تطبیقی-عصبی گسترده چند رهبره را، تحت گراف جهتدار برای سیستمهای چندعاملی غیرخطی دارای دینامیک ناشناخته که به فرم بازخورد غیر اکید هستند و سیگنال کنترلی هر عامل دنبالهرو دارای اشباع میباشد، مطالعه میکند. مسئله حلقه جبری در طول روند طراحی حل شده است. بهمنظور کاهش پیچیدگی در محاسبه کنترلکنندههای مجازی، از روش گام به عقب تطبیقی با بهرهگیری از فیلتر فرمان استفاده میشود که این روش اولین بار برای سیستمهای تکعاملی در [13] معرفی شد و در اینجا به کنترل تطبیقی-عصبی سیستمهای چندعاملی غیرخطی به فرم بازخورد غیر اکید، توسعه داده شده است.
از طرفی با استفاده از یک سیگنال کمکی، تأثیر اشباع سیگنال کنترلی جبران شده است. با استفاده از تخمین فقط یک اسکالر مثبت مرتبط با دینامیک غیرخطی ناشناخته هر عامل دن با لهرو، ت عداد قوانین تنظیم تطبیقی و درنتی جه پیچ یدگی طراحی تطبیقی کاهش یافته است که این موضوع پیادهسازی عملی الگوریتم ارائه شده را ممکن میسازد.بخشهای دیگر مقاله از این قرار است. تعریف مسئله و مقدمات در بخش 2 ارائه میشود. طراحی کنترل گسترده در بخش 3 بررسی میگردد. کارایی روش ارائه شده بهوسیله یک مثال شبیه سازی در بخش 4 نشان داده می شود. در بخش 5 نیز برخی از نتایج به دست آمده بیان میگردد.
-2 تعریف مسئله و مقدمات
-1-2 گراف ارتباطات
در این مطالعه بهمنظور نشان دادن ارتباط بین دنبالهروها و رهبرها در سیستم چندعاملی از گراف جهتدار - , - استفاده می شود که = {1, … , + } مجموعه گرهها و ⊆ × مجموعه یال ها است. = [ ] ∈ - + - × - + - ماتریس مجاورت گراف وزندار است که در آن > 0 اگر - , - ∈ و در غیر این صورت = 0 ا ست. همچنین فرض می شود که= 0 است. = ∑ +=1 درجه ورودی وزندار گره است و = { 1, … , + } ∈ - + - × - + - ماتریس درجه ورودی وزندار است. ماتریس لاپلاسین غیرمتقارن گراف بهصورت = [ ] = − نشان داده میشود. همچنین برای بردار 1 = [1, … ,1] ∈ - + - ، راب طه 1 = 0 همواره برقرار ا ست. = { | - , - ∈ } مجموعه هم سایههای گره را ن شان مید هد. اگر - , - ∈ باشد آن گاه گره میتوا ند از گره اطلاعات دریافت کند. یک مسیر مستقیم از گره به گره یک دنباله پیدرپی از یالها به فرم { - , - , - , - , … , - , - } است. یک گراف جهتدار، یک درخت پو شای جهتدار دارد اگر حداقل یک گره به نام گره ریشه وجود داشته باشد که به دیگر گرهها مسیر مستقیم داشته باشد.
-2-2 شبکه عصبی
هر تابع ناشناخته هموار مانند - - که در یک مجموعه فشرده Ω ⊂ تعریف شود، میتواند بهوسیله شبکه عصبی تخمین زده شود .[14] برای هر ثابت یک شبکه ع صبی وجود دارد بهگونهای که
که در - 1 - ، ∗ = [ 1, … , ] ∈ بردار وزنی ثابت ایدهآل ا ست و - - = [ 1 - - , … , - - ] ∈ یک بردار تابع هموار با تعداد گره شبکه ع صبی > 1 ا ست. فرض می شود که توابع پایه - - در این مطالعه، توابع گوسی با دامنه یک باشند. لم .1 برای ∀ - , - ∈ 2 نامساوی یانگ زیر برقرار است:
-3-2 تعریف مسئله
سیستم چندعاملی با دنبالهرو و رهبر را در نظر بگیرید که دینامیک عاملهای دنبالهرو به فرم بازخورد غیراکید زیر است:که در - 4 - ، ̅ = [ ,1, … , , ] ∈ بردار حالت امین دنبالهرو ، ∈ ورودی کنترلی، ∈ خروجی امین دنبالهرو، , - . - : → تابع غیرخطی هموار ناشناخته و - - سیگنال ورودی اشباع شده به شکل زیر است:
که به ترت یب حدود قا بل قبول بالا و پایین سیگنال کنترلی میباشند. همچنین دینامیک رهبر نیز به ش کل - - ∈ است که در آن = + 1, … , + میباشد.فرض .1 دینامیک رهبرها محدود هستند و - - ∈ ، فقط برای امین دنبالهرو که ∈ باشد، در دسترس است. همچنین به ازای = + 1, … , + داریم ̇ - - ∈ و| ̇ - - | ≤ ̅ که ̅ یک ثابت ناشناخته مثبت است.فرض .2 برای هر دنبالهرو حداقل یک رهبر وجود دارد که یک مسیر مستقیم به آن دنبالهرو داشته باشد.باید توجه دا شت که رهبرها هیچ هم سایهای ندارند، بنابراینبرای = + 1, … , + و = 1, … , + ، = 0است. ماتریس لاپلاسین گراف ارتباطات سیستم چندعاملی بهصورت زیر است که در آن ماتریس ارت با طات بین عا مل دن با لهرو و ماتریس ارت با طات بین رهبر و دنبالهرو است.
تعریف. پوش م حدب، برای یک مجمو عه از ن قاط مجمو عه م حدبِ حدا قلِ ت مام ن قاط است و بهصورت - - = {∑ =1 | ∈ , > 0, ∑ =1 1} تعریف میشود.لم .[10] 3 با توجه به فرض 2، ̅1 یک ماتریس غیرمنفرد است و بنابراین معکوس پذیر است. بهعلاوه هر درایه از −̅1−1 ̅2 غیر منفی است و جمع هر سطر از آن برابر یک است.بردار ر ه برها - - = [ +1 - - , … , + - - ] و پوش محدب بردار رهبرها - - = { +1 - - , … , + - - } است. اگر - - = [ ,1 - - , … , , - - ] = −̅1−1 ̅2 - - را تعریف کنیم که , - - ∈ و = 1, … , است، آنگاه با توجه به لم 3 به آسانی میتوان فهمید که برای ≥ 0،ℎ - - ∈ - - ‖ , - - − ℎ - - ‖ < همواره برقرار است . بنابراین مسئله همگرا شدن به پوش محدب چندین رهبر میتواندبه عنوان مسئله ردیابی هر دنبالهرو به گونهای که‖ - - − , - - ‖ < ̅ برقرار شود تبدیل شود که در آن ̅ یک ثابت مثبت است که میتواند به اندازه کافی کوچک شود.
-3 طراحی کنترل گسترده
خطای ردیابی توافقی را بهصورت زیر تعریف میکنیم:
مسئله .1 هدف طراحی کنترل گسترده در - 4 - بهگونهای است که خطای ردیابی توافقی - 7 - به یک همسایگی کوچک نزدیک به صفر میل کند و در همان حال همه سیگنالها در سیستم حلقه-بسته کراندار نهایی یکنواخت نیمهفراگیر باشند.تعریف خطای همسانسازی همسایگی بهصورت زیر است:
همچنین میتوان نوشت = 1 + 2 که در آن[ ,̅ … , ̅] = بردار خطای همسان سازی همسایگی است و= [ 1, … , ] و = [ +1, … , + ] است. بنابراین باتو جه به این که داریم ̅1−1 = + ̅1−1 ̅2 ، آن گاه هدف طراحی کنترل گ سترده بهگونهای ا ست که خطای هم سان سازی همسایگی تعریف شده در - 8 - ، کراندار شود. بهمنظور طراحی کنترلکننده گام به عقب در مرحله، تغییر مختصات زیر را در نظر بگیرید.