مقاله روشی مبتنی بر اتوماتای یادگیر تعمیم یافته در حل مسائل تصمیم گیری غیر متمرکز چند عامله

فایل pdf

6 صفحه

قیمت مقاله 000 49 تومان

شرکت مگ ایرانز ضمانت می کند تا 48 ساعت ،اگر به هر دلیلی از خرید خود ناراضی بودید ، مبلغ آن به صورت کامل و بدون چون و چرا، برگشت داده شود .جهت درخواست برگشت وجه ، با پشتیبانی تماس بگیرید .

بخشی از مقاله

چکیده

اتوماتاهای یادگیر در حال حاضر به عنوان ابزاری ارزشمند در طراحی الگوریتمهای یادگیری تقویتی بوده و حتی در سیستمهایی که از وجود چندین اتوماتای یادگیر بهره میبرند نیز ویژگیهای خوبی را ارائه داده اند. اتوماتای یادگیر در مسائل تصمیمگیری غیرمتمرکز قادر به کنترل زنجیرههای مارکوف محدود و حتی بازیهای مارکوفی نیز می باشد. این بازیها توسعهای از فرآیندهای تصادفی مارکوف با چندین عامل بوده و هدف هرعامل پیدا کردن سیاست بهینهای است که امید ریاضی مجموع کاهش یافته پاداشها را بیشینه نماید.

در این مقاله در روش پیشنهادی، در هر حالت از محیط، به ازای هر عامل، یک اتوماتای یادگیر تعمیم یافته استفاده شده است. اعمال انتخابی اتوماتای یادگیرتعمیم یافته - GLA - برپایه پاداش تجمعی به دست آمده یا بردار احتمال اعمال اتوماتای یادگیر حالت جدید، پاداش یا جریمه دریافت می کنند. نتایج آزمایشهای انجام گرفته نشان دادهاند که الگوریتم ارائه شده از کارایی مناسبی در سرعت همگرایی - رسیدن به راه حل بهینه - برخوردار است.

-1 مقدمه

در ادامه سازماندهی این مقاله بصورت زیر است، در بخش2 به تعریف و بررسیMDP و بازیهای مارکوفی پرداخته شده است. در بخش3 مفهوم اتوماتای یادگیر و استفاده از آن در حل بازیهای مارکوفی و ارائه راهحل پیشنهادی ارائه گردیده است. در بخش4 مثالی از بازیهای هماهنگی مارکوفی و چهار حالت به عنوان بستر حل مساله ارائه شده و در بخش 5 آزمایشها و نتایج دیده میشود.

-2 بازیهای مارکوفی

-1-2 تعریف فرآیند تصادفی مارکوف

مساله کنترل کردن یک زنجیره مارکوفی محدود به نام مساله تصمیمگیری مارکوفی خوانده میشود که در آن احتمالات گذار حالت و پاداشها ناشناختهاند و به صورت زیر تعریف میشود. تعریف.1 فرآیند تصادفی مارکوف بصورت چندتایی S,A,R,T نشان داده میشود که در آن S مجموعه متناهی از وضعیتها، A مجموعه عملیات قابل دسترس برای عامل و T : S×A×S [0, 1] احتمال انتقال از وضعیت جاری به وضعیت بعدی با انجام عمل a است و R: S×A تابع پاداش است که یک مقدار عددی را بر میگرداند.

-3 اتوماتای یادگیر

اتوماتاهای یادگیر یکی از مدلهای یادگیری تقویتی است که در آن یک اتوماتا یک عمل بهینه را با توجه به اعمال گذشته و بازخورد محیط فرا میگیرد . هدف نهایی این است که اتوماتا یاد بگیرد تا از بین اعمال خود، بهترین عمل را انتخاب کند. بهترین عمل، عملی است که احتمال دریافت پاداش از محیط را به حداکثر برساند. کارکرد اتوماتای یادگیر در تعامل با محیط، در شکل1 مشاهده میشود.

-2-3 اتوماتای یادگیر تعمیم یافته - - GLA

برای حل مساله یادگیری تقویتی انجمنی به یکLA با تعریف متفاوت نیاز است. در مسائل یادگیری تقویتی انجمنی هدف حل یک مساله تشخیص الگو برای انتخاب بهترین اعمال میباشد. در این مسائل درهرمرحله کاری LA ، یک بردار از مقادیر ویژگی های یک نمونه از توزیع مورد نظر نیز به عنوان ورودی LA مطرح است. این بردار از ویژگی ها، بردار زمینه نیز نامیده میشود. [12] یک راه حل این مسائل استفاده ازGLA است. درGLA ساختارLA به نحوی تغییر یافته که اجازه میدهد بردار زمینه به عنوان ورودی به آن اعمال شود.

-3-3 استفاده ازشبکه اتوماتای یادگیر درحل MDP ها

مساله کنترل زنجیره مارکوف میتواند به صورت شبکهای از اتوماتاهایی بیان گردد که درآن، درهرلحظه فقط یک اتوماتای یادگیر فعال بوده و انتقال از یک وضعیت به وضعیت دیگر، اتوماتای مربوط به وضعیت جدید را فعال می نماید. این فرآیند تا زمانیکه بردار احتمالهای کلیه اتوماتاهای یادگیر به پایداری برسد و یا شرط خاصی برقرار گردد، تکرار میشود.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید

ادرس کوتاه https://magirans.com/id/103128

مقالت رو پیدا نکردی ؟

ما رایگان واست سرچ میکنیم .فقط کافیه موضوع و شماره موبایلت را در کادر ثبت موضوع ، وارد کنی و تمام . ما لیستی از بهترین عناوین که مرتبط با موضوع شماست را در (روبیکا ، ایگپ ، ایتا یا واتساپ) تقدیمتون میکنیم.

ثبت موضوع

با تشکر از شما
درخواست بررسی موضوع مقاله شما با موفقیت ثبت گردید . کارشناسان ما بزودی نتیجه بررسی را به شما اطلاع میدهند .

درباره مگ ایرانز

مگیرانز برندی معتبر در بین کاربران فضای علمی ایران

مگ ایرانز یک سایت خدماتی اینترنتی محسوب می شود که روزانه مقالات و پاورپوینت های زیادی را جمع آوری ، تهیه و در دسترس دانشجویان ، دانش‌آموزان و محققین قرار می‌دهد . گروه مگ ایرانز در سال 1390 زمانی که هنوز کسب و کارها حالت سنتی داشتند و کافی نت ها به صورت حضوری در سطح شهر فعالیت می‌کردند با ایده کافی نت آنلاین راه اندازی شد . طرح اولیه این شرکت در ابتدا با ایده و تلاش دو دانشجوی خلاق راه اندازی گشت . سپس در سال دوم راه اندازی ، پس از مستقر شدن در دفتر کاری مجهز و استخدام چند نیروی ماهر ،توانستند در طول 5 سال به اهداف خود یعنی 1- رضایت و اعتبارحداکثری در بین کاربران اینترنتی 2- گرد اوری بانکی جامع از مقالات ( 60 هزار مقاله و پاورپوینت فارسی وقابل ویرایش ) 3- همکاری با بیش از 100 کافینت در سطح ایران ، دست پیدا کنند و این راه همچنان ادامه دارد . . .

تماس با ما

سوالات متداول

مقاله روشی مبتنی بر اتوماتای یادگیر تعمیم یافته در حل مسائل تصمیم گیری غیر متمرکز چند عامله

بخشی از مقاله

چرا مگ ایرانز؟

دانلود فایل پاورپوینت در تدبیر مسافر برّ

دانلود فایل پاورپوینت تعیین فرکانس سرکشی بهینه با استفاده از اتوماتای یادگیر براساس راه حل مسئله کوله پشتی کسری

دانلود فایل پاورپوینت فرایند اتوماتای یادگیر

مقاله حل مسئله درخت اشتاینر کمینه با استفاده از اتوماتای یادگیر توزیع شده

مقاله جایابی ماشین مجازی با استفاده از اتوماتای یادگیر برای کاهش انرژی

مقاله طراحی سیستم پیام متغیرخبری چند عامله ، جهت بهبود رفتار رانندگان و انطباق بیشتر با اطلاعات انتشار یافته

مقاله به کارگیری مدلی ترکیبی از بازی اقلیت و اتوماتای یادگیر برای ایجاد هماهنگی در سیستم های چند عامله

مقاله قطعه بندی تصاویر رنگی با استفاده از اتوماتای یادگیر سلولی

مقاله حل مسئله درخت اشتاینر کمینه با استفاده از اتوماتای یادگیر توزیع شده

مقاله تحلیل اقتصادی مقادیر بهینه روی و بُر مصرفی گیاه ذرت؛ مطالعه موردی منطقه زرقان

مقاله جستجوی خدمات بر روی اینترنت اشیا با کمک الگوریتم قدم زدن تصادفی و اتوماتای یادگیر توزیع شده

مقاله خوشه بندی دادگان با استفاده از اتوماتای یادگیر سلولی نامنظم

مقاله حل مسئله رنگآمیزی گراف مبتنی بر اتوماتای یادگیر سلولی و سیستم استنتاج فازی

مقاله دسته بندی مفهومی صفحات وب با استفاده از اتوماتای یادگیر توزیع شده

مقاله رتبه بندی فنون تصمیم گیری چند شاخصه MADM با استفاده از برخی روش های تصمیم گیری چند معیاره در محیط فازی

مقاله روش تجمیع داده بهبود یافته ی چند لایه ای چند عامله در شبکه های حسگر بی سیم

مقاله روشی برای سیستم های تشخیص و پیشگیری از نفوذ مبتنی بر سیستم های چند عامله

مقاله شناسایی رابطه متغیرهای هواشناختی با تبخیر پتانسیل تبریز برپایه مدل جمعی تعمیم‌یافته ( GAM ) و مدل خطی تعمیم‌یافته ( GLM )

مقالت رو پیدا نکردی ؟

درباره مگ ایرانز

مگیرانز برندی معتبر در بین کاربران فضای علمی ایران

مقاله روشی مبتنی بر اتوماتای یادگیر تعمیم یافته در حل مسائل تصمیم گیری غیر متمرکز چند عامله

بخشی از مقاله

چرا مگ ایرانز؟

مقالات مرتبط با این مقاله

دانلود فایل پاورپوینت در تدبیر مسافر برّ

دانلود فایل پاورپوینت تعیین فرکانس سرکشی بهینه با استفاده از اتوماتای یادگیر براساس راه حل مسئله کوله پشتی کسری

دانلود فایل پاورپوینت فرایند اتوماتای یادگیر

مقاله حل مسئله درخت اشتاینر کمینه با استفاده از اتوماتای یادگیر توزیع شده

مقاله جایابی ماشین مجازی با استفاده از اتوماتای یادگیر برای کاهش انرژی

مقاله طراحی سیستم پیام متغیرخبری چند عامله ، جهت بهبود رفتار رانندگان و انطباق بیشتر با اطلاعات انتشار یافته

مقاله به کارگیری مدلی ترکیبی از بازی اقلیت و اتوماتای یادگیر برای ایجاد هماهنگی در سیستم های چند عامله

مقاله قطعه بندی تصاویر رنگی با استفاده از اتوماتای یادگیر سلولی

مقاله حل مسئله درخت اشتاینر کمینه با استفاده از اتوماتای یادگیر توزیع شده

مقاله تحلیل اقتصادی مقادیر بهینه روی و بُر مصرفی گیاه ذرت؛ مطالعه موردی منطقه زرقان

مقاله جستجوی خدمات بر روی اینترنت اشیا با کمک الگوریتم قدم زدن تصادفی و اتوماتای یادگیر توزیع شده

مقاله خوشه بندی دادگان با استفاده از اتوماتای یادگیر سلولی نامنظم

مقاله حل مسئله رنگآمیزی گراف مبتنی بر اتوماتای یادگیر سلولی و سیستم استنتاج فازی

مقاله دسته بندی مفهومی صفحات وب با استفاده از اتوماتای یادگیر توزیع شده

مقاله رتبه بندی فنون تصمیم گیری چند شاخصه MADM با استفاده از برخی روش های تصمیم گیری چند معیاره در محیط فازی

مقاله روش تجمیع داده بهبود یافته ی چند لایه ای چند عامله در شبکه های حسگر بی سیم

مقاله روشی برای سیستم های تشخیص و پیشگیری از نفوذ مبتنی بر سیستم های چند عامله

مقاله شناسایی رابطه متغیرهای هواشناختی با تبخیر پتانسیل تبریز برپایه مدل جمعی تعمیم‌یافته ( GAM ) و مدل خطی تعمیم‌یافته ( GLM )

مقالت رو پیدا نکردی ؟

درباره مگ ایرانز

مگیرانز برندی معتبر در بین کاربران فضای علمی ایران