بخشی از مقاله

چکیده
در این مقاله هدف ارائه یک راهکار ترجمه تصاویر بر اساس شبکه هاي عصبی مصنوعی است. به نحوي که بتوان به طور موثري سوراخهاي داخلی را نمایان نموده و شکل سوراخ را با بهترین الگوي شکل از میان 18 الگوي هندسی مختلف تطبیق داد. این طرح تفسیر چیدمان تصاویر دو مرحله اي قادر است، حفره هاي تصویري هر ساختار را با الگوهاي بهتر و بهینهتري تقریب بزند. از کاربردهاي این تکنیک می توان به تشخیص سریع سوراخ هاي قطعات مکانیکی و تعیین دسته مربوطه جهت اتصال قطعات مناسب با ابعاد هر یک از سوراخ ها اشاره کرد.

استفاده این شیوه دردستگاه هاي تولید خودکار منجر به بهینه سازي زمان تولید می شود و به ویژه در مونتاژ قطعات پیچیده خطاهاي انسانی را تا حد زیادي کاهش دهد .

مقدمه

در این مقاله تفسیر هندسی تصویر با استفاده از شبکههاي عصبی مصنوعی در دو مرحله مختلف صورت گرفته است. هدف از شبکه عصبی مصنوعی در مرحله اول این است که به هر سوراخ داخلی تحت ترجمه بهترین شکل هم انداره را از میان 18 الگوي شکل هندسی پایهاي شامل دایره، نیم دایره، مستطیل، مربع و مثلث نسبت دهد. هر کلاس خود به چند زیرکلاس طبقه بندي شده است. شبکه عصبی که در مرحله دوم طراحی شده است، این وظیفه را بر عهده دارد که زیر کلاس شکل ورودي را تشخیص دهد.

پس از آن که توسط شبکه عصبی اول یک الگوي شکل به یک سوراخ داخلی نسبت داده شد، از شبکه عصبی دوم استفاده شده و الگوي شکلی به سوراخ نسبت داده میشود که در آن جزئیات بیشتري در نظر گرفته شده است. جهت این امر در هر کدام از شکلهاي پایهاي الگوهاي زیر مجموعه نیز در نظر گرفته شده است. هر زیر گروه از این الگوها شامل تعدادي الگوي شکل با تشابه هندسی هستند.

مراحل ریاضی که در شبکه عصبی طی میشود در مرجع 1 نمایش داده شده است. تابع فعالسازي مورد استفاده سیگموئید غیرخطی بوده که شامل تابع سیگنال لجستیک جهت تطابق بهتر الگوي خروجی نیز میس باشد. بردارهاي بایاس b و ماتریس وزنها w ، در لایه هاي مختلف تمامی شبکههاي عصبی با استفاده از روش انتشار خطا رو به عقب محاسبه و به روز آوري شدهاند.

تفسیر و ترجمه شکل حفره و تعیین کلاس مربوطه

در شبکه عصبی اولیه که بر پایه تفسیر اشکال حفره استوار است، هر حفره در نتیجه بهینه سازي توپولوژي به مناسبترین الگوي اولیه تصویري از میان پنج 18 الگوي کلی که توسط شبکه عصبی آموزش داده شده است، واگذار میشود. در کار دیگري که در سطح جهان در این زمینه شده[4] ، هفت ممان نامتغیرکه از ممان مرتبه دوم و سوم یک شکل هندسی استخراج می شود و معیار تعیین کلاس هر تصویر میشود که لازمه آن دانستن روابط ریاضی پیچیده و وقتگیر حاکم بر اشکال است .

در این مقاله شیوه دیگري که ساده تر ومؤثرتر است مورد استفاده قرار گرفته است. به این ترتیب که نمودار هیستوگرام فواصل بی بعد شده یک نقطه از مرز سوراخ با تمام نقاط دیگر روي مرز رسم میشود ، این فواصل به دلیل اینکه بی بعد شده اند لذا دوران، انتقال و تغییرات سایز یک شکل پایه در نمودار هیستوگرام مربوط به آن کلاس مربوطه بلا اثر است، نمونههاي تصویري استفاده شده به طور کامل در مرجع 1 آمده است. لازم به ذکر است، همانطور که از تصاویر پیداست علاوه بر دوران، انتقال و تغییر سایز اندکی اغتشاش هم به تصاویر مربوط به هر کلاس داده شده است. این امر هرچند تاحدودي عملکرد شبکه عصبی را تضعیف می کند اما باعث می شود تا مسئله ابعاد جامع تري به خود بگیرد و واقعیت بیشتري را پوشش دهد.

در این مقاله از شبکه عصبی از مدل قراردادي ذًBل استفاده شده است. اگر به دید جزئی تر نگاه کنیم از شبکه عصبی2PNN که از انواع شبکه هايRBF هستند براي کلاسه بندي الگوها استفاده شده است. از هر مجموعه کلاس، پانزده نمونه جهت آموزش شبکه و پنج نمونه جهت تست برداشته می شود.

نحوه عملکرد

این نوع از شبکه ها از دو لایه تشکیل شده اند.

لایه اول: فاصله بردار ورودي با بردارهاي آموزش یافته - تولید برداري که میزان نزدیکی بردار ورودي را به هر بردار آموزش نشان می دهد - محاسبه و سپس هر درایه نظیر به نظیر در بایاس ضرب شده و بعد تابع تبدیل روي آن عمل میکند. بردار ورودي نزدیک به بردار الگوي آموزش داده شده مقدار نزدیکتري به عدد یک در بردار خروجی خواهد داشت.اگر یک داده ورودي به چندین داده آموزش نزدیک باشد، چندین آرایه از بردار خروجی عددي نزدیک به یک خواهند داشت.

لایه دوم: هر بردار تنها داراي یک مقدار یک است که کلاس مربوطه را نشان می دهد و بقیه آرایه ها برابر صفر است. با ضرب ورودي لایه دوم در وزن ها، مجموع المان ها براي هر ل تا دسته - جهت محاسبه بردار احتمال هر دسته - محاسبه می شودح نهایتا با استفاده از یک تابع تبدیل بر روي خروجی لایه دوم، ماکزیمم آرایه بردار را انتخاب و خروجی آن را برابر یک قرار می دهد و بقیه ارایه ها برابر صفر خواهند بود. این شبکه به تعداد نمونه هاي ورودي، نرون ایجاد می کند، بنابراین تعداد بیشتري نرون نسبت به شبکه هاي پس انتشار نیاز داشته اما زمان طراحی کوتاه تري نسبت به شبکه هاي پس انتشار استاندارد دارند.

شاخص تغییرناپذیر به کار رفته

با استفاده از ابزار پردازش تصویر3 در نرم افزار متلب4، ابتدا مختصات تمام نقاط روي مرز هر شکل خوانده میشود و سپس فاصله بین نقطه شروع با تمام نقاط دیگر روي مرز - خط راست - محاسبه شده که پس از نرمالیزه شدن براي هر الگوي شکلی مقادیري مشخص است. براي نرمالیزه کردن یا همان بی بعد کردن مقادیر، این فواصل به ماگزیمم فاصله محاسبه شده تقسیم می شود. نمودار هیستوگرام این فواصل نرمالیزه شده به عنوان شاخص تشخیص هر کلاس تصویري به عنوان بردار ویژگی به شبکه عصبی وارد می شود. این شاخص براي تمام تصاویر یکسانی که تحت دوران یا تغییر سایز ترار گرفته اند و یا حتی اغتشاش کمی در مدل داشته باشند، نمودار یکسانی می دهد، مثلاً اگر تصویر ورودي به شبکه عصبی در فرمت مدل سیب باشد، چنانچه ابعاد آن را با هر نسبتی کوچکتر یا بزرگتر کنیم یا با هر زاویه اي دوران دهیم، باز هم شبکه عصبی طراحی شده شکل مربوطه را جزو کلاس سیب ها تشخیص می دهد.

نتایج شبکه عصبی در مرحله اول جهت تشخیص کلاس مربوط به هریک از الگوهاي شکلی در نمودارهاي زیر آمده است. نمودار اول عملکرد شبکه به ازاي پانزده نمونه از هر یک از هجده الگوي متفاوت تصویري می باشد ،درصد تشخیص صحیح شبکه یصصَصک می باشد که درصد قابل قبولی است. ستون عمودي شماره کلاس مربوطه، دایره هاي آبی و قرمز نمونه هاي مربوط به هر کلاس می باشند.

دایره هاي آبی کلاس واقعی مربوط به هر کلاس را مشخص کرده و دایره هاي قرمز کلاسی را که شبکه عصبی پس از آموزش براي هر یک از نمونه ها اختصاص داده، نشان می دهند. حال هرچه تعداد بیشتري از دایره هاي قرمز و آبی در هر ستون - کلاس - بر هم منطبق باشند، این نشان می دهدکه شبکه عصبی با دقت بیشتري کلاس نمونه را تشخیص داده است. به طوري که از شکل 5 پیداست، شبکه تمام نمونه هاي مربوط به کلاس 6را به درستی تشخیص داده است اما در کلاس 13، سه نمونه از پانزده نمونه آموزش، به اشتباه به کلاس هاي دیگري نسبت داده شده اند. اما با توجه به نسبت بالاي تشخیص صحیح به تشخیص اشتباه می توان اذعان داشت که شبکه عصبی طراحی شده عملکرد رضایت بخشی را نشان داده است.

شکل:1 پروسه خواندن فاصله یک نقطه از مرز با تمام نقاط دیگر با بهره گیري از ابزار پردازش تصویر در متلب

شکل :2 تصاویر مربوط به کلاس 1 و نمودار هیستوگرام فواصل بی بعد نقاط روي مرز 15 -

تصویر اول نمونه هاي مربوط به آموزش شبکه و 5 تصویر آخرنمونه هاي مربوط به تست -

شکل :3 تصاویر مربوط به کلاس 7 و نمودار هیستوگرام فواصل بی بعد نقاط روي مرز 15 - تصویر اول نمونه هاي مربوط به آموزش شبکه و 5 تصویر آخرنمونه هاي مربوط به تست -

شکل :4 تصاویر مربوط به کلاس 18 و نمودار هیستوگرام فواصل بی بعد نقاط روي مرز 15 - تصویر اول نمونه هاي مربوط به آموزش شبکه و 5 تصویر آخرنمونه هاي مربوط به تست -

محاسبات مربوط به درصد تشخیص صحیح به صورت زیر است:

نمودار دوم عملکرد شبکه به ازاي داده هاي تست که 5 نمونه از هر کلاس است، را نشان می دهد. درصد تشخیص صحیح شبکه می باشد. این درصد نشان می دهد که تا چه حد شبکه در تشخیص کلاس مربوط به هر نمونه موفق عمل کرده است.

شکل :5 چگونگی عملکرد شبکه عصبی اول در تشخیص کلاس نمونه هاي

آموزش
مرحله دوم در تشخیص اشکال مشابه به نزدیکترین زیرگروه به گونه مؤثري عمل کند. در شبکه عصبی دوم نیز از شبکه هاي ششب استفاده شده است، و در آن از دو الگوریتم مختلف براي دسته بندي جزئی تر تصاویر استفاده می شود که الگوریتم اول همان شاخص هیستوگرام به کار رفته در شبکه عصبی اول است و الگوریتم دوم، از شاخص هاي هندسی که در ادامه توضیح داده می شود استفاده شده است

شش مشخصه هندسی که شامل فاصله و نسبت مساحت یک سوراخ تصویر می باشد، به عنوان بردار ورودي براي هریک از زیرگروه ها به کاربرده می شود. همانطور که در شکل 2 نشان داده شده است، چهار پارامتر بنیادي در شش مشخصه هندسی استفاده شده است که شامل محیط ک ، بیشترین فاصله بین مرکز ثقل تا محیط خ ، کمترین فاصله بین مرکز ثقل تا محیط 2 و مساحت تصویر ه می باشند. این چهار پارامتر کلیدي مورد استفاده در شکل 7 نشان داده شده است. شش مشخصه هندسی به عنوان بردار ورودي شبکه عصبی ثانویه به صورت زیر تعریف می شود:

ازآن جایی که تمامی شش مشخصه هندسی که در فوق تعریف شد، بی بعد هستند و نیازي به تعریف هیچگونه مختصاتی هم ندارند، تغییرات سایز و جهت حفره تصویر هیچ تأثیري رویشان نخواهد گذاشت. آنها در کلاسه بندي کردن تصاویري با شکل هندسی مشابه همچون الگوهاي شکلی در یک زیرگروه، مؤثر و کارآمد عمل می کنند.

شکل :6 چگونگی عملکرد شبکه عصبی اول در تشخیص کلاس نمونههاي تست

تفسیر جزئی تر هندسه اشکال هر الگو به کمک شبکه عصبی :

شبکه عصبی اول پس از آموزش می تواند به طور مؤثر، اشکال را به عنوان یکی از هجده دسته کلی اولیه مطابق با شباهت هاي هندسی تشخیص داده و طبقه بندي کند. با وجود این، یک کلاس جامع از هر هجده الگوي هندسی اولیه می تواند در مرحله ثانویه خود شامل تعدادي الگوهاي شکلی مشابه باشد که به شکل یک زیرگروه از شکل هاي با هندسه مشابه، تعریف شود. بنابراین شبکه عصبی ثانویه میتواند درهر یک از سه شبکه عصبی مصنوعی، شش مشخصه هندسی که در معادلات بالا تعریف شد، را به عنوان بردار ورودي مورد استفاده قرار می دهد و زیرکلاس هریک از انواع نمونه هاي تصویري را مشخص می کند.

بعد از دو مرحله پی در پی، شبکه هاي عصبی، اطلاعات هندسی حفره شکل را می خوانند و از طریق آن یکی از نزدیکترین الگوي شکلی به نمونه موردنظر را تشخیص می دهند. تعیین 3 مورد از اطلاعات هندسی مهم بستگی به تعیین دقیق مرکز هندسی شکل دارد، نیاز است که سایز و جهت صحیح نمونه شکل روي ساختار تعیین شود. 

شکل:7 چهار پارامتر هندسی مؤثر در تشخیص جزئی تر اشکال

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید