بخشی از مقاله
چکیده:
در دنیای امروز کاربردهای پردازش تصویر هر روزه در حال افزایش است . درزمینه های پزشکی ، رباتیک ، و هواشناسی تحقیقات و پژوهش های بسیاری در این زمینه انجام شده است. از کاربرد های آن نیز میتوان تشخیص حرکت دست را نیز نام برد. مکان یابی دست به عنوان اولین گام در جهت شناسایی تصویر دست مطرح است.در این مقاله روشی جهت تشخیص جهت اشاره دست اراته گردیده و الگوریتم پیشنهادی پیاده سازی می شود. با اعمال آن بر مجموعه ای از تصاویر دست که سه جهت مختلف را نشان می دهند مشخص گردید که سیستم ارائه شده از نتایج قابل قبولی در تشخیص حرکت دست برخوردار بود. به طوری که با استفاده از طبقه بندی کننده منجر به تشخیص 99درصد حرکت دست به سمت بالا و 94درصد حرکت دست به سمت چپ و 96درصد حرکت به سمت راست گردید.
واژگان کلیدی: پردازش تصویر، تشخیص حرکت دست، بینایی رایانه، طبقه بندی کننده - SVM -
مقدمه
از ابتدای تولید کامپیوترها یکی از مهمترین فعالیتهای طراحان این بوده است که کاربران بتوانند هر چه ساده تر با کامپیوترها ارتباط برقرار کرده و به راحتی از قابلیتهای آن استفاده کنند. متداول ترین شیوه تعامل با کامپیوترهای فعلی که برای چندین دهه است که تغییرات زیادی نیز نداشته، استفاده از سخت افزارهایی نظیر موشواره و صفحه کلید می باشد .با وجود سادگی این وسایل، هنوز هم افراد زیادی هستند که در استفاده از کامپیوترها مشکل داشته و حتی استفاده از این ابزارها برای کاربران حرفه ای نیز در بعضی از موارد خسته کننده می باشد . از طرف دیگر با توجه به افزایش روز افزون نقش رباتها در زندگی مدرن امروزی و گسترش زمینه های کاربرد ی آنها ، در آینده ای نزدیک این نیاز احساس خواهد شد که انسانها بتوانند طوری با کامپیوترها - رباتها - ارتباط برقرار کنند که گویی با انسانهای دیگر تعامل دارند .
در تعامل های انسان- انسان حرکتهای دست یکی از مهمترین ابزارهای برقراری ارتباط و انتقال خواسته ها می باشد ، بطوریکه برای افراد ناشنوا حرکتهای اشاره ای خاصی طراحی شده که می توانند با استفاده از حرکات دست، منظور ومقصود خود را به مخاطبان برسانند.[1] در ابتدا برای اینکه کامپیوتر - ماشین - بتواند حرکت های دست را تفسیر کند از یک سری دستگاه های الکترومغناطیسی استفاده می شدکه میتوانستند مکان دست و بازوها و زوایای بین آن ها و حتی زوایای بین مفصل های انگشتان را اندازه بگیرند. به ا ین گروه ازدستکش ها ،دستکش های دادهای 1و به این روش برقراری ارتباط بین انسان و کامپیوترروش مبتنی ، بر دستکش 2گفته میشود .
دلیل این نامگذاری این است که اینگونه دستگاه ها بصورت دستکش هایی هستند که سنسورهایی روی آن قرار دارد و با تعداد زیادی سیم به کامپیوتر متصل می شود و کاربران برای استفاده ازسامانه باید آن را مانند یک دستکش بپوشند . استفاده از اینگونه دسنکش ها چندان مورد استقبال کاربران قرار نگرفت چرا که استفاده از ابزارهایی نظیر موشواره و صفحه کلید بسیار ساده تر از این دستکش ها بود و در حال حاضر ازاین دستکش ها تنها برای کارهای خاص و کنترل در بعضی محیط ها استفاده میشود .برای برطرف کردن محدودیت های دستکش های دادهای استفاده از بینایی ماشین برای تشخیص حرکت های دست پیشنهاد شد.
در این رویکرد پیشنهاد شد که با استفاده از دوربین های ویدئویی و روش های بینایی ماشین و پردازش تصویر حرکت های دست شناسایی و تفسیر شود . در ابتدا به جای استفاده از دستکش های دادهای پیشنهاد شد که برای متمایز کردن دست ها از پس زمینه3 از دستکش های رنگی استفاده شود ویا علامت های رنگی بر روی دستکاربران قرار داده شود.استفاده از این دستکش ها در مقایسه با دستکش های دادهای بسیار مناسب تر می باشد ولی همین دستکش ها نیز یک محدودیت، به شمار میرود چرا که کاربر برای استفاده از سامانه همیشه مجبور است از این دستکش ها استفاده کند . برای حل این مشکل طراحان ازسامانه بینایی انسان الهام گرفتند. ما انسان ها میتوانیم تنها با استفاده از شکل و رنگ دستها، مکان دست در تصویر را مشخص کنیم . این موضوع این ایده را در ذهن طراحان بوجود آورد که به جای استفاده از دستکش های دادهای و رنگی تنها، از شکل دست ها و رنگ پوست برای تشخیص مکان دست در تصویر استفاده کنند.
مروری بر کارهای انجام شده
روشهای مختلفی جهت تشخیص حرکت دست پیشنهاد و عملیاتی شده است. به عنوان نمونه گوپتا در [2] الگوریتمی برای تشخیص 10 حرف از زبان اشارهای آمریکایی ارائه داده است . در [3] الجراح روشی برای شناسایی 30 حرف زبان اشاره ای ارائه کرده است که از شبکه های عصبی - فازی بر روی تصاویر سطح خاکستری در زمینه ثابت استفاده شده است . برای تقطیع دست ها از یک الگوریتم آستانه- سازی تکراری استفاده می شود .برای استخراج ویژگی ابتدا مرکز ثقل دستها محاسبه شده و سپس بردارهایی از این نقطه به نقاط پیرامون وصل می شود .طول این بردارها مولفه های بردار ویژگی داده ANFIS را تشکیل می دهند .بردارهای ویژگی به 30 شبکه شده و شبکه ای که خروجی بزرگتری تولید می کند، نوع حرکت دست را مشخص مینمایدتِنگ. در [4] الگوریتمی بلادرنگ برای شناسایی 30 حرف زبان اشاره ای چینی ارائه کرده است. لیکسار در [5] یک الگوریتم تطبیقی برای شناسایی 9 وضعیت ایستا ارائه داده است .
تشخیص حرکت دست
مسائل مرتبط با تشخیص حرکت تصویر دست را می توان به صورت زیر بیان کرد: -1مکان یابی دست:که عبارت است از مساله مشخص کردن محل دست درتصویری که فقط حاوی یک دست است. در واقع این مسأله، یک حالت ساده شده از مساله تشخیص حرکت دست است که درآن فرض بر وجود فقط یک دست در تصویر می باشد.
-2تشخیص دست راست و چپ:
که در آن تصویر دست ورودی با تصاویر موجود در یک پایگاه داده مقایسه شده و در صورت تطابق ، دست راست و یا چپ اعلام می شود.
-3تشخیص حالت دست:
که در آن مشخص کردن حالت دست اعم از باز بودن، بسته بودن و ... مد نظر می باشدمشخصاً،. آشکارسازی دست اولین قدم درسیستم های خودکار طراحی شده برای دستیابی به اهداف ادراکی سطح بالاتر فوق الذکر می باشد.باتوجه به ملاحظاتی که درانتخاب یک استراتژی مناسب برای تشخیص حرکت دست چپ و یا راست وجود دارد از قبیل نحوه ی ارائه و انتخاب روش تصمیم گیری یا طبقه بندی، راهکارهای متنوعی برای روش های تشخیص حرکت دست و دسته بندی آنها ارائه شده است. در این بخش روش هایی که تاکنون برای تشخیص دست ارائه شده اند را با توجه به نوع برخورد آن ها با مسأله دسته بندی کرده و مزایا ومعایب هریک را تا حد ممکن بررسی می کنیم تا درک جامعی از روش های ارائه شده حاصل گردد و جهت انتخاب روش مناسب بصیرت کافی حاصل شود.
روشهای مبتنی برآگاهی:4
در این روش ها، باتوجه به آگاهی محقق درباره تصویر دست انسان، قوانینی که توصیف کننده تصویر دست انسان هستند به دست می آیند. این قوانین عمدتا اجزاء دست انسان و روابط آن ها را توصیف می نمایند.رابطه بین این اجزاء با استفاده ازفاصله و موقعیت نسبی آن ها قابل تعریف می باشد. مدل پارامتری را میتوان یک روش نیمه آگاهانه دانست زیرا در آن ها استفاده کننده باید شکل مدل را بداند و پارامترهای مدل را باید از روی نمونه ها بدست آورد در صورتی که