بخشی از مقاله
چکیده
تشخیص حرکت کاربردی با هدف تفسیر حرکات انسان از طریق الگوریتمهای ریاضی میباشد. منشا حرکات میتواند به صورت جابجایی یا تغییر حالت هر عضو بدن باشد، اما معمولا از دست یا صورت استفاده میشود. در حال حاضر تمرکز در این زمینه شامل تشخیص احساسات از طریق چهره و تشخیص حرکات دست میباشد. الگوریتمهای بسیاری برای استفاده از دوربین و بینایی رایانهای ساخته شدهاند تا بتوانند زبان اشاره را تفسیر کنند.
همچنین شناسایی و تشخیص طرز ایستادن یا نشستن، راه رفتن، همجواری و رفتار انسان نیز بخشی از کاربرد تشخیص حرکت است. میتوان این کاربرد را به دو گروه پیوسته و گسسته دستهبندی کرد. در حالت گسسته به کل دنباله یک برچسب اختصاص داده میشود، اما در حالت پیوسته برای هر قاب دنباله یک برچسب در نظر گرفته میشود که درنتیجه امکان دادن چند برچسب به یک دنباله وجود دارد.
با توجه به اهمیت تشخیص حرکت انسان ، از این کاربرد برای بررسی عملکرد مدل پیشنهادی استفاده میکنیم. در این زمینه مدل خود را با HMM، HCRF و CRF مورد مقایسه و ارزیابی قرار میدهیم.
-1 مقدمه
مدلهای گرافی احتمالاتی را میتوان به دو گروه مدلهای مولد1 و تفکیکی2 تقسیمبندی کرد.[1] در مدلهای مولد به دنبال بازنمایی توزیع مشترک بین ورودی و خروجی هستیم. از این رو در این مدلها نیاز به مدل کردن توزیع احتمال پیشین ورودی وجود دارد. از جمله مدلهای مهم در این حوزه مدل پنهان مارکوف[2]3 و میدان تصادفی مارکوف[3] 4 را میتوان نام برد.
در برخی از کاربردها مدل کردن دادههای ورودی و بازنمایی توزیع بر روی آنها کاری سخت و پیچیده است. از این رو مدلهای تفکیکی در این زمینه مفید به نظر میرسند زیرا در این مدلها با توجه به شرطیسازی بر روی دادههای ورودی دیگر نیازی به مدلسازی و بازنمایی دادهها وجود ندارد. مدلهای گرافی احتمالاتی تفکیکی از جمله میدان تصادفی شرطی[4]5 و میدان تصادفی شرطی با حالات پنهان[5] 6 توزیع احتمال برچسب به شرط مشاهدات را به صورت مستقیم مدلسازی میکنند. بنابراین محدودیتهای مدلهای مولد را که توزیع مشترک برچسب و مشاهدات محاسبه میکنند، دارا نمیباشند.
مدلهای گرافی احتمالاتی را همچنین میتوان از حیث داشتن یا نداشتن لایه مخفی مورد دستهبندیهای ریزتری قرار داد. برای مثال در مدلهای مولد، مدل پنهان مارکوف دارای یک لایه مخفی است که در تشخیص ساختارهای پیچیده به آن کمک میکند. این مدل یک مدل مارکوف آماری است که در آن، سامانه مدل شده به صورت یک فرایند مارکوف با حالتهای پنهان فرض میشود.
در مدل عادی مارکوف، حالت به طور مستقیم توسط ناظر قابل مشاهده است و بنابراین احتمالهای انتقال بین حالتها تنها پارامترهای موجود است. در یک مدل پنهان مارکوف، حالت بهطور مستقیم قابل مشاهده نیست، اما خروجی که خود تابع حالت است، قابل مشاهده میباشد. هر حالت یک توزیع احتمال روی برچسبهای خروجی ممکن دارد. بنابراین دنباله برچسبهای تولید شده توسط یک مدل پنهان مارکوف اطلاعاتی درباره دنباله حالتها میدهد. میدان تصادفی مارکوف، مدل مولد دیگری است که لایه مخفی ندارد. این مدل نمونهای از یک مدل آماری است که ارتباط و استقلال بین متغیرهای تصادفی را به کمک یک گراف ساده و بدون جهت مدل میکند.
در مدلهای تفکیکی، میدان تصادفی شرطی با توجه به نداشتن لایه مخفی نمیتواند به خوبی ساختارهای درونی بین دادههای ورودی را کشف و استخراج نماید. در ساختار این مدل بین ورودی و برچسبها رابطه میانی دیگری وجود ندارد که این امر موجب عدم استخراج کافی اطلاعات از ساختار دادهها میشود. مدل میدان تصادفی شرطی با حالات پنهان با اضافه کردن لایه مخفی به مدل میدان تصادفی شرطی به دنبال استخراج روابط بین ساختارهای ورودی و در نتیجه عملکرد بهتر نسبت به آن بود. این مدل توزیع مشترک بین حالات مخفی و برچسبها را با شرط مشاهده نمودن ورودیها بازنمایی میکند.
-2 بررسی کاربرد تشخیص حرکت پیوسته
برای ارزیابی، ما از پایگاه داده Arm Gesture استفاده میکنیم.[6] این پایگاه داده یکی از مهمترین پایگاه دادههای استفاده شده برای تشخیص حرکت است و دارای شش برچسب است که هرکدام از برچسبها مربوط به یک حالت خاص از حرکتهای پشت سر هم دست است. در شکل 6-4 برچسبهای مختلف این پایگاه داده را مشاهده میکنید.
شکل.-2 پایگاه داده Arm-Gesture با برچسبهای مختلف. ضربه زدن به عقب، حرکت عمودی جزئی، بازکردن به صورت عمودی،دو حرکت برگشت به عقب،اشاره کردن و برگشت به عقب و بازکردن به صورت افقی
در شکل 3-4 نیز یک نمونه از دنباله تصاویر موجود در پایگاه داده را مشاهده میکنید که یک برچسب خاص را نمایش میدهد.