بخشی از مقاله
چکیده-
در این مقاله روشی جدید برای کنگره تخمین سن افراد از روی تصاویر اخذ شده از آنها ارایه می گردد. در روش پیشنهادی، ابتدا گشتاورهای شبه زرنیک از چهره شخص استخراج شده و در ادامه با اعمال یک طبقه بند ماشین بردار پشتیبان بر روی این ویژگی ها، سن فرد تعیین می گردد. استفاده از گشتاورهای شبه زرنیک با توجه به خواص این گشتاورها نظیر مقاوم بودن در برابر چرخش و در برابر نویز موجب عملکرد بهتر روش پیشنهادی نسبت به سایر روش های این حوزه می گردد. روش پیشنهادی بر روی تصاویر واقعی مستخرج از پایگاه داده FG NET آزموده شده و عملکرد آن با دو روش موجود مقایسه می گردد. نتایج حاصل، حاکی از بهبود تخمین سن، توسط روش پیشنهادی نسبت به رقبا هستند به مشترک گونه ای که روش این مقاله، به دقتی حداقل 3,72 درصد بهتر از نزدیک ترین رقیب خود دست می یابد.
کلید واژه- تصویر، تخمین سن ،گشتاور شبهزرنیک، ماشین بردار پشتیبان، دقت.
-1 مقدمه سیستم
انسداد، آرایش، حالت چهره، وجود ریش، سبیل و عینک، وضعیت چهره و عواملی از این قبیل متاثر است، لذا در نظر گرفتن هریک از این موارد به عنوان یک عامل موثر در تشخیص سن، این مساله را به یک چالش اساسی، مبدل میسازد. تا کنون روش های مختلفی برای مقابله با چالش های فوق، ارایه شده اند که هر یک با نسبتی از توفیق همراه بوده اند. در برخی از پژوهش ها از مدلهای آنتروپومتریک جهت تخمین سن از روی چهره استفاده شده است. مدلهای آنتروپومتریک خانواده ای از روشپنجمینهاهستندکه بر مبنای بررسی ابعاد و برخی مشخصات چهره انسان عمل می کنند به گونه ای که دریک روش متداول، چهره را شامل 57 نقطه نشانه یا ثابت، در سنین مختلف از دورهی رشد تا بزرگسالی تعریف کرده و برای مشخصه سنتزی سن از مدلهای ریاضیاتی کنگره استفاده می نمایند.
نتایج بدست آمده از این رویکرد، حاکی از آن است که مدل های آنتروپومتری اگرچه میتوانند برای چهرههای جوانمشترکمفیدباشند، اما برای سایر سنین عملکرد مناسبی ندارند. همچنین مدل آنتروپومتری فقط هندسه چهره را در نظر میگیرد و نه اطلاعات بافت را اصولاً برای چهرههای نژاد اروپایی بیش از سایر مناطق، به کار رفته است.[1] مدل ظاهر فعال[7] یک مدل آماری را بهطور اولیه برای کدگذاری تصویر چهره ارائه میدهد که با دادن یک مجموعه از تصاویر چهره آموزشی، به یک یک مدل شکلی آماری ارتقا می یابد. رویکردهای مبتنی بر مدل ظاهر فعال، برای ارائه تصویر سنی علاوه بر هندسه چهره که در روشهای پیشین به تنهایی بررسی میشد، شکل و بافت را هم در نظر میگیرند. این رویکردها از آنجایی که هر تصویر تست را با یک مقدار خاصی برچسب گذاری میکند که از محدودهی پیوستهای انتخاب میشود، برای تخمین سن ، عملیتر هستند.[7]
همچنین در روشی موسوم به فضای فرعی الگوی پیری به جای مواجهه با هر تصویر چهره بهطور جداگانه می توان از یک رشته از تصاویر چهره سنی افراد که به همراه یکدیگر میتوانند فرآیند پیری را مدل کنند، استفاده کرد. در این روش، یک الگوی سنی، به عنوان یک سری از تصاویر چهره، تعریف میشود که از همان فرد به دست آمده است و براساس مقطع زمانی طبقهبندی شدهاست. این روش در دو گام کار میکند: گام یادگیری و گام تخمین سن. تاکید این روش بر استفاده از تصاویر همان فرد در گروههای سنی به همراه هم برای ارائه الگوهای پیری است. ضعف این روش آن است که اغلب پایگاه داده ها، ممکن است مجموعه تصاویر کاملی از همان فرد را در اختیار ندهند[1]، [8]،[9]و.[10]
در روش دیگری به نام چند سنی، به جای یادگیری یک الگوی پیری خاص برای هر فرد، از تصاویر تعدادی شخص با سنین مختلف استفاده می شود. مزیت این روش آن است که برای هر فرد نیاز به یادگیری الگوی سنی خاصی ندارد و تمام سنین مختلف میتوانند به موازات، استفاده شوند. در این روش، با بهره-گیری از تکنیک یادگیری چندظرفیتی برای یادگیری پیری با ابعاد کم از تصاویر چهره متعددی در هر سن استفاده میکند و بدین ترتیب، نیازی نیست که تصویرهای مختلف و متعددی از هر شخص حاضر باشد. بر این اساس هر فرد ممکن است در پایگاه داده، حداکثر یک تصویر در یک سن داشته باشد.[1] در روش مدل ظاهری، بیشتر بر روی استخراج ویژگیهای مرتبط با پیری چهره، تمرکز میشود. در این روش، ویژگیهای محلی و سراسری چهره با روش های مختلف استخراج ویژگی ازجمله فیلتر گابور، تبدیل فوریه، الگوی دودویی محلی و نظایر آنها استخراج میگردند.[1]
سیستمدراینمقاله روشی جدید تخمین سن از روی تصاویر چهره ارایه می شود که بر طبقه بندی مبتنی بر ویژگی های شبه زرنیک استوار است. این روش شامل دو مرحله است که در اولین مرحله، ویژگی هایهایچهره با استفاده از گشتاورهای شبه زرنیک از تصویر ورودی استخراج شده و در مرحله دوم با استفاده از طبقه بند ماشین بردار پشتیبان،فازیتخمین سن انجام می پذیرد.
با توجه به خاصیت بخش اندازه گشتاورهای شبه زرنیک که از جمله آن میتوان به ومقاوم بودن در برابر چرخش، توصیفکنندگی بالا، توانایی بالا هوشمنددربازسازیتصویر، مقاوم بودن در برابر نویز و توصیف چند لایهای، اشاره نمود، به نظر می رسد
که روش پیشنهادی بتواند بر برخی مشکلات روشهای پیشین مانند تغییر پذیری در برابر چرخش ، عدم مقاومتایراندربرابر نویز و عملکرد توصیفی پایین، فایق آمده و بر این اساس عملکرد بهتری نسبت به آنها داشته باشد. همچنین این گشتاور به علت متعامد بودن، مقاومت خوبی در برابر نویز داشته و اطلاعات حشو و زاید کمتری دارد. همچنین گشتاورهای شبه زرنیک دارای خاصیت توصیف چند لایهای هستند، چرا که مرتبهی پایین این گشتاورها کلیات و مرتبههای بالاتر، جزییات تصویر را بیان می کنند. همچنین گشتاور شبه زرنیک نسبت به گشتاور زرنیک در توصیف تصویر کارآمدتر است، زیرا گشتاور شبه زرنیک میتواند
چندجملهای مستقل خطی از مرتبه کمتر یا مساوی با n بهوجود آورد، درحالی که گشتاور زرنیک - n+1 - - n+2 - /2 بهوجود آورد. همچنین با توجه به نرمالیزه کردن تصاویر در مرحله پیش پردازش، الگوریتم مطرح شده مقیاس پذیر بوده و حساسیت به اندازه تصویر ندارد.[11] ساختار مقاله به صورت زیر است: در بخش 2، اصول ریاضی، استخراج و پردازش ویژگیها تشریح می شود. در بخش 3 ، عملکرد روش پیشنهادی این مقاله آزموده میشود. برای این کار شبیه سازی در شرایط مختلف پایگاه دادهای، انجام شده پنجمینونتایجعملکرد روش پیشنهادی در تخمین سن، به دست می آید. در بخش4، نتایج به دست آمده از شبیه سازیها مورد بررسی قرار گرفته و کارایی روش پیشنهادی با کارایی روشهای موجود از جهات مختلف مقایسه میشود. بخش پایانی مقاله نیز به نتیجه گیری اختصاص دارد.
-1 روش پیشنهادی کنگره
فرض می کنیم I یک تصویر شامل چهره است که برای هر پیکسل آن می توان نوشت : مشترک در رابطه فوق، Ilj نشان دهنده مقدار شدت روشنایی پیکسلی است که در سطرl ام و ستون j ام قرار گرفته است. علاوه بر این L و J ابعاد تصویر اخذ شده هستند. برای این تصویر، میتوان نوشت: در رابطه - 2 - جمله یا همان , - I - l, j - - گشتاور شبه زرنیک از مرتبه از مرتبه n و تکرار m است که که در آن n=0,1,2,3,… و m مقادیر مثبت و منفی اعداد صحیح را به خود میگیرند که به شکل |m|≤nمحدود شده باشند. از آنجایی که رابطه 2 در عمل بایستی محدود باشد، برای n باید یک
محدودیت قرار دهیم و گشتاورها را بهازای یک محاسبه کنیم. لذا با توجه به شرایط مذکور، رابطه2 به صورت رابطه 3 بازنویسی می شود. - 3 -
همچنین Vnm تابع پایهای چندجمله ای است. گشتاورهای شبه زرنیک از مجموعهای از چندجملهای های مختلط تشکیل یافتهاند[12] و [13] که یک مجموعه متعامد کامل در داخل دایره واحد را شکل میدهند. گشتاورهای شبه زرنیک مختلط دوبعدی ازمرتبه n با تکرار m برای تابع شدت نور تصویر به صورت معادله 4 تعریف میشود [14]و[15]و.[16] در این رابطه l وj به گونهای انتخاب میشوند که.l2 +j2 ≥1 باشد و hnm به صورت رابطه 5 تعریف میشود.