بخشی از مقاله
چکیده
با توسعه سریع فناوریهای تصویربرداری و ارتباطات دیجیبتال، تشخیص چهره بر مبنای مجموعه تصویر، دارای اهمیت گشته است. یکی از نکات کلیدی، چگونگی بیان موثر و مفید مجموعه تصویر درخواستی با استفاده از گالری مجموعه تصویر چهره است. روشهای مبتنی بر فاصله مجموعه به مجموعه، رابطه بین مجموعههای گالری را نادیده میگیرد در حالی که نمایش تصاویر مجموعه درخواستی به صورت مجزا، تشابه میان تصویرهای مجموعه درخواستی را نادیده میگیرد.
در این مقاله یک روش جدید برای دستهبندی گروهی بر اساس مجموعه تصویر معرفی میگردد. با مدلسازی مجموعه درخواستی به عنوان پوش محدب و یا تعمیم یافته، این پوش به صورت مشترک در تمام مجموعه گالری معرفی میگردد. با ضرایب بیان شده ثابت، فاصله بین مجموعه درخواستی و هر دسته گالری را میتوان محاسبه و دستهبندی نمود. مدل ارائه شده، نمایش مشترک بر مبنای تصویر را به یک نمایش مشترک بر مبنای مجموعه تصاویر گسترش میدهد. تجربههای گسترده در زمینه پایگاه های داده مجموعه تصویر نشاندهنده برتری روش ارائه شده نسبت به سایر روشهای مختلف میباشد.
-1 مقدمه
در سالهای اخیر طبقه بندی بر اساس مجموعه تصویر به صورت افزایندهای در تشخیص چهره کاربرد داشته است.[1-2] با توجه به توسعه سریع عکسبرداری دیجیتال و روشهای ارتباطی، مجموعههای تصویر را میتوان به آسانی از عکسهای چند نمایشی به کمک دوربینهای چندگانه جمعآوری، مشاهدههای بلند مدت، آلبومهای شخصی و تصاویر اخبار و غیره جمعآوری نمود. در عین حال، تشخیص چهره بر مبنای مجموعه تصاویر1 - ISFR - دارای عملکرد عالی نسبت به تشخیص چهره برمبنای تک تصویر است زیرا نمونه های زیاد تصاویر باعث می شود که ما به سمت کلاس مورد نظر هدایت شویم .[3] یک نمونه از ISFR، تشخیص چهره برمبنای ویدئو است که تصاویر مجموعه چهره را از دنباله ویدئو متوالی تعقیب مینماید 1]،4،.[5 در این مقاله، تمرکز بر روی نوع کلی ISFR بدون در نظر گرفتن روابط زمانی نمونهها در هر مجموعه است.[3]
مهم نیست که مجموعه چگونه مدلسازی میشود، در اکثر کارهای پیشین1]،3،6،[7، مجموعه درخواستی با هر مجموعه موجود در گالری به صورت مجزا بررسی میگردد و سپس به کلاس نزدیک به آن طبقهبندی میشد. این نمونه از طبقهبندی-ها، برخلاف نزدیکترین همسایه و یا نزدیکترین زیرفضای طبقهبندی شده در تشخیص چهره مبتنی بر تک تصویر، رابطه میان مجموعههای گالری را در نظر نمیگیرد.
در سالهای اخیر، طبقهبندی بر اساس نمایش تنک - SRC - 2 نتایج جالبی را در تشخیص چهره مبتنی بر تصویر نشان داده استSRC .[8] به نمایش یک چهره درخواست داده شده به عنوان ترکیب خطی نمونهها از تمام کلاسها میپردازد و آن را در کلاسی که دارای کمترین باقیمانده نمایش داده شده نسبت به آن است، طبقهبندی مینماید. از طریق SRC که بیشتر به نقش پراکندگی نرم l1 ضرایب بیان شده تاکید مینماید، مکانیزم نمایش مشترک - برای مثال استفاده از نمونهها از تمام کلاسها برای نمایش تصویر درخواستی - دارای اهمیت بیشتری نسبت به موفقیت SRC میباشد.[9] طبقهبندی بر اساس نمایش مشترک3 - CRC - با منظمسازی l2 منجر به نتایج مشابه با SRC ولی با هزینه محاسباتی بسیار کمتر میگردد.[9]
ممکن است با معرفی هر تصویر از مجموعه درخواستی بر روی تمام مجموعههای گالری و سپس استفاده از باقیمانده نماینده میانگین و یا مینیمم تصویرهای مجموعه درخواستی برای طبقه- بندی، SRC/CRC به ISFR اعمال گردد. اگر باقیمانده نماینده میانگین در طبقهبندی استفاده شود، پراکندگی باقیماندههای نماینده در کلاسهای مختلف کاهش مییابد. اگر باقیمانده نماینده مینیمم استفاده شود، طبقهبندی از عکسهای پرت در مجموعه درخواستی دچار مشکل می شود. به علاوه، در یک مجموعه تصویر، حشو وجود دارد. این حشوها باعث فضای ذخیره زیاد و پیچیدگیهای محاسباتی میگردد و عملکرد شناخت را تضغیف مینماید. در این مقاله، یک روش نوین نماینده و طبقه بندی مشترک برمبنای مجموعه تصاویر، ارائه می گردد.[10]
در بخش بعد، ریاضیات مربوط به کار توضیح داده می شود. در بخش سوم، روش پیشنهادی و الگوریتم پیشنهادی ارائه می شود و در نهایت در بخش چهارم، نتیجه گیری از مباحث ارائه می گردد. صورت متفاوتی در مجموعهها و همچنین فرآیند طبقهبندی رفتار کنند، با مینیمم نمودن فاصله بین a و b ، دادههای پرت - مانند یک فریم با خطای زیاد - در هر دو مجموعه و با ضرایب نماینده بسیار کوچک تخصیص داده میشوند.
-2 فاصله بین مجموعهها و طبقهبندی براساس نمایش مشترک
در تشخیص چهره بر مبنای مجموعه تصویر، یک مجموعه درخواستی و مجموعههای گالری چندگانه و 1,2,...,K k وجود دارد. یک حقیقت در تشخیص چهره این است که تصاویر چهره در افراد گوناگون دارای شباهت های زیادی است. اگر فاصله بین و هر را با روشهایی مانند فاصله مجموعه به مجموعه مبتنی بر پوش محاسبه نماییم، رابطه بین مجموعههای گالری مختلف مورد استفاده قرار نمیگیرد.