بخشی از مقاله
چکیده :
تشخیص اصالت افراد از روی ویژگی های بیومتریک یکی از ابزار های ضروری برای انجام عملیات بانکی و ثبت اسناد می باشد. در این تحقیق ابتدا ویژگی های آماری امضاء محاسبه شده و با ماشین بردار پشتیبان تشخیص داده می شود. ویژگی های فازی امضاء نیز به منظور افزایش دقت به ویژگی ها افزوده می شود. نتایج نشان دهنده بهبود نتایج در اثر استفاده از ویژگی های فازی امضاء برای تشخیص می باشد. پایگاه داده مورد استفاده MLCM دانشگاه تهران می باشد.
-1 مقدمه
بیومتریک علم شناسایی افراد از طریق مشخصات انسانی اوست که شامل اثرانگشت، کف دست، صورت، امضاء، دست خط، اسکن عنبیه و شبکیه، صدا و غیره است. در علم بیومتریک اعضایی از بدن مورد توجه قرار گرفته که استفاده از آنها راحتتر و کم ضررتر باشد. تشخیص افراد از امضاء شخص از زمانهای قدیم مورد استفاده قرار می گرفته است.
در این تحقیق برای تشخص افراد از امضاء افراد استفاده شده است. با توجه به این که افراد می توانند امضاء یکدیگر را تقلید کنند تشخیص اصالت امضاء بسیار مهم است. ممکن است شخصی غیر از فرد اصلی امضاءئی را جعل کند که خیلی شبیه امضاء واقعی باشد. هدف از این تحقیق استفاده از ماشین بردار پشتیبان برای تشخیص جعل امضاء می باشد.
در این تحقیق در ابتدا ماشین بردار پشتیبان معرفی می شود و بعد ویژگی های آماری و ویژگی های فازی امضاء معرفی می شود و در نهایت نتایج ارائه می گردد.
-2 ماشین بردار پشتیبانی - Support vector machines - SVMs -
این روش یکی از روش های تشخیص جدیدی می باشد که نسبت به شبکه عصبی قدرت بیشتری در تشخیص دارد. برای پیاده سازی ماشین بردار پشتیبان خانواده بزرگی از مرزها وجود دارند که رابطه وسعت و تعمیمپذیری یک ماشین یادگیری و کارایی آن را مشخص میسازند.
فرض کنیم که تعداد l نمونه در اختیار داریم که هر کدام به صورت یک یک زوج شامل یک بردار و یک دسته مرتبط هستند. این عناصر در هر مساله ممکن است نمایندهچیزی باشند. مثلاً در مساله تشخیص درخت، بردار میتواند نماینده برداری از پیکسلها بوده و دسته آن 1 - برای حالاتی که تصویر شامل درخت است - و -1 برای حالاتی که تصویر شامل درخت نیست باشد، از -1 به جای صفر استفاده میکنیم تا اینکه در محاسبه فرمولهایی که بعداً خواهد آمد راحتتر عمل کنیم. فرض میکنیم که یک تابع توزیع احتمال شناخته نشده P - x,y - وجود دارد که دادهها بر طبق آن توزیع شدهاند. فرض ما این است که دادهها مستقل هستند و به طور یکنواخت توزیع شدهاند.
حال فرض میکنیم که ماشین در اختیار داریم که وظیفه آن یادگیری نگاشت X i yi است. این ماشین در واقع توسط مجموعهای از نگاشتهای x f - x, - تعریف شده است که توابع F - x,a - خود توسط پارامتر a تنظیم میشوند. این ماشین، یک ماشین قطعی فرض میشود. برای ورودی x و یک انتخاب مشخص a، همواره خروجی یکسانی بدست میدهد. یک انتخاب خاص a ماشینی را به ما میدهد که آن را ماشین آموزش داده شده مینامیم. مثلاً یک شبکه عصبی با یک معماری و ساختار ثابت، زمانی که a در آن متناظر با وزنها و مقدار بایاس باشد، یک ماشین یادگیری است. بنابراین مقدار میانگین خطای قسمت برای یک ماشین آموزش داده شده عبارت است از:
بعد VC ویژگی مجموعهای از توابع به صورت {f - a - } میباشد - در آن a را به عنوان یک پارامتر عمومی مطرح کردهایم که انتخاب آن، یک تابع خاص را مشخص میکند - و میتواند برای کلاسهای مختلف تابع f تعریف شود. در اینجا ما تنها توابعی را در نظر میگیریم که متناظر با مساله تشخیص الگوی دو کلاسه هستند به طوریکه f - x, - اکنون مجموعهای از l نقطه بتوانند به همه صورتهای 2 به توان l برچسب گذاری شوند و به ازای هر برچسبگذاری شوند و به ازای هر برچسبگذاری عضوی از مجموعه {f - a - } را میتوان یافت که این برچسبها را به درستی تخصیص دهد، میگوییم آن مجموعه نقاط توسط آن مجموعه توابع خود شده است
بعد VC برای مجموعه توابع {f - a - } به صورت حداکثر تعداد نقاطی تعریف میشود که توسط این مجموعه توابع خرد میشوند. توجه کنید که در صورتی که بعد VC برابر با h باشد، این بدان معنی است که حداقل یک مجموعه از h نقطه وجود دارد که میتواند خرد شود، اما به طور کلی نمیتوان گفت که هر مجموعه h نقطهای میتواند خرد شود.
فرض کنید که فضای مورد بررسی ما فضای 5A2 و مجموعه توابع {f - a - } شامل مجموعه خطهای راست در این فضا باشد. به این صورت که به ازای یک خط راست، همه نقاط واقع در یک طرف خط به کلاس 1 دهنه نقاط طرف دیگر به کلاس -1 متعلق باشند. جهت این تعلق هم با یک فلش روی خط مشخص میباشد هر چند که میتوان سه نقطه یافت که توسط این مجموعه خطوط خرد شوند، اما نمیتوان 4 نقطه با این ویژگی پیدا کرد. بنابراین بعد VC مجموعه خطوط راست در فضای 5A2 برابر با سه است
حال ابر صفحات واقع در فضای Rn را در نظر بگیرید. قضیه زیر در مورد آنها صادق میباشد.
قضیه :1 مجموعهای از m نقطه را در فضای Rn در نظر بگیرید. هر یک نقطه دلخواه را به عنوان مبدا در نظر بگیرید. در این صورت m نقطه میتوانند توسط ابرصفحهها خرد شوند اگر و فقط اگر بردار نقاط باقی مانده به طور خطی مستقل باشند.
از قضیه بالا نتیجه میشود که بعد VC در فضای Rn برابر با Q+1 میباشد، زیرا میتوانیم Q+1 نقطه را انتخاب کرده، یکی را به عنوان مبدا قرار دهیم و n نقطه باقیمانده به طور خطی مستقل از یکدیگر باشند. اما هرگز نمیتوانیم Q+2 نقطه با این خصوصیت بیابیم زیرا هیچ Q+1 نقطه در فضای Rn به طور خطی مستقل نیستند.
-3 منطق فازی
منطق فازی برای اعداد دقیق مقادیر فازی را جایگزین می کند. این روش نمایانگر ویژگی های زبانی انسان می باشد. مثلا برای پارک کردن ماشین عبارت کمی به راست بچرخانید، نمایانگر مقداری است که همه انسان ها متوجه می شوند ولی هیچ مقدار عددی در آن ذکر نشده است. در این مقاله منطق فازی به عنوان ابزاری برای توصیف انحنای امضاء استفاده شده است. مقادیر زبانی فازی به اعداد طبیعی نگاشت می شوند و برای آموزش ماشین بردار پشتیبان مورد استفاده قرار می گیرند.
توابع عضویت فازی مورد استفاده در تشخیص امضاء در شکل 2 نشان داده شده است که به صورت زنگوله ای میباشد.فرمول تابع عضویت فازی مورد استفاده در این تحقیق به صورت - 2 - می باشد.
شکل -2 نمودار توابع عضویت فازی