بخشی از مقاله

*** اين فايل شامل تعدادي فرمول مي باشد و در سايت قابل نمايش نيست ***

 

بهبود کارائی تصدیق هویت با تلفیق ویژگی فیزیکی صوتی و ویژگی رفتاری نحوه تایپ کاربران


چکیده: در بسیاری از کاربردها دسترسی افراد به برخی از امکانات بایستی کنترل شود. از دیرباز استفاده از رمزهای عبور جهت حل مشکل فوق مرسوم بوده است. در طی سالهای اخیر مطالعات گسترده ای جهت استفاده از ویژگیهای بیومتریک انجام شده است. استفاده از ویژگیهای گفتاری کاربران و ویژگیهای رفتاری نحوه تایپ کاربران نمونه ای از این ویژگیها میباشند. در این مقاله، سیستم ترکیبی ارایه شده است که از هر دو ویژگی فوق جهت نصدیق هویت کاربران استفاده میکند. نتایج پیاده سازی سیستم ترکیبی بر روی دادگانی مشتمل بر ١٥ کابر نشاندهنده کارایی سیستم ترکیبی میباشد. در سیستم ترکیبی از ماشین بردار پشتیبان جهت پیادهسازی زیرسیستم تصدیق هویت گوینده و از شبکه عصبی MLP جهت پیادهسازی زیرسیستم تصدیق هویت کاربر به کمک ویژگیهای نحوه تایپ کاربران استفاده شده است.
در مرحله آزمایش از کاربران خواسته میشود پس از وارد نمودن کد شناسایی خود از طریق صفحه کلید، عبارتی را نیز بیان نمایند. امتیازات حاصل از دو زیرسیستم فوق به کمک یک رابطه خطی وزندار شده ترکیب میشوند و به کمک امتیاز حاصل، کاربر تصدیق یا رد میگردد.
کلمات کلیدی: تصدیق هویت گوینده, نحوه تایپ کاربران, مدل مخلوط گوسی, ماشین بردار پشتیبان, شبکه عصبی چند لایه پرسپترون, چندی سازی برداری

١- مقدمه
امروزه استفاده شبکه از سیستمها و شبکه های کامپیوتری در بسیاری از زمینههای تحقیقاتی، علمی، اقتصادی و صنعتی متداول است. به طور کلی میتوان گفت وابستگی انسانها به کامپیوتر بسیار زیاد شده است.
بسیاریشراز سازمانها و کتهای بزرگ اطلاعات مهم و محرمانه خود را بر روی کامپیوترها نگهداری میکنند. بدیهی است که مسئله امنیت این سیستمها دارای اهمیت بسیار زیادی است به طوریکه می بایست دسترسی افراد به آنها با مکانیزم های مناسبی کنترل شود.
همچنین در موارد بسیاری چون کنترل دسترسی افراد به اماکن و نیز برای کنترل دسترسی به اطلاعات و سرویس ها از طریق کامپیوتر و اینترنت لازم است که ابتدا هویت فرد کنترل و سپس اجاره دستری به او داده شود. کنترل و تصدیق هویت افراد به روشهای مختلفی امکان پذیر است که از استفاده از امکاناتی چون کلید، کارت شناسایی و گذرنامه، استفاده از رمز عبور، استفاده از روشهای بیومتریک مانند اثر انگشت، عنبیه، صدا و مانند آن از جمله این مواردند. علاوه بر اینها در محیطراهای شبکهای اطلاعات رمزنگاری١ میکنند و اطلاعات لازم برای رمزگشایی را در اختیار افراد مجاز قرار میدهند. به این ترتیب یک کاربر غیر مجاز حتی با دردست داشتن اطلاعات قادر به درک آنها نیست.
همانطور که میدانیم روشهای بیومتریک بر ویژگیهای فردی مبتنی هستند.میاین ویژگیها را توان در دو دسته فیزیکی و رفتاری قرار داد. بیومتریک فیزیکی مبتنی بر ویژگیهای فیزیکی فرد مانند اثر انگشت، خصوصیات عنبیه، هندسه انگشنان دست و حالت چهره میباشد. بیومتریکهای رفتاری، رفتار خاصی از افراد را مورد توجه قرار میدهند به طوریکه بر اساس نوع رفتار تعریف شده، نوع بیومتریک تعریف میشود. از جمله این رفتارها میتوان به نحوه امضاﺀ کردن، نحوه تایپ کردن و نحوه کار کردن با موشواره کامپیوتر اشاره کرد. همانطور که میدانیم به کار بردن کلمه عبور یک روش قدیمی و متداول برای دسترسی به بسیاری از سیستمهای کامپیوتری میباشد. اگر هر فرد دیگری این کلمه را بداند میتواند بهراحتی وارد سیستم مذکور شود.
بنابراین روش مذکور را باید بهگونهای مجهز کرد که دارای قابلیت اطمینان بالاتری باشد. یکراه انجام این کار آن است که ویژگیهای رفتاری فرد در وارد کردن رمز عبور از طریق تایپ آن را با ویژگیهای فیزیکی بیومتریک فرد تلفیق نمود و بدین ترتیب بر دقت و صحت تصدیق هویت افزود.
این مقاله به بررسی رفتار کاربر در وارد کردن رمز عبور از طریق کی بورد و چکونگی تاثیر تلفیق آن با وِیژگیهای صوتی کاربر می پردازد. در بخش ٢ به تصدیق هویت با استفاده از ویژگیهای رفتاری کاربران در تایپ رمز عبور می پردازیم. بخش ٣ به ماشین بردار پشتیبان اختصاص دارد. بخش ٤ به دادگان مورد استفاده و استخراج ویژگی, بخش ۵ چگونگی پیاده سازی هر یک از روشهای فوق و تلفیق آنها و نیز انجام آزمایشاتی برای بررسی میزان بهبود حاصل از این دو روش را تشریح می نماید. و نهایتا بخش آخر به نتیجه گیری از این مقاله می پردازد.

٢- تصدیق هویت با استفاده از ویژگیهای رفتاری نحوه
تایپ رمز عبور
آنچه در نحوه تایپ کردن مهم است زمانهای فشردن و رها کردن کلیدها توسط کاربر است. این زمانها را با استفاده از وقفه های سیستم عامل میتوان به دست آورد و بهعنوان اطلاعات خام ثبت کرد. در مرحله جمعآوری دادهها از کاربر خواسته می شود که عبارتی (عبارتهایی) را بارها تایپ کند و بر اساس زمانهای ثبت شده، برای هر کاربر الگویی استخراج می شود. سعی می شود این عبارات حتیالامکان کوتاه و ساده باشند تا کاربر بتواند آنها را به راحتی به یاد آورد. ثابت شدهاست که اسامی افراد برای این منظور مناسبترین انتخاب میباشد.[1] از الگوی مذکور در سیستم واقعی میتوان برای است تأیید یا رد هویت فردی که قصد ورود به سیستم را دارد استفاده کرد. به مراحل مذکور در شکل ١ نشان داده شدهاند.

در تحقیقی که در سال ١٩٩٠ انجام شد[2]، از کاربران خواسته شد که دو عبارت شامل نام کاربری و یک عبارت ثابت را بهعنوان کلمه عبور خود وارد کنند. تعداد افراد شرکتکننده نه نفر بود که طی نه هفته و در سه نوبت اطلاعات مربوط به نحوه تایپ آنها جمعآوری شد. در این سیستم و در همه تحقیقات انجام شده، در مرحله جمع آوری اطلاعات، اگر کاربری اطلاعات مربوطه را نادرست وارد کند اطلاعات مزبور در نظر گرفته نمیشوند و از کاربر خواسته میشود که اطلاعات را دوباره وارد کند. نتایج حاصل از این سیستم نشان داد که استفاده از نام کاربری بهعنوان کلمهعبور، به رغم کوتاهتر بودن از عبارت ثابت مناسبتر است زیرا هر فرد با نحوه نوشتن نام خود آشناتر است تا سایر عبارات. در این تحقیق فاصله زمانی بین کلیدها بهعنوان ویژگی در نظر گرفته شد و طبقهبندی کننده بیز٢بر دادهها اعمال شد. در این تحقیق خطای رد گوینده مجاز یا ٣FR %١,٣ و خطای قبول گوینده غیر مجاز یا FA٤ ، %٥,٠ بود. در تحقیقی دیگر ١٥ کاربر در آزمایش ها شرکت کردند.[3]
هر کاربر ١٥ بار نام کاربری خود را وارد کرد. با استفاده از یک روش ترکیبی فازی، شبکه عصبی و آماری، FR این سیستم ٢% و FA آن ٦% بوده است. در تحقیق صورت گرفته در مرجع [4] نیز با شرکت ١٠ کاربر در آزمایش ها به مدت یک ماه و به کار بردن رمز دلخواه، با استفاده از شبکه عصبی، FR برابر ١% و FA برابر ٢٣% به دست آمد.
در این مقاله به منظور مدل کردن سیستم، از یک شبکه عصبی استفاده شد که بردار ویژگی طراحی شده بهعنوان ورودی آن در نظر گرفته شد.
شبکه مورد استفاده از نوع شبکه چند لایه پرسپترونی یا MLP٥ میباشد. این شبکه شامل چندین لایه از نورونها میباشد که تعداد این لایهها دلخواه . معمولاﹰ اتصالات بین هر دو لایه کامل است. هر نورون میتواند مقداری عنوان بایاس بپذیرد. در شکل زیر نمونهای از این نوع شبکه عصبی نشان داده شده است.

٣- ماشین بردار پشتیبان٦
ماشین بردار پشتیبان یا SVM یک کلاس بندیکننده باینری می- باشد که هدف آن پیدا کردن ابرصفحه با حداکثر حاشیه است. در این روش روابط ابرصفحه جدا کننده و تابع تصمیم گیری به صورت زیر رائه میشوند:

در روابط فوق بردار وزن w ، بردار عمود بر ابرصفحه جدا کننده و b مقدار بایاس میباشد. یکی از مهمترین ویژگیهای SVM مدل کردن توابع تمایز غیرخطی با استفاده از هسته های غیرخطی و مفهوم حاصل ضرب داخلی در فضای هیلبرت میباشد. در کلیترین حالت یعنی حالت جدایی ناپذیر و غیرخطی، مساله ماشین بردار پشتیبان به صورت زیر میباشد:

در رابطه فوق αi ضریب لاگرانژ و φ تابع هسته اعمالی بر روی الگوها میباشد. جهت توضیح بیشتر در خصوص ماشین بردار پشتیبان میتوان به مراجع ]٦[ و ]٧[ مراجعه نمود. همانطور که گفته شد SVM، اساساﹰ یک کلاسبندیکننده تمایزیِ باینری میباشد. از آنجا که تصدیق هویت گوینده، مسألهای چندکلاسه میباشد، جهت استفاده از SVM در کاربرد فوق بایستی تغییراتی در نحوه استفاده از آن داشته باشیم.
معمولاﹰ جهت استفاده از SVM در کاربردهای چند کلاسه، از سه رویکرد زیر استفاده میشود:

• روش یک در مقابل بقیه.
• روش زوج-زوج٧.
• بکارگیری توابع هدف چند کلاسه.
در این مقاله از رویکرد اول استفاده شده است.[6] به عبارت دیگر، بازاﺀ هر کلاس، یک ماشین بردار پشتیبان جهت جداسازی نمونههای آن کلاس از نمونههای سایر کلاسها، آموزش داده شده است. بردارهای آموزشی کلاس مدنظر با برچسب ١+ و دادههای آموزشی سایر کلاسها با برچسب ١- مشخص میشوند. از اجتماع نمونههای فوق جهت آموزش SVM استفاده میشود.

٤- دادگان مورد استفاده و استخراج ویژگی
تعداد افراد شرکتکننده در مرحله جمعآوری اطلاعات برای این سیستم ١٥ نفر میباشند. از این افراد خواسته شد در سه جلسه جداگانه، در هر جلسه شماره دانشجویی خود را که یک عدد هشت رقمی است، به عنوان نام کاربری خود ده بار وارد کنند. برای تعیین یا تأیید هویت کاربر از روی نحوه تایپ کردن، اطلاعات زمانهای فشردن و رها کردن کلیدها میتوانند مفید واقع شوند. هنگامی که فرد تایپ میکند، دو نوع زمان قابل ثبت کردن است: زمان فشردن و زمان رها کردن کلیدها. میتوان از زمان فشردن یا رهاکردن کلیدها در ساختن بردار ویژگی هر فرد استفاده کرد. در تحقیق [2] نشان داده شدهاست که به کاربردن ترکیبی از این دو زمان، دقت بالاتری را در سیستم موجب میشود. برای سیستم پیشنهادی در این مقاله نیز، ترکیبی از هر دو زمان یعنی مدت زمان فشردن یک کلید و فاصله زمانی رهاکردن یک کلید تا فشردن کلید بعدی برای همه کلیدها در کنار هم که از روی زمانهای ثبت شده قاب محاسبه هستند بهعنوان بردار ویژگی در نظر گرفته شد. در طی سه جلسه گفتار ١٥ کاربر فوق توسط یک اینترفیس میکروفنی ضبط شده است. هر یک از گویندگان به طور متوسط در هر یک از جلسات ٣٠ ثانیه صحبت نمودهاند. از سیگنال گفتار یکی از جلسات گویندگان جهت آموزش مدلهای مستقل از متن استفاده شده است و از اطلاعات گفتاری دو جلسه دیگر جهت آزمایش سیستم استفاده شده است. به عبارت دیگر ٣٠ ثانیه گقتار جهت آموزش مدل هر یک از گویندگان استفاده شده است.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید