بخشی از مقاله

چکیده

امروزه مساله اسپم یکی از مسائل مهم در حوزه ارتباطات اینترنتی میباشد و هزینههای قابل توجهی را بر کشورها و اشخاص تحمیل میکند. برای مقابله با اسپم روشهای متعددی ارائه شدهاست که مهمترین آن طراحی فیلتر میباشد اما برای ایمیلهای فارسی تا حالا هیچ فیلتری طراحی نشده است. در این مقاله یک فیلتر ترکیبی که شامل فیلترهای لیست سیاه،لیست سفید و بیزی میباشد برای مقابله با اسپمهای فارسی ارائه شده است. نتایج پیادهسازی نشان میدهد که فیلتر مورد نظر از کارائی قابل توجهی برخوردار است هرچند که در مقایسه با زبان انگلیسی درصد خطای بیشتری دارد.

مقدمه

اسپم معمولا به ایمیلهای تقاضانشده و یا ایمیلهای تجاری تقاضانشده اشاره میکند که یک روش ارزان و سریع برای بازاریابی در وب سایت های تجاری میباشد. اسپم یک مشکل اصلی برای کاربران ایمیل و فراهم کنندگان سرویس ایمیل میباشد. اسپم ها به طور پیوسته صندوق ورودی کاربران را پر میکنند و هیچ فضای خالی را برای ایمیلهای قانونی, باقی نمیگذارند.

اسپم ها ,به طور پیوسته باعث هزینه در سازمانها می شوند برای مثال زمان قابل ملاحظه تلف شده برای چک کردن و حذف کردن اسپم از کامپیوترشان. اسپمها هم چنین باعث استفاده نادرست از پهنای باند شبکه میشود. از آن جا که اسپم ها به طور پیوسته, نرخ ترافیک را افزایش میدهند، دسترسی به اینترنت کمتر و کمتر میشود. طبق آمار 2002 استفاده از اینترنت برای اهداف تجاری 26 درصد از تجارت ملی و آنلاین در استرالیا میباشد.

یک سازمان نظارت بر اسپم ,گزارش داده است که از هر سیزده پیام, ده تای آن ها اسپم می باشد! تخمینهای اخیر نشان می-دهد که هزینه هر پیام اسپم,حدود 900دلار استرالیا است که جهت افزایش زمان دانلود و دسترسی به اینترنت، صرف هر یک کاربر در هر سال می شود. از سال 2001 تا 2002 افزایش 300درصدی اسپم مشاهده شده است. - - ABS,2002 تحقیقات انجمن اروپایی راجع به ارتباطات تجاری تقاضانشده و مورد تقاضا نشان میدهد که هزینه اینترنتی اسپم کاربران,تقریبا 16میلیون دلار در یک سال در جهان می باشد. - - NACPEC,2005

در ژانویه 2003و 2004 کنفرانسی با موضوع اسپم در دانشگاه ماسوچست بر علیه ایمیلهای تجاری ناخواسته برگزار شد. از طرفی دانشمندان تلاش میکنند تا قانونی وضع کنند تا اسپم را در سطح بین المللی غیرقانونی نشان دهند و از طرفی تلاش میکنند با ایجاد اسپم فیلترها با اسپم ها مبارزه کنند. - - CAUCE,2003 اسپم فیلتر،محتوای پیام های ورودی را چک میکند اگر شامل کلماتی مشکوک باشد در این صورت پیام بلوکه میشود. اسپم فیلتر از رسیدن اسپم به گیرنده جلوگیری میکند.

تلاش برای طراحی فیلتری است که اجازه دهد ایمیلهای خواسته شده بتوانند عبور کنند در حالی که در همان مدت زمان اسپم ها بلوکه میشوند. آشکار است که ممکن است خطاهایی رخ دهد فیلتر ممکن است ایمیلهای قانونی را به عنوان اسپم شناسایی کند و آن را بلوکه کند یا ممکن است - Thiago,2009 - به عنوان یک ایمیل فانونی شناسایی کتد و به آن اجازه عبور دهد. فیلتر ها ممکن است در سطح کاربر یا در سطح سرور باشند.

برای مقابله با اسپم های مزاحم روش های متعددی وجود دارد که از این میان طراحی فیلتر در واقع کارآترین رویکرد می باشد. بنابراین درمورد اسپم های فارسی نیز باید به دنبال طراحی یک فیلتر کارآرا بود. البته با توجه به یافته های نویسندگان تا حالا هیچ فیلتری جهت مقابله با اسپم های فارسی طراحی نشده است و اولین بار در قالب این مقاله انجام میگیرد.

فیلتری که قرار است جهت مقابله با اسپم های فارسی در این مقاله، طراحی شود از ترکیب سه فیلتر مجزا تشکیل یافته ×است:

 الف - لیست سیاه

ب - لیست سفید

 ج - روش بیز

به محض ورود ایمیل جدید ابتدا آدرس فرستنده با لیست سفید تطابق داده میشود چنانچه آدرس مذکور در لیست سفید قرار داشت آن ایمیل بدون بررسی محتوایش به عنوان ایمیل سالم شناخته شده و به جعبه ورودی فرستاده میشود و در غیر اینصورت با لیست سیاه تطابق داده میشود چنانچه آدرس مذکور در لیست سیاه قرار داشت آن ایمیل بدون بررسی محتوایش به عنوان ایمیل اسپم شناخته شده و به جعبه اسپم فرستاده میشود. اگر آدرس فرستنده نه در لیست سفید و نه در لیست سیاه قرار داشته باشد آنگاه جهت بررسی محتوایش به فیلتر بیزی تحویل داده میشود تا بر اساس محتوا اسپم بودن یا نبودنش مشخص شود .

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید