مقاله تشخیص اسپم با روش ترکیبی بهینه سازی ذرات تجمعی و چند همسایگی نزدیک

فایل pdf

8 صفحه

قیمت مقاله 000 49 تومان

شرکت مگ ایرانز ضمانت می کند تا 48 ساعت ،اگر به هر دلیلی از خرید خود ناراضی بودید ، مبلغ آن به صورت کامل و بدون چون و چرا، برگشت داده شود .جهت درخواست برگشت وجه ، با پشتیبانی تماس بگیرید .

بخشی از مقاله

چکیده

امروزه ایمیل به یکی از رایجترین ابزار ارتباطی در زندگی روزمره بشر تبدیل شده است. این ارتباط چه مکالمه ساده دوستانه باشد چه موضوع مهم تجاری، روشی سریع و ارزان قیمت برای برقراری ارتباط است. متاسفانه همین عمومیت و سادگی استفاده از ایمیل باعث شده تا مورد استفاده اسپمرها و کلاهبرداران اینترنتی قرار بگیرد. از آن جایی که ارسال میلیونی اسپم باعث آزار کاربر، اتلاف زمان، هزینه، منابع شبکه و پهنای باند میشود. بنابراین اسپم به یک مشکل جدی تبدیل شده است.

لذا روشها و الگوریتمهای زیادی برای جلوگیری و فیلتر اسپم پیشنهاد شده است. هدف اصلی افزایش دقت روش تشخیص اسپم در ایمیل است. در این مقاله عمل تشخیص اسپم با استفاده از اعمال تحلیل مولفه اصلی و ترکیب بهینهسازی ذرات تجمعی و چندهمسایگی نزدیک مورد بررسی قرار گرفته است. میانگین دقت، میانگین یادآوری و میانگین صحت دستهبندی، اصلیترین معیارهای ارزیابی مربوط به دستهبندی و پیشبینی نمونهها در فاز آموزش بر روی مجموعه داده لینگ اسپم است. نرخ تشخیص بدست آمده در روش پیشنهادی 91.70 درصد است.

-1 مقدمه

ایمیل یک وسیله ارتباطی سریع و کمهزینه میباشد که باعث گسترش ارتباطات بین افراد و سازمانها میشود ولی به وجودآمدن نامههای ناخواسته موجب آزار کاربران و پایینآمدن کارایی شده است. امروزه این نامههای ناخواسته که به عنوان اسپم شناخته میشوند، به مشکل عمدهای تبدیل شدهاند. اسپمها منابع شبکه و کامپیوترها و زمان انسان را تلف میکنند و برای شناسایی و جلوگیری از اسپمها تلاشهای زیادی صورت گرفته است، ولی با پیشرفت این تلاشها اسپمها باز هم گسترش و پیشرفت میکنند. بر آن شدیم تا روشی پیشنهادی برای جلوگیری از این مشکل با استفاده از ترکیب الگوریتم بهینهسازی ذرات تجمعی و چندهمسایگی نزدیک ارائه دهیم.

الگوریتم بهینهسازی ذرات تجمعی3 اولین بار توسط راسل ابرهارت 4 و جیمز کندی5 در سال 1995 ارائه شد. یک الگوریتم بهینهسازی فرااکتشافی است. الگوریتم جستجوی اجتماعی است که از روی رفتار اجتماعی دستههای پرندگان مدل شده است. تغییر مکان ذرات در فضای جستجو تحت تأثیر تجربه و دانش خود و همسایگان آنها است. بنابراین موقعیت دیگر توده ذرات روی چگونگی جستجو یک ذره اثر میگذارد.[4] از مهمترین مزیتهای الگوریتم بهینهسازی ذرات تجمعی این است که یک روش مبتنی بر جمعیت است و همگرایی نسبتا سریعی دارد.[8]

دستهبندی،6 تکنیک دادهکاوی است که برای پیشبینی اعضای گروهها برای نمونه دادهها استفاده میشود. برای فیلتر ایمیلهای اسپم از تکنیکهای دستهبندی استفاده میشود. تکنیکهای دستهبندی، داده را براساس الگوهای مشابه به گروهها تقسیم میکند.[3] چندهمسایگی نزدیک7 سادهترین و متداولترین روش دستهبندی برپایه یادگیری نمونه است. از مهمترین مزیتهای این دستهبند میتوان به سادگی آن در الگوریتم و پیادهسازی اشاره کرد که این سادگی باعث بالا رفتن پیچیدگی زمانی الگوریتم شده است. در بخش - 2 - طراحی اصلی روش پیشنهادی را مرحله به مرحله شرح خواهیم داد. در بخش - 3 - و - 4 - مجموعهداده و معیارهای ارزیابی را معرفی خواهیم کرد. در بخش - 5 - و - 6 - آزمایش و نتیجهگیری را بیان خواهیم کرد.

-2 طراحی اصلی روش پیشنهادی

1-2 پیش پردازش

تکتک کلمات هر متن پیام غیراسپم و اسپم را از هم تفکیک میکنیم. در دادهکاوی و مبحث پیش پردازش ایمیلها میبایست حذف کلمات توقفی مورد توجه قرار گیرد. مهمترین مزیت آن کاهش بعد دادهها به منظور افزایش دقت پیشگویی در دستهبندی است. حذف کلمات توقفی، عبارت از فرآیند خذف کلمات اضافه تکراری مانند "A,The,For,And" است. تعداد تکرار هر کلمه در هر مستند بدست آمده است. این کار بعد از حذف کلمات توقفی انجام میشود. تعداد ویژگی استخراج شده یا کلمات برابر با 8345 میباشد.

یک حد آستانه تعریف شده و ویژگیهایی که کمتر از حد آستانه دیده شدند جهت بالا بردن دقت و سرعت حذف شدند، و تعداد ویژگیها به 6165 کاهش پیدا نمود. با استفاده از روش وزندهی [2] TFCRF به هر ویژگی در هر مستند یک وزن اختصاص داده شد. برای وزندهی دقیقتر به ویژگیها دو فاکتور ارتباط مثبت8 و فاکتور ارتباط منفی9 تعریف شده است. فاکتور ارتباط مثبت: نسبت تعداد مستنداتی از طبقه را که ویژگی را دارند به کل مستندات آن طبقه نشان میدهد. فاکتور ارتباط منفی: نسبت مجموعه تعداد مستنداتی از طبقه غیر از را که ویژگی را دارند به کل مجموع مستندات طبقات غیر را نشان میدهد.

2-2 استخراج ویژگی

در این مرحله یک طرح کاهش ابعاد را روی دادهها برای استخراج ویژگی انجام میدهیم که به آن تحلیل مولفه های اصلی[7] 11 گفته میشود. فرض کنید مجموعه داده = { | ∈ } وجود دارد که به صورت ماتریس ∗ قابل نمایش است. در این ماتریس N تعداد دادهها و n بعد هر داده است. ممکن است دامنه یک ویژگی بسیار بیشتر از ویژگی دیگر باشد و کل نتیجه را تحت تاثیر قرار دهد. برای این کار دادهها به صورت رابطه - 6 - نرمالسازی میشوند.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید

ادرس کوتاه https://magirans.com/id/78942

مقالت رو پیدا نکردی ؟

ما رایگان واست سرچ میکنیم .فقط کافیه موضوع و شماره موبایلت را در کادر ثبت موضوع ، وارد کنی و تمام . ما لیستی از بهترین عناوین که مرتبط با موضوع شماست را در (روبیکا ، ایگپ ، ایتا یا واتساپ) تقدیمتون میکنیم.

ثبت موضوع

با تشکر از شما
درخواست بررسی موضوع مقاله شما با موفقیت ثبت گردید . کارشناسان ما بزودی نتیجه بررسی را به شما اطلاع میدهند .

درباره مگ ایرانز

مگیرانز برندی معتبر در بین کاربران فضای علمی ایران

مگ ایرانز یک سایت خدماتی اینترنتی محسوب می شود که روزانه مقالات و پاورپوینت های زیادی را جمع آوری ، تهیه و در دسترس دانشجویان ، دانش‌آموزان و محققین قرار می‌دهد . گروه مگ ایرانز در سال 1390 زمانی که هنوز کسب و کارها حالت سنتی داشتند و کافی نت ها به صورت حضوری در سطح شهر فعالیت می‌کردند با ایده کافی نت آنلاین راه اندازی شد . طرح اولیه این شرکت در ابتدا با ایده و تلاش دو دانشجوی خلاق راه اندازی گشت . سپس در سال دوم راه اندازی ، پس از مستقر شدن در دفتر کاری مجهز و استخدام چند نیروی ماهر ،توانستند در طول 5 سال به اهداف خود یعنی 1- رضایت و اعتبارحداکثری در بین کاربران اینترنتی 2- گرد اوری بانکی جامع از مقالات ( 60 هزار مقاله و پاورپوینت فارسی وقابل ویرایش ) 3- همکاری با بیش از 100 کافینت در سطح ایران ، دست پیدا کنند و این راه همچنان ادامه دارد . . .

تماس با ما

سوالات متداول

مقاله تشخیص اسپم با روش ترکیبی بهینه سازی ذرات تجمعی و چند همسایگی نزدیک

بخشی از مقاله

چرا مگ ایرانز؟

دانلود مقاله بهینه سازی مصرف سوخت

دانلود مقاله روش ترکیبی برای تشخیص لبه تصویر شعله و آتش با استفاده از منطق فازی و روش بهبود یافته الگوریتم تشخیص لبه

دانلود فایل پاورپوینت اسپم و فیلترکردن عمومی آن با استفاده از روش Naïve Bayesian

دانلود فایل پاورپوینت اسپم تصویر یا Image spam

مقاله مروری برارزیابی ماشین بردارپشتیبان درتشخیص و طبقه بندی ایمیل های اسپم

مقاله برنامه ریزی جهت طراحی یک فضای عمومی چند عملکردی در یک واحد همسایگی پایدار در برابر زلزله ، نمونه موردی : واحد همسایگی خواجه مراد بم

مقاله تلفیق نیروگاه های سیکل ترکیبی و سهموی خورشیدی به منظور کاهش آلاینده ی دی اکسیدکربن نیروگاه سیکل ترکیبی ( مطالعه موردی : نیروگاه سیکل ترکیبی بهبهان )

مقاله تعیین بهینه زوایای کلیدزنی در اینورترهای منبع ولتاژ چند سطحی با هدف کاهش اعوجاج هارمونیکی کل با استفاده از الگوریتم بهینه‌سازی ازدحام ذرات

مقاله ترکیبی جدید از الگوریتم های ژنتیک و بهینه سازی ازدحامی ذرات برای حل مسئله بهینه سازی

مقاله تشخیص همسایگی نقاط داده با مماس خارجی دایره های آپولونیوسی

مقاله تصدیق امضا با استفاده از پردازش سیگنال های حسگر شتاب سنج و الگوریتم k - نزدیک - ترین همسایگی

مقاله جایابی خاک چال های شهری با استفاده از روش وزن دهی تجمعی ساده و روش فازی مورد مطالعاتی استان لرستان

مقاله ساخت درجای نانو کامپوزیت Al/Al3Ni با استفاده از فرایند ترکیبی نورد تجمعی پیوندی و فرایند اصطکاکی اغتشاشی و ارزیابی خواص ایجاد شده

مقاله ساخت آلومینیوم خالص با استفاده از روش فشرده‌سازی پودر ازطریق اکستروژن معکوس تجمعی

مقاله روش ترکیبی جدید بر اساس الگوریتم ژنتیک و الگوریتم نزدیکترین همسایگی وزن دار به منظور پیش بینی عارضه نفروپاتی در بیماران دیابتی

مقاله ساختار و استحکام کششی کامپوزیت های چند لایه نانو ساختار مس / تیتانیم تولید شده توسط فرآیند اتصال نورد تجمعی

مقاله شبیه سازی برهم کنش بین دو سیال در حضور جامد و کنترل ترشوندگی جامد به کمک روش شبکه ی بولتزمن چند چند جزئی و چند فازی

مقاله طراحی بهینه چند هدفی ساختار شبکه فازی - عصبی برای مدلسازی فرآیندهای پیچیده بر اساس الگوریتم ترکیبی تکامل دیفرانسیلی و تجمعی ذره

مقالت رو پیدا نکردی ؟

درباره مگ ایرانز

مگیرانز برندی معتبر در بین کاربران فضای علمی ایران

مقاله تشخیص اسپم با روش ترکیبی بهینه سازی ذرات تجمعی و چند همسایگی نزدیک

بخشی از مقاله

چرا مگ ایرانز؟

مقالات مرتبط با این مقاله

دانلود مقاله بهینه سازی مصرف سوخت

دانلود مقاله روش ترکیبی برای تشخیص لبه تصویر شعله و آتش با استفاده از منطق فازی و روش بهبود یافته الگوریتم تشخیص لبه

دانلود فایل پاورپوینت اسپم و فیلترکردن عمومی آن با استفاده از روش Naïve Bayesian

دانلود فایل پاورپوینت اسپم تصویر یا Image spam

مقاله مروری برارزیابی ماشین بردارپشتیبان درتشخیص و طبقه بندی ایمیل های اسپم

مقاله برنامه ریزی جهت طراحی یک فضای عمومی چند عملکردی در یک واحد همسایگی پایدار در برابر زلزله ، نمونه موردی : واحد همسایگی خواجه مراد بم

مقاله تلفیق نیروگاه های سیکل ترکیبی و سهموی خورشیدی به منظور کاهش آلاینده ی دی اکسیدکربن نیروگاه سیکل ترکیبی ( مطالعه موردی : نیروگاه سیکل ترکیبی بهبهان )

مقاله تعیین بهینه زوایای کلیدزنی در اینورترهای منبع ولتاژ چند سطحی با هدف کاهش اعوجاج هارمونیکی کل با استفاده از الگوریتم بهینه‌سازی ازدحام ذرات

مقاله ترکیبی جدید از الگوریتم های ژنتیک و بهینه سازی ازدحامی ذرات برای حل مسئله بهینه سازی

مقاله تشخیص همسایگی نقاط داده با مماس خارجی دایره های آپولونیوسی

مقاله تصدیق امضا با استفاده از پردازش سیگنال های حسگر شتاب سنج و الگوریتم k - نزدیک - ترین همسایگی

مقاله جایابی خاک چال های شهری با استفاده از روش وزن دهی تجمعی ساده و روش فازی مورد مطالعاتی استان لرستان

مقاله ساخت درجای نانو کامپوزیت Al/Al3Ni با استفاده از فرایند ترکیبی نورد تجمعی پیوندی و فرایند اصطکاکی اغتشاشی و ارزیابی خواص ایجاد شده

مقاله ساخت آلومینیوم خالص با استفاده از روش فشرده‌سازی پودر ازطریق اکستروژن معکوس تجمعی

مقاله روش ترکیبی جدید بر اساس الگوریتم ژنتیک و الگوریتم نزدیکترین همسایگی وزن دار به منظور پیش بینی عارضه نفروپاتی در بیماران دیابتی

مقاله ساختار و استحکام کششی کامپوزیت های چند لایه نانو ساختار مس / تیتانیم تولید شده توسط فرآیند اتصال نورد تجمعی

مقاله شبیه سازی برهم کنش بین دو سیال در حضور جامد و کنترل ترشوندگی جامد به کمک روش شبکه ی بولتزمن چند چند جزئی و چند فازی

مقاله طراحی بهینه چند هدفی ساختار شبکه فازی - عصبی برای مدلسازی فرآیندهای پیچیده بر اساس الگوریتم ترکیبی تکامل دیفرانسیلی و تجمعی ذره

مقالت رو پیدا نکردی ؟

درباره مگ ایرانز

مگیرانز برندی معتبر در بین کاربران فضای علمی ایران