بخشی از مقاله

مقدمه:

پیشرفت شگفت انگیز فن آوري یارانه اي و مجهز شدن بشر به این ابزار، امکان جمع آوري اطلاعات دقیقو کامل در زمینههاي مختلف را فراهم ساختهاست و منجر به پیدایش پایگاه دادههاي بسیار حجیم شدهاست. پایگاه دادهها، اطلاعات زیادي را ذخیره می کنند و با گسترش دانش ، پردازش این داده ها موردتوجه قرار گرفته است.نیاز به طراحی سیستمهاییکه قادر به اکتشافسریع اطلاعات - با تاکید برحداقلمداخلهانسان - باشد از یک سو و رويآوردن به روشهايآماري متناسب با حجمدادههايزیاد از سويدیگر بهخوبی احساس میشود. براي رسیدن به ایناهداف روشهايمختلفی مانند تجزیه و تحلیلآماري و ابزارهاي جستجوي پایگاهداده وجود دارد، اما هریک درمواردي جواب نمی دهند.

یکی از ویژگیهايکلیدي در بسیاري از ابتکارات دراین جهت، مربوط به تامین امنیت ملی دادهکاوي است که ابزارتحلیلی مناسبی میباشد. اما محدودیتهایی نیز دارد که 2 مورد از آنها ذکر میگردد : -1 به آشکارسازي الگوها وروابط کمک میکند، اما اطلاعاتی درباره میزان ارزش و اهمیت آنها نمیدهد. -2 باوجود توانایی شناسایی روابطبین رفتارها یا شغلها، لزوماً قادر به کشف روابط علت و معلول نیست.عاملمهم در عملکرد بهتردادهکاوي عبارتنداز:-1 کیفیتدادهها به جهت دقت و کاملبودن-2 میزان سازگاري نرمافزار دادهکاوي با بانکهاياطلاعاتی.-3 به بیراهه نرفتن دادهکاوي و عدمبهرهبرداري از آنها براي اهدافی به غیرازاهداف اولیه.

تعریف داده کاوي:

به بهرهگیري از ابزارهايتجزیه و تحلیلاطلاعات بهمنظور کشف الگوها و روابطمعتبري که تاکنون شناختهشده اطلاق میگردد. ابزارها میتواند مدلهاي آماري،الگوریتمها و روشهاي یادگیرنده باشد، که بصورتخودکار از طریق-شبکههاي عصبی یا تصمیمگیري عمل می کنند. البته دادهکاوي منحصر به گردآوري و مدیریت اطلاعات نیست و تجزیه و تحلیل آنها را نیز شامل میشود. بعضی از ناظران دادهکاوي را مرحلهاي در روند کشفدانش در پایگاه اطلاعات میدانند . - KDD - درحقیقت در دادهکاوي با زنجیرهاي از ابزارهاي تحلیل و اکتشافی سروکار داریم ک
شامل 1SQL پرس و جوهاي 2OLAP و تکنیکهاي داده کاوي می باشند.

تفاوت داده کاوي و آنالیز آماري و سایر علوم:

در تجزیه و تحلیلآماري آزمون هاي آماري مورد استفاده قرار میگیرند و عمل استنباط بوسیله اطلاعات موجود - کهبه عنوان نمونه در نظر گرفته میشوند - انجام میشود. ولی در بعضی شرایط بدنبال توصیف اطلاعات، بدون داشتن فرضیه هستیم. در اینموارد داده کاوي مورد استفاده قرار میگیرد، بدین صورت که توسط ابزار ویژه عملیات کاوشرا براساس تجزیه و تحلیل مکرر انجام میدهد.مراحل دادهکاوي را میتوان بهشرح زیر ذکر کرد: -1 شناساییهدف -2 انتخاب داده-3 آمادهسازي دادهها -4ارزیابی دادها -5 قالب بی پاسخ -6 انتخاب ابزار -7 مدل سازي -8 اعتبار سازمان یافته -9 ارائه نتایج -10استفاده از نتایج.نکته مهم این که دادهکاوي هیچگاه جاي یک مدیر را نخواهدگرفت بلکه ابزار جدید و قدرتمندي را در اختیارشانقرار میدهد، به اینصورت که از آن در 4 محور زیر میتوان استفاده کرد: -1 کشف ارتباط.-2 انتخاب کردن.-3

پیش بینی کردن.-4 بهبود فرایندکار.

دو نوع روش در داده کاوي وجود دارد: -1 آزمون فرضیه.-2 اکتشاف دانسته ها

مشکل اصل داده کاوي:

مشکلاصلی در دادهکاوي زمان جستجو به صورت تئوریک میباشد، بهعبارتدیگر بدلیل گستردهبودن محدوده شاخصها در بانک اطاعاتی، جستجو در پایگاه عادي اطلاعات، پیش از صدها سال ممکن است طول بکشد. براي حل این مشکل الگوریتمهايمختلفی مثل درختهاي تصیمگیري و شبکههايعصبی مورداستفاده قرار میگیرد. یکی دیگر از روشهاي مورد استفاده تحلیل عاملی می باشد.تحلیلعاملی یک مرحله اساسی براي طبقه بندي موثر اطلاعات میباشد. هدف اصلی تحلیل عاملی رتبه بندي ویافتن عاملهاي مهمی می باشد که مسائل را به خوبی بیان کند. از آنجا که افزایش تعداد عاملها زمان محاسبه راافزایش میدهد، تعداد کافی از عوامل را که داراي 2 خاصیت استقلال و اهمیت باشند انتخاب می کنیم. چند شیوه توسعهیافته براي تحلیلعاملی عبارتند از: -1 تحلیلاحتمالات -2 شیوه پسرو یا پیشرودنباله اي. -4الگوریتم هاي تکوینی . - GAS - در اینمقاله روش الگوریتم تکوینی را براي تحلیلعاملی با رعایت دو ضابطه اهمیتو استقلال بررسی میکنیم. جدول زیر مقایسهاي بین ارزیابی با طبقهبندي و بدونطبقهبندي ارائه دادهاست.توضیحات کامل جدول در نسخهکامل مقاله ذکر گردیده است.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید