بخشی از مقاله

تکنیک هاي داده کاوی در پیش بیني قیمت سهام بورس اوراق بهادار

چکیده
دستیابی به رشد اقتصادی و ایجاد انگیزه جهت سرمایه گذ اری زمانی در یک کشور تسریع مسی گردد که آن کشور د ارای بازارهای سرمایه فعال و قابل اعتماد باشد . وجود بازارهای بورس فعال همواره سرمایه گذ ار ان متعددی را به تکاپو و اد اشته و جریان سرمایسه و مسنا بع مالی را به بخش های مولد تسریع می نماید. از روش های دقیق تری که می توان در هر نوع پیش بینی از آن استفاده کرد تکنیک های داده کاوی از جمله شبکه عصبی و درخت های تصمیم و رگرسیون منطقی، تحلیل تفکیکی ، مدل افزودنی کلی، روش BOOSting است . پیش بینی قیمت سهام شرکتهای پذیرفته شد ه در بورس اوراق بهاد ار تهران با استفاده از تکنیک های داده کاوی و با توجه به معیارهای مالی از جمله موضوع های با اهمیتی است که متأسفانه تا کنون در ارتباط با آن تحقیقات اندکی انجام شده است. در این مقاله پس از بررسی مفاهیم بورس اوراق بهاد ار ، انو اع تکنیک های د اد ه کاوی مورد بررسی قرار خو، اد گرفت .
کلید و اژه : د اد ه کاوی ، بورس اوراق بهاد ار، پیش بینی قیمت .

مقدمه
بورس کلمه ای فرانسوی است که معنای آن در زبان فرانسه " کیف پول " می باشد . بورس یک نهاد سازمان یافته ای است که از جمله نهاد های عمده و اساسی در بازار سرمایه گدسوب می شود و در کنار سایر مؤسسات و سازمان ها ، وظایف چند گانه ای را بر عهده د ارد . کار کرد های اساسی بورس ، مدیریت انتقال ریسک و توزیع ان ، شفافیت اطلاعات، کشف قیمت، ایجاد بازار رقابتی 9 همچنین یکی از کارکرد های المهم آن آوری سرمایه ها و پــلس) اند از های کوچک بر ای تأمین سرمایسه مورد نیاز فعالیت های اقتصادی است . باز ار بورس یک بازار ثانویه است، یعنی در بورس اوراق بهادار شرکتی تأسیس نمی شود و فقط سهام شرکت های پذیرفته شده (که قبلاً تاسیس شده اند ) مورد معامله قرار می گیرند . به همین دلیل باز ار بورس ، بازار ثانویه است . ( اسکندری ، ۱۳۷۱) امروزه با ز ا رهـــا ي بـورس نــه تـنــها از پـــا ر امــارهـــا ي اقتصاد کلان ، بلکه از بسیاري از عوامل دیگر متأثر مي شوند.تعدد و ناشناخته بودن عوامل مؤثر بر بازار بورس، معمولا موجب عدم اطمینان در زمینه سرمایه گذاري مي شود . بنابر این بطور طبیعي تمام تلاش سرمایه گذار کاهش عدم اطمینان است و از این جهت پیش بیخي بازار بورس یکي از ابزارهاي کاهش عدم اطمینان و به عنوان یکي از مهمترین شاخه هاي علمي مطرح شده است و روز به روز توسعه و پیشرفت مي نماید . مدیر ان بخش هاي مختلف اقتصادي و بازرگاني ، به دلیل وجود انبوه متغیرهاي تأثیرگذار ترجیح مي د هند مکانیزمي را در اختیار داشته باشند که بتواند آن ها را در امور تصمیم گیري شان یا ري و مشاوره دهد. به همین دلیل ، سعي در روي آوردن به روش هایي در پیش بیخي دارند که به واسطه آن ها تخمین هایشان به واقعیت نزدیل و خطایشان بسیار کم باشد . از آنجا که بورس اوراق بهادار تهران یکی از ارکان بازار سرمایه کشور به شمار می آید و پیشرفت و گسترش این سازمان می تو اند رشد و توسعه اقتصاد ملی را در پی داشته باشد، بررسی همه عوامل اثر گذ ار بر این سازمان ، از جمله عواملی که منجر به گرایش هر چه بیشتر سرمایه گذ اران به بورس اوراق بهاد ار می شود اهمیت ویژه دارد . در سالهای اخیر فن آوری های تولید و گرد آوری داده ها به سرعت در حال رشد بوده است. مسأله پیش روی سازمان ها به ویژه در حوزه پیش بینی ها ی مالی دیگر آوری صرف ها نیست بلکه دستیابی به تو ان استخراج دانش مفید نهفته در د اد ه ها دغدغه اصلی سازمان ها است . در چنین شرایطی است که باید از رشد فن آوری برای استفاده مؤثر از این دانش بالقوه سود جست و د اد ه کاوی یک جو اب مناسب بر ای استخر اج این ثروت است .
تکنیک ها و روش های متعددی مانند رگرسیون ، شبکه های عصسببی ، د ستـه بــنـــدى ، طبقه بندی ، درخت تصمسیم و . . . برای داد ۵ کا وی وجود د ارد که ریشه تمام انها در ریاضیات ، آمار 6 هوش محاسباتی 9 یادگیری ماشینی است . در تئوری ، بیشتر تکنیکهای داده کبا وی نمایل به مجمو عه های د اد ه ای بزرگ د ا رنـد زير ا مجمـو عه های د اد ه ای بزرگتر مدل های دقیق تری را به همراه خواهد داشت .
تاریخچه ای درباره بورس اور اقی بهاد ار
تاریخچه تأسیس اولین بورس به اواخر قرن چهارده و اوایل قرن پانزده در کشور هلند بر می گردد . اما بورس به صورت مدون از دو قرن پیش شروع به فعالیت کرد ه است . در حال حاضر با پیشرفت تکنولوژی و استفاده از ابزارهای الکترونیکی بیشتر معاملات در بورس از طریق را یا نه صورت می گیرد . واژه بورس از نام خانوادگی شخصی به نام و اندربورس اخذ شده که در اوایل قرن پانزدهم در شهر بروژ در بلژیک می زیسته و صرافان شهر در مقابل خانه ا و گرد امدند و به داد و ستد کالا، پول و اور اقی بهاد ار می پرد اختند . نام بورس بعدها به کلیه اما کسانی اطلاق شد که محلی داد و ستد کالا، پول و اسناد تجاری 9 مالی بو د ہ است ۔ تشکیل اولـيـن بـورس ا و ر ا ق بها د ا ر جهان ، در سالی ۰ ۶ ۴ ۱ روی د اد ه است . در این سال در شهر آنورس بلژیک که موقعیت تجاری قا بل ملاحظه ای داشت، اولین بازار متشکل سرمایه به وجود آمد . ( رجب ز ا د ۵ ، ۱۳۷۶ ) و ( صفر نو اد ه ، ۱۳۸۱)
اندیشه اصلی ایجاد بورس اور اقی بهاد ار در ایران به سال ۱۳۱۵ باز می گردد . در این سال یک کارشناس بلژیکی به نام و ان لوترفلد به همراه یک کارشناس هندی ، به درخو است دولت وقت ایران ، درباره تشکیل بورس اوراق بهاد ار مطالعاتی نمودند و طرح تأسیس و اساسنامه آن را تهیه نمودند . در همان سال ها بانک ملی نیز ، به عنوان تنها متصدی امور بانکی در کشور ، مطالعات مشابهی را در سال ۱۳۴۱ با تشکیل کمیسیونی متشکل از بانک مرکزی ، بانک توسعسه صنعستی و معدنی ایران و بسه میزبانی وزارت بازرگانی و با همفکری بلژیکی ها ، موضوع تأسیس سازمان بورس اوراق بهادار به صورت جدی دنبال شد.
در سال ۱۳۴۵ قانون و مقررات تشکیل سازمان بورس اوراق بهاد ار تهران تهیه و به جلس ار انسه شد و د (ر اردیبهشت لیسا ل ۵ ۳۴ ۱ به تصویب رسید ولی باز آمادگی شروع به کار این سازمان تا بهمن سال ۱۳۴۶ به وجود نیامد . پس از تصویب قانون گسترش مالکیت و به دنبال آن، تأسیس سازمان ملی گسترش مالکیت، عرضه سهام در بورس و انتقال آن به مردم تسهیل شد . از نیمه دوم سال ۱۳۵۷، همزمان با اعتصابات و مبارز انت مردم معاملات این باز ار به دلیلی بی اعتمادی به دولت و وضع مالی شرکت ها ، فرار سرمایه ، با سقوط قیمت سهام و کاهش معاملات روبرو شد و این روند به دلیل افزایش تورم ، ملی شدن بانک ها ، وقوع جنگ تحمیلی و مشخص نبودن مالکیت سهام ادامه پیدا کرد به طوری که معامله سهام و اور اقی مشارکت تا سال ۱۳۶۱ تقریباً متوقف شد. در سال ۱۳۶۲، تا حدودی تقاضا برای سهام وجود داشت، ولی به دلیل پایین بودن قیمت های پیشنهادی خرید ار ان ، عرضه کنند گان چند ان زیاد نبودند . در سال ۱۳۶۳ ، به دنبال تصمیم شورای بورس s( ی دولت به کارگزار ان و سایر افراد بخش خصوصی ، مبادلات سهام اند کمی افزایش یافت و تا سال ۱۳۶۷ افزایش مبسنـ بر و اگذاری تعدادی از کارخانجات صنعت حجم مبادلات ادامه یافت . بورس اوراق بهاد ار تهران در سال ۱۳۶۸ در چارچوب سیاست های دولت و به منظور اجرای بخشی از برنامه پنج ساله توسعسه اقتصادی و به دنبال سیاست خصوصی سازی و انتقال سهام شرکت ها به مردم از طریق بورس اور اقی بهاد ار ، فعالیت خود ر ا به طور گسترد ه ای آغاز کردند .
اهمیت بورس اوراق بهاد ار
رشد و توسعه هر کشور، مستلزم به کارگيري منابع در شکل بهینه و هدایت آنها در مسیري درست است . در هر جامعه اي نهاد هاي مختلفي مي توانند در جهت این هدف گام برد اشته و نقش مؤثري را در این رابطه ایفا کنند. بازار هاي مالي و نهادهاي مربوط به آن ، یکي از مهم ترین عوامل مؤثر بر این فرآیند هستند. به رغم تنوع و تعداد نهاد هاي مربوط به باز ار هاي مالي ، باز ار بورس اور اقی بهاد ار مهم ترين و اصلي تـــريــن مرکز بر اي مبا د لات د ار ايي هـــا ي مـــالي تلقي مي شو د • بي شک فعالیت صحیح و درست بازار بورس اوراق بهاد ار ، مي تواند نقش مؤثري در تخصیص بهینه منابع در سطح کلان اقتصاد ي د اشته و سبب رشد و توسعه اقتصادي کشور مي گردد . نقش اصلي بورس اوراق بهاد ار جذب و هد ایست پس اند از ها و نقدینگي سرگرد ان و پراکنده در اقتصاد به سوي مسیرهاي بهینه آن است، به گونه ايي که منجر به تخصیص بهینه منابع کمیاب مالي شود . اما این امر مهم منوط به و حسود کار آيي بازار هساني مالي است .
براي موفقیت در رشد اقتصادي ، فعالیت و عملکرد بورس اوراق بهاد ار اهمیت و حساسیت خاصي پیدا مي کند . یکي از عملکرد ه اي اقتصادي باز ار هاي مالي از جمله بازار سرمایسه ، انتقال و جو ه s د ا رنـد گا ن و حج و ۵ اضا في براي سرمایه گذ اري ب-سه کسا نـي کـه بـــه وجو هسي بــر ا ي سرمـــايــــه گـذ ا ري د ا ر ا يـي هـــا ي مشهــو د نيا ز د ا رند ، است . علاوه بر این ، کار آ بودن باز ار از اهمیت زیادي برخورد ار است ، چرا که در صورت کار آن بودن بازار سرمایه ، هم قیمت اوراق بهاد ار به درستي و عادلانه تعیین مي شود و هم تخصیص سرمایه که مهم ترین عامل تولید و توسعسه اقتصادي است به صورت مطلوب و بهینه انجام مي شود . به طوري که هر چه میزان کار آیي بورس اوراق بهاد ار افزایش پیدا کند به همان اند از ه اطمینان سرمایه گذ ار ان نسبت به بورس بیشتر شده و رغبت آنها جهت سرمایه گذاري ، افزایش خواهد یافت. با مطالعه تحقیقات تجربي کار آی.بي بازار بورس در ایران مشاهده مي شود که به رغم این که بورس اوراق بهاد ار ایران در بهمن آ * ۱۳ شروع به فعالیت کرد ه ، این تحقیقات عدم کار آیي این بازار را به اثبات مي رساند . با این وجود در طي سال هاي اخیر اقد امات مناسبي در جهت پیشرفت ، توسعه و افزایش شفافیت بازار اوراق بهاد ار انجام شده است که مي توان اثرات آن را در فرهنگ سهامداري مردم ، گسترش جغرافیایي بازار، افزایش حجم معاملات بورس و افزایش تعبد اد سهامد ار ان دید . ام--ا ب--ا این حال ، طبق آخرین مطالعــاتي که در زمینه بررسي کار آیي بورس اوراق بهادار انجام شده ، کار آیي بازار تأیید نشده است. در این راستا، عدم کار آیسي بورس اوراق بهادار تهران موجب مي شود شرکت هاي پذیرفته شده در این بازار، در روند تأمین مال خود با مشکلات و چالش هایي رو به رو شوند

شاخص کل قیمت بورس (TEPIX)
کلـمـه شاخص' در کل به معنای نمود ار یا نشان دهنده یا نماینده می باشد . شاخص کمیتی است که نماینده چند متغیر همگن 0م-پی باشد و وسیله ای برای اند از ه گیری و مقایسه پدیده هایی است که د ارای ماهیت و خاصیت مشخصی هستند که بر مبنای آن می توان تغییرات ایجاد شد ه در متغیرهای معینی را در طول یک دو ره نمود . در هر بازار بورس اوراق بهاداری می توان بنا بر احتیاج و کارایی شاخصهای زیادی را تعریف و محاسبه نمود . در تمام بور سهاى د نــيـــا نيـــز شاخص های زیادی برای گروهها و شرکتهای مختلف محاسبه می شود . بعنوان مثال در بازار سهام امریکا شاخص د او جونز" ، تغییرات ۳۰ شرکت صنعتی ، ۲۰ شرکت حمل و نقل و ۱۰ شرکت خدماتی را نشان می دهد و یا شاخص نزدک تغییرات سهام خارج از بورس را نشان می دهد . شاخص کل قیمت که مخفف کلمه TEHRAN PRICE INDEX" می باشد یکی از اصلی ترین شاخصهای بورس اوراق بهاد ار تهران است که روش محاسبه آن بر اساس فرمول زیر (فرمول لاسپیرز ) انجام می گیرد
{ ( ارزش جاری سهم در بازار " تعداد سهام منتشره ) تقسیم بر ( ارزش پایه سهام " تعداد سهام در سال پایه ) } ضرب د ر عل د * * ۱
که در این محاسبه سال پایه سال ۱۳۱۹ می باشد . این شاخص گویای آن است که ارزش کل بازار نسبت به سال پایه (یا همان سال ۱۳۱۹) چند برابر شده است .
شاخص کل قیمت در بورس تهران برای سه گروه محاسبه می شود که عبارتند از :
۱- شاخص قیمت کل بازار : که در محاسبه آن قیمت سهام تمام شرکتهای معامله شده تأثیر د ا د ه مـی شو د
۲ - شاخص قیمت تالار اصلی : که در محاسبه آن فقط قیمت سهام شرکتهای معامله شده در تابلو اصلی تأثیر داده می شود .
۳- شاخص قیمت تالار فرعی : که در محاسبه آن فقط قیمت سهام شرکتهای معامله شده در تابلوی فرعی تأثیر د اد ه می شود .
عوامل مؤثر بر نوسان قیمت سهام معمولا در بورس هاي اوراق بهاد ار حساسیت زیاد ي نسبت به روند قیمت سهام نشان د ا د ه مي شود و چگونگي تحولات مرتبط بسا آن مورد بررسي قرار مي گیرد .
از آن جایي که بازار باید در معرض ترافیل دوطرفه از اطلاعات باشد، ما نباید در بازار شاهد این باشیم که در یلف مقطعي از زمان همه خرید ار و در مقطعي دیگر همه فروشنده باشند. وقوع چنین روید ادي نشان از عدم استقلال ر آيي و ارزیابي بازار دارد و این ها همه به دلیل ان است که عوامل واقعي که باید تغییرات آن ها بر روي قیمت ها تأثیر بگذارند ، بر اي همه شناخته شد ه نیست . عوامل مؤثر بــر قيمت سهام را مي توان بـه دو د سته د اخلي و خارجي تقسيم بــنـدي کرد . از جمله عوامل د اخلي مي توان به موارد ذیل اشاره کرد : « سیاست تقسیم سود ، ساختار سرمایه ، کیفیت اطلاعات مالي ، مدیریت شرکت، صنعت ، و ابستگي ارزي ، وضعیت کالا، تغییرات عمد ه قیمت محصولات نهایي ، مصوبات مجمع عمومي سهام د اران . عوامل خارجي موثر بر قیمت سهام عبارتند از : عوامل اقتصادي (تورم ، سیاست پولي و مالي دولت ، باد هسي خارجي دولت، تغییرات نرخ ارز ، نرخ بهره بانك هـا . . . ) ، عوامل فرهنگي و اجتماعي ، عوامل سیاسي ، عواملی فخي ، تعزیرات حکومتي و محدودیت شرکت ها ، عملکرد بورس اوراق بهاد ار خصوصاً در زمینه قانون گذ اري و تحوه اجراي آن و استفسا د ه از ابزار هاي حمایتي و . . . ( 2007 ,MiaO)


کار آيي بازار سرمایه
کار آيي بازار سرمایه یک مفهوم با اهمیتي است و بیانگر عملکرد بازار سرمایه است. کار آ بودن بازار سرمایه به رشد و رونق اقتصاد کشور کمک شایاني مي کند . در صورت کار آ بودن بازار سرمایه قیمت سهام به ارزش ذاتي سهام نزدیک بوده و پس اند از ها به صورت بهینه به سرمایه گذ اري هاي سود آور اختصاص پید ا مي کند . به طوري که این امر هم به نفع سرمایه گذ اران و هم به اقتصاد کشور کمک شایاني مي کند. فرضیه بازار کار آ نقش مهمي در ادبیات مالي و اقتصاد د اشته و بر استفاده کار آن از اطلاعات توسط عاملان بازار تأکید د ارد . و اژه « كـار آيـي » جهت توصیف باز اري مورد استفاده قرار مي گیرد که اطلاعات در قیمت د ا ر ا يي هـــا ي مـــالي مــنعکس شـده بــا شد
منظور از کار آیي بازار سرمایه ، اشاره به این مسأله است که تا چه میزان بازار در تعیین قیمت اوراق بهاد ار موفق عمل کرده است . موفق بودن باز ار به این معني است که قیمت ها به طور پیوسته منعکس کننده اطلاعات جدید باشند و اطلاعات نیز مجموعه اي از د اد ه ها است که مربوط به شرکت ها و اوراق بهاد ار آنها است و قیمت ها در بازار کار آب باید تأثیرپذیر از این اطلاعات باشند. بنابراین، بازاري را مي توان کار آ نامید که کار آیي لازم را براي پردازش اطلاعات د اشته باشند . به عبارت دیگر ، قیمت ها در هر زمان نشان دهنده ارزیابي صحیحي از اطلاعات موجود است ، در نتیجه قیمت ها منعکس کننده کاملی اطلاعات موجود خواهند بود . به طوري که کار آيي بازار سرمایه از همان آغاز يکي از موضوعات بحث بر انگیز است. کار آیي بازار سرمایه به دو جنبسه مهم در تعیین قیمت ها توجه ویژه اي دارد و این دو جسن به عبارتند از : سرعت و کیفیت تعیین قیمت ها . اگر در باز اري عدم کار آيي در رابطه با سرعت و کیفیت تعیین قیمت ها وجود داشته باشد ، سرمایه گذ ار ان مطلع و کساني که گوش به زنگ چنین موقعیت هایي هستند ، مي توانند سود با لایسي ر ا بر اي خود ایجاد کنند . اگر قیمت هاي جاري منعکس کنند ه اطلاعات با ارزش باشند، بسیار مشکل خواهد بود که اوراق بهاد ار ارزاني را یافت که بازده با لایسي ایجاد کند یا در اوراق بهاد اري سرمایه گذاري شود که قیمت آن بالا و بازده آن پایین باشد . تنها در صورتي مي توان سرمایه گذاري خوبي داشت که بتوان آینده را به خوبی پیش بیني کرد . فرضیه بازار کار آن فرض مي کند که قیمت سهام به سرعت با اطلاعات جدید تعدیل مي شود و قیمت جاري همه اطلاعات را به طور کامل منعکس مي کند . (جهانخانی، ۱۳۷۹)
در ادبیات مالي و اژه «باز ار کارآ» توسط فاما ( ۵ آ ۱۹ ) ا را انسه شد . به طوري که کار آيي بازار سرمایه به صورت هاي مختلفي مورد بحث قرار گرفته است . ساده ترین تعریف را مي توان به تعریف فاما از باز ار کار اي سرمایسه اختصاص داد : در صورتي که در یک باز ار ، قیمت اوراق بهاد ار در هر خظه از زمان انعکاس کاملي از همه اطلاعات در دسترس باشد، مي توان آن بازار را کار آ
نامید . (1965 ,Fama)
مباني تحلیل تکنیکي در بازار سرمایه
سرمایه گذار مي باید ابزاري در اختیار داشته باشد تا به کملک آنها بتواند مسیر حرکت سهام را پیش بیخي کند . در بازار سرمایه این ابزار به طور کلي بر د و نـــوع است
۱) تحلیلی بنیادي : از نظر جهانخاني ( ع ۱۳۷) ، تحلیل بسنتيسا دي عبارت است از مطالعسه و بررسي شرایط اقتصادي ، صنعت و وضعیت شرکت . هدف اصلي از انجام این گونه مطالعات، تعیین ارزش واقعي سهام و ارزش ذاتي شرکتهاست. تحلیل بنیادي معمولا بر اطلاعات و آمار کلید ي مسندرج در صورتهاي مالي شرکت نمرکز مي نماید تا مشخص کند که آیا قیمت سهام به درسي ارزشیابي شده است یا نه ؟
بخش قابل ملاحظسه اي از اطلاع انت بنیادي ، بر اطلاعات و آمار اقتصاد مسلي ، صنعت و شرکت تمرکز د ارد . رویکرد معمول در تحلیل شرکت ، د ر بر گیرنده چهار مـــرحلـه اساسي است
۱) تعیین وضعیت کلي اقتصاد کشور
تعیین وضعیت صنعت تعیین وضعیت شرکت
تعییین ارزش سهام شرکت (جهانخانی ، ۱۳۷۱) Y( تحلیل تکنیکي : روش تحلیل تکنیکسي بر پایة سه اصلی اساسي بنا شده است که در نما م بازار هاي جهان صدق مي کنند و عبارتند از
* همه چیز یلک سهم ، در قیمت آن سهم منعکس مي گردد .
* قیمستسها به صورت روند هایي حرکت مي کنند که این روند ها در برابر تغییرات مقاومت مي کنند .
*روند ه اي باز ار تکرار مي شوند
در بازار سرمایه ، اشخاص استفاده کننده از روش تحلیل بنیادي را بنیاد گرا و اشخاص استفاده کننده از روش تحلیل تکنیکي را تکنسین یا چارت بیست مي نامند . اگر بخواهیم منصفانه و با دید علامسي به قضیه نگاه کنیم . باید بگوییم که این د و روش در واقع مکمل یکدیگرند و در کنار هم تصویر شفاف از تحولات بازار سرمایه ارائه مي دهند . ( هادی پور ، ۱۳۸۲)
فرآیند داده کاوی
حتی در بعضی محیط های حرفه ای این نظر وجود د ارد . د اد ه کاوی شامل انتخاب و بکارگیری ابزار مبتنی بر کامپیوتر برای حل مسائل فعلی و بدست آوردن راه حلی به طور خود کار می باشد . این برد اشت در حقیقت یک تصور اشتباه بر پایه آرمان گرایی تصنعی جهان است . البته دلایل زیادی برای این برداشت اشتباه وجود د ارد . یکی از این دلایلی این است که د ا د ه کسبا وی فقط مجموعه ای از ابزارهای ایزوله شده نیست بلکه هر کد ام کا ملا 3 یکدیگر متفاوت بوده و به دنبال حل مسائل هستند . دلیل د و م در انطباقی یک مسئله با یک تکنیک نهفته است . خیلی به ندرت این حالت وجود دارد که یک پرسش تحقیقی با دقت کافی ، کاربرد ساده و منحصر بفرد ، یک روش و تکنیک را بیان کند . در حقیقت در عملی چه روی می دهد که داده کاوی به یک فرآیند تکرار پذیر تبدیل می گردد . به طور دقیق تر ما د اد ه ها ر ا مطالعه می کنیم ، آنها را با استفاده از بعضی تکنیک های تحلیلی بررسی و بالاخره به آنها از دیدگاه ها و زوایای دیگری توجه می کنیم . شاید آنها را اصلاح کنیم و در این راستا لازم باشد کار را از ابتدا شروع و ابزار تحلیل د اد ه دیگری را اعمال کنیم که حاصل همه این ها ، شاید رسیدن به یک نتیجه جدید یا بهتر باشد . این فرآیند می تواند با رها و بارها تکرار شود . هر تکنیک برای بررسی جنبه های تا حد و دی متفاوت د اد ه ها استفاده می شود . ( کانتا رد زیلا ، ۲۰۰۵) روش های تجربی معمول با مسائل د ا د ہ ک-اوی مسنطبق شد و مراحل زیر را د ر بر می گیرد :
بیان مسئله و فرموله کردن فرضیه
بنابر این ، دانش و تجربه در حوزه ای خاص معمولا به منظور ذکر یا بیان مسعسنی د ا ر مسئله ضرورى است. متأسفانه بسیاری از مطالعات کاربردی به جای تمرکز بر (Hand, etal, 2005) . J. S. مسأله نمایل دارند بر تکنیک های داده کاوی تکیه بیشتر مطالعات بر مبنای مدلسازی در زمینه کاربردی خاصسی اجرا ای شوند .
-آورى د ا د ه ها
این مرحله در ارتباط با چگونگی تولید 9 ర్& آوری د ا د ٥ هـا مـــی باشد . به طور کلی ، د و امکان متمایز وجود دارد . اولین امکان زمانی است که فرایند تولید داده ها تحت کنترل یک متخصصی (مدلساز) می باشد. این روش به نام آزمون طراحی شد ه شناخته می شود . امکان دوم زمانی مطرح می شود که متخصص نمی تواند فرآیند تولید را تحت تأثیر قرار دهد . این روش به نام روش یا شیوه دیداری

۳- پیش پردازش داده ها
در روش و تنظیم دید اری ، د اد ه ها معمولا s پایگاه د اد ه های موجود در انبار د ا د ٥ هـــا و مـــرکز د ا د ه ها "جمع آوری " می شود . فرآیند پیش پردازش داده ها معمولا شامل حد اقل د و مرحلـه مــتند اول می بــاشند :
۱- آشکار سازی و (حذف) داده های غیرعادی . داده های غیر معمول یا غیر عادی در حقیقت مقادیر د اد ه نا منطبق و غیرمرسوم هستند که با بیشترین مشاهد انت سازگار نیستند . معمولا د اد ه های غیر عادی نتیجه سنجش خطا ها ، کد نویسی 9 ثبت خطا ها بوده و گاهی اوقات نیز مقادیر طبیعی و غیر عادی هستند . چنین نمونه های غیرقابل ارائه ، می توانند بعداً مدل های ایجاد شده را کاملاً تحت تأثیر قرار دهند . در اینجا د و خط مشی در خصوص د اد ه های غیر عادی وجود د ارد : الف. تشخیص و حذف علمی د اد ه های غیر عادی به عنوان بخشی از مرحله پیش پرد از ش، یا بد
• توسعه روش های قوی مدلسازی که به د اد ه های غیر عادی و ناخو است.سه غیر حساس باشند .
۲- جنبه ها و ویژگی های مقیاس بندی ، رمزگذاری و انتخاب . پیش پردازش داده ها شامل چندین مرحله است از جمله مقیاس بندی متغیر و انواع مختلف رمز گذاری . برای مثال یک مشخصه بسا د امنه [ ۱ ، ۰ ] و دیگری با د امنه [ ۰ ۱۰۰ ، ۱۰۰ - ] دارای ارزش مشابهی در تکنیک اعمال شده نیستند. آنها همچنین بر روی نتایج د اد ه کما وی به طور متفاوتی تأثیر خواهند گذاشت . بنا بر این ، توصیه می شود که آنها را مقیاس بندی نموده و برای تحلیل و بررسی بیشتر هر دو جنبه را به وزن یکسانی تبدیل کنیم . (2003 ,Wiley )
۴- برآورد و ارزیابی مدل انتخاب و پیاده سازی تکنیک های مناسب داد ۵ کیا وی کار اصلی این مرحله است .
این فرآیند معمولأ چند ان روشن و و اضح نیست . در عمل ، چندین مدل بطور همزمان پیاده سازی شده و سپس بهترین آنها انتخاب می شود که یک وظیفه و کار اضافی محسوب (می گردد . در این گام است که از تکنیک های مختلف د اد ه کبا وی بر ای

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید