آماده ساختن داده برای مدل سازی
این مرحله آخرین گام آماده سازی داده قبل از ساخت مدل است. چهار قسمت مهم در این مرحله وجود دارد:
*انتخاب متغیرها
*انتخاب سطرها
*ساختن متغیرهای جدید
*تغییر شکل متغیرها
مهمترین مسئله در مورد ساخت مدل آن است که این کار، فرایندی تکراری است و برای حل مسائل، به مدل های جایگزین جهت یافتن سودمندترین آنها نیاز داریم آنچه که در جستجوی یک مدل مناسب به دست می آید می تواند منجر به بازگشت به عقب و انجام برخی تغییرات در داده مورد استفاده و حتی بهبود بیان مسئله شود.در آماده سازی و آزمایش مدل داده کاوی باید داده حداقل به دو گروه شکسته شود، یکی برای آماده کردن مدل و دیگری جهت آزمایش مدل مربــــــوطه( ( Corporation1999
ساختن مدل
اساسی ترین روش آزمایش داده تأیید اعتبار ساده است. در این کار درصدی از پایگاه داده به عنوان آزمایش کنار گذاشته می شود و از آن در برآورد و ساخت مدل استفاده نمی شود.