بخشی از مقاله

چکیده

هدف : هدف از پژوهش حاضر ایجاد یک چارچوب جدید جهت برنامه ریزی درسی رشته های فنی و مهندسی و علوم انسانی دانشگاه پیام نور استان قم با مطالعه در رفتار دانشجویان با استفاده از داده کاوی از سالهای 1390 تا 1381 می باشد.

روش : در این پژوهش پس از استخراج داده ها از سیستم گلستان و تبدیل به بانک اطالعاتی مورد استفاده در نرم افزار داده کاوی spss modeller آن را به یک نود منبع تبدیل می کنیم و سپس با استفاده از خوشه بندی نویز را از بین داده ها پیدا کرده و آنها را حذف می کنیم زیرا برای یک مدل دقیق باید داده های بدون نویز داشته باشیم یا به عبارتی دیگر 75 درصد داده کاوی مراحل اماده سازی و پاکسازی داده می باشد بعد از این مرحله داده ها را با استفاده از الگوریتم Apriori مقادیر Confidence و support برای آیتم ست ها را مشخص می کنیم و مجموعه ای که درای support باالیی می باشد به عنوان یک قانون معتبر به سیستم جدید معرفی می شود تا در برنامه ریزی جدید دروس مورد استفاده قرار گیرد.استفاده از چارچوب فوق در سیستم برنامه ریزی درسی ، باعث افزایش بازدهی و سرعت ، دقت در ارائه دروس می گردد.

واژههای کلیدی: دادهکاوی ، Apriori ،support ، Confidence

.7مقدمه

با توجه به اینکه آموزش همواره با دادهها و اطالعات بسیار زیادی در مورد دانشگاهها، دانشجویان، اعضای هیئت علمی، پرسنل، منابع مادی و... روبروست و در اکثر مواقع این دادهها میتواند حامل اطالعات و الگوهای با ارزشی باشند، لذا به نظر میرسد یکی از مهمترین کاربردهای دادهکاوی در آموزش عالی است. امروز بانكهای اطالعاتی وسیعی از ویژگیهای دانشجویان موجود است که اطالعات مربوط به ویژگیهای خانوادگی، تحصیلی و ... را شامل میشود. پیدا کردن الگوها و دانش نهفته در این اطالعات میتواند به تصمیمگیرندگان عرصه آموزش عالی کمك شایانی بکند.پیدا کردن الگوها و دانش نهفته از دادههای سیستمهای آموزشی میتواند به تصمیم گیرندگان عرصه آموزش عالی در جهت ارتقاء و بهبود فرآیندهای آموزشی نظیر برنامه ریزی، ثبت نام، ارزیابی و مشاوره کمك شایانی نماید.

یکی پیش بینی آینده در زمینههای مختلف همواره برای انسان جالب و جذاب بوده است .با اطمینان میتوان گفت که پیش بینی آینده و روند تغییرات در همهی حوزهها از دغدغههای اصلی و همیشگی مدیران سطح باال و میانی میباشد . اما همواره مشکالت فراوانی در برابر آن وجود داشته است که انجام پیش بینیهای دقیق و قابل اعتماد را تقریبا غیر ممکن نموده است .وجود پارامترهای زیاد و در بسیاری موارد پنهان اینگونه موارد را به مسائلی بسیار پیچیده تبدیل نموده است که الگوریتمهای غول پیکر ریاضی نیز از ارائه راهکاری مناسب برای ساخت یك مدل پیش بینی کارامد عاجز ماندهاند .در دو دههی اخیر با پیدایش هوش مصنوعی و ترکیب آن با علم پر سابقهی آمار در کنار الگوریتمهای پیشرفته و ابتکاری همچون الگوریتم ژنتیك، روشهای متاهیوریستیك، شبکههای عصبی مصنوعی و ...تحول گستردهای در این عرصه ایجاد گردیده است.

داده کاوی به عنوان یك حوزهی جدید و روبه رشد در زمینهی ارائه مدلهای پیش بینی کننده انواع تکنیکهای آماری و هوش مصنوعی و نیز الگوریتمهای ابتکاری را به کار گرفته است و با هم درآمیخته است تا بتواند از میان انبارهای غول پیکر دادهای الگوریتمها و مدلهای قابل اعتمادی را به منظور پیش بینی پارامترهای مورد نظر کشف نماید.تکنیکهای داده کاوی از جمله تکنیکهای نوین علمی هستند که در توصیف، تشریح، پیش بینی و کنترل پدیدهها به کار میروند. این تکنیکها به اندازهگیری، تشریح و پیشبینی درجه وابستگی میان متغیرها میپردازند. روشهای دادهکاوی نه تنها بر جنبههای تحلیلی مطالعات، بلکه در طراحی و ابزارهای جمع آوری داده برای تصمیمگیری و حل مسائل نیز تأثیر میگذارند.

موفقترین پروژههای دادهکاوی، در چارچوب فرآیند استانداردی اجرا میشود که توسط یک تیم کاری در شرکت SPSS در قالب پروژههای به نام CRISP-DM ارائه شده است. بر طبق CRISP-DM یک پروژه دادهکاوی معین شامل چرخه حیاط شش مرحلهای است که توالی مراحل را نشان میدهد. هر مرحله از ترتیب مراحل اغلب نتیجه وابستگی مراحل قبلی را نیز در بر دارد. مهمترین وابستگی بین مراحل نمایش پیکانها میباشد. خاصیت تکراری CRISP حاکی از چرخه بیرونی است که اغلب منجر به راه حلی برای مسئله تحقیقی یا تجاری با سواالت اضافی جالب توجه میشود.در شکل 1 مراحل این متدلوژی را مشاهده میکنید.[1]

.773آماده سازی دادهها
پیش پردازش1 اهمیت آماده سازی دادهها به دلیل این واقعیت است که؛ "فقدان داده با کیفیت برابر با فقدان کیفیت در نتایج کاوش است" و ورودی نادرست خروجی نادرست به دنبال دارد در جدول 2 مقایسهای بین اهمیت آماده سازی دادهها نسبت به سایر گامهای کشف دانش به کمک داده کاوی صورت گرفته است.[2]

.771 قوانین با هم آیی

یکی از تکنیکها و مفاهیم اصلی در دادهکاوی قوانین انجمنی هستند . قوانین انجمنی روابط و وابستگیهای متقابل بین مجموعه بزرگی از اقالم دادهای را نشان میدهند.پیدا کردن چنین قوانینی میتواند در حوزههای مختلف مورد توجه بوده و کاربردهای متفاوتی داشته باشد به عنوان مثال کشف روابط انجمنی بین حجم عظیم تراکنشهای کسب و کار میتواند

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید