بخشی از مقاله

چکیده

آنچه در حوزه آموزشی از دغدغه های فکری مدیران آموزشی است ، پیش بینی وضعیّت تحصیلی دانش آموران می باشد . امروزه در اکثر ادارات آموزش و پرورش بانک اطلاعات وسیعی از ویژگی های دانش آموزان موجود است که حجم بالایی از اطلاعات مربوط به سوابق آموزشی ، تحصیلی و . . . را شامل می شود پیدا کردن الگو و دانش نهفته در در این اطلاعات می تواند به مدیران آموزشی در جهت ارتقاء و بهبود فرآیند های آموزشی نظیر :

ارزیابی،تشخیص وضعیّت تحصیلی و مشاوره کمک شایانی کند.داده کاوی الگوهای قابل فهم، مفید، نا شناخته ، معتبر و بدیع را از داده های آموز شی پایگاه داده های بزرگ استخراج می کند، الگوهای کشف شده ، سیستم های آموزشی ادارات آموزش و پرورش را در تصمیم گیری بهتر و داشتن طرح پیشرفته تری در هدایت دانش آموزان کمک می کند، با اعمال داده کاوی بر روی 395دانش آموز مشاهده گردید، مهم ترین فیلد ها در رابطه با وضعیّت تحصیلی دانش آموزان عبارتند از :

معدل سال دوم متوسط، معدل سال اول متوسط ، تعداد دفعات غایب در مدرسه و کیفیت ارتباط خانوادگی می باشد .

-1 مقدمه

در ده سال گذشته روش های داده کاوی در حوزه های مختلفی مانند بازاریابی ، تجارت الکترونیکی، خرده فروشی ، زیست فناوری و مقابله با تروریسم مورد استفاده قرار گرفته است و در سال های اخیر این روش ها توجه پژوهشگران حوزه آموزش و یادگیری را به خود جلب کرده است و به طور خاص در حوزه آموزش از این روش ها برای بررسی سوالات کلیدی و یافتن شواهد تجربی برای بهبود و توسعه تئوری های آموزشی مورد استفاده قرار گرفته است که این امر موجب پدید آمدن حوزه جدیدی از پژوهش به نام داده کاوی آموزسی شده است .

داده کاوی آموزشی یک حوزه علمی نوظهور است که به توسعه روش هایی برای کاوش و اکتشاف داده های منحصر به فردمحیط های آموزشی می پردازد و از این روش ها برای درک بهتر دانش آموزانو محیط های آموزشی که فرآیند آموزش و یادگیری در آن صورت می گیرد استفاده می کند . در واقع داده کاوی آموزشی را می توان یک حوزه بین رشته ای در علوم مرتبط با فناوری آموزش ، روانشناسی ،هوش آزمایی ، علوم کامپیوتر و آمار دانست . که نتایج پژوهش های آن در راستای پاسخگویی به مسائل گوناگون موجود زمینه آموزش و بادگیری مورد استفاده قرار می گیرد . از علم داده کاوی با عنوان استخراج دانش از پایگاه داده یاد می شود که امکان کشف مفید و جدید را از میان حجم عظیمی از اطلاعات ذخیره شده را فراهم می آورد .

از کارهایی که براساس داده کاوی در حوزه آموزش انجام گرفته است می توان به نمونه های زیر اشاره کرد:

حسین اباذری برگشادی و همکاران ، پیش بینی هدایت تحصیلی دانش آموزان با رویکرد داده کاوی را مورد مطالعه و بررسی قرار داده اند. آنها از چهار الگوریتم درخت تصمیم ، بیز ساده ، ماشین بردار پشتیبان و شبکه عصبی برای مدلسازی بهره برده اند . ابتدا اطلاعات سوابق تحصیلی حدود هزار و دویست نفر دانش آموز فارع التحصیل دبیرستان های مدارس پسرانه و دخترانه شهرستان سلماس را جمع آوری نموده و دیتاست اولیه را برای ایجاد داده های آموزشی تنظیم کرده اند ، بعد از تمیز کردن داده های اولیه ، نهایتا داده های مربوط به هزار هفتاد و چهار دانش آموز کاهش پیدا کرد . در این تحقیق از نرم افزار رپیدماینر برای آماده سازی داده ها و مدلسازی استفاده شده است ، نتایج نشان می دهد درخت تصمیم نسبت به سه الگوریتم دیگر عملکرد بهتری داشته است

مینایی و همکاران درسال2012 شناسایی عوامل موثر بر افت تحصیلی بااستفاده از قواعد انجمنی و تحلیل خوشه ای را مورد بررسی قرارداده اند در این پژوهش تلاش برای پیاده سازی مدل های داده کاوی پیش بینی کننده به منظور پیش بینی وضعیت تحصیلی دانشجویان بر اساس مشخصات فردی و گذشته تحصیلی آنها بوده است ، با توجه به نتایج آماری که از ساخت مدل های پیش بینی کننده وضعیت دانشجو در این پژوهش بدست آمده است می توان با اطمینان بالایی از آینده تحصیلی دانشجویان بر مبنای داده های گذشته اطلاع حاصل نمود.

فریبا خادم القرانی و همکاران کاربرد داده کاوی در هدفمند کردن انتخاب رشته دانشگاهی و بهبود کیفیت برنامه ریزی آموزشی رامورد بررسی قرار داده اند .در این تحقیق تلاش بر آن بوده است تا با بکارگیری روش های داده کاوی از جمله درختان تصمیم گیری CART و C5.0 و تحلیل داده های جمع اوری شده از پرسشنامه هایی که از طریق دانشجویان دانشکده داروسازی دانشگاه علوم پزشکی اصفهان بدست آمده است . در این مقاله از نرم افزار Clementine12 استفاده شده است .

این نرم افزار امکان ایجاد مدل های متعددی را بر اساس تئوری های آماری ، هوش مصنوعی و یادگیری ماشین ارائه می دهد . نتایج بدست آمده حاکی از آن است توانایی پیشگویی مدل ایجاد شده توسط الگوریتم C5.0 بیشتر از الگوریتم CART می باشد . از جمله علت های این رخداد می تواند به خاطر تفاوت در رویه هرس این دو الگوریتم و داشتم متد boosting در مدل C5.0 می باشد

-2 توصیف داده ها

مجموعه داده پیش بینی وضعیّت تحصیلی دانش آموزان از دو مدرسه پرتغالی که از سایت یو سی ای استخراج شده است .ویژگی ها عبارتند از نمرات دانش آموز ، جمعیتی ، ویژگی های اجتماعی و ویژگی های مرتبط با مدرسه که با استفاده از گزارش های مدرسه و پرسشنامه جمع آوری شده است . این مجموع داده در حال حاضر شامل 395 نمونه و متغیر هدف G3 می باشد . تعداد فیلد ها ی این مجموعه داده 21 عدد می باشد نام فیلد ها و نوع آن در جدول شماره - 1 - مشاهده می کنید .

-3 تکنیک های مورد استفاده

دسته بندی و پیش بینی دو نوع عملیات برای تحلیل داده ها به منظور دسته های مهم داده ها ، فهم و پیش بینی رفتار آینده آنها می باشند. مدل های دسته بندی در تحلیل داده های گسسته و طبقه ای بکار رفته و مدل های پیش بینی یا رگرسیونی بیشتر بر روی داده های پیوسته کار می کنند. به عنوان مثال یک مدل دسته بندی ممکن است برای دسته بندی کردن وامهای بانک به دو طبقه وامهای بی خطر و پر خطر ، به کار رود درحالی که مدل های پیش بینی به کار گرفته شده در این کسب کار خاص، سعی در پیش بینی مخارج و هزینه های مشتریان براساس ویژگی های درآمدی و شغلی آنها دارند . پیش بینی ، عبارت است از تعیین مقدار یک متغیر پاسخ پیوسته بر حسب مقادیر متغیرهای مستقل.

درخت تصمیم : درخت تصمیم یکی از مشهورترین و قدیمی ترین روش های ساخت مدل دسته بندی است .درالگوریتم های دسته بندی مبتنی بر درخت تصمیم دانش خروجی به صورت یک درخت از حالات مختلف مقادیر ویژگی ها ارائه می شود . یکی از مزایای درخت تصمیم ایجاد امکانی برای شناخت بهتر فیلد های با اهمیت است. زیرا در درخت تصمبم به طور خودکار فیلدهای با اهمیت بیشتر به گره های بالایی درخت انتقال می یابند و همچنین درخت تصمیم فیلد های کم اهمیت را کنار می گذارد

شبکه های عصبی نمونه های ساده شده ای از نحوه عملکرد سیستم عصبی انسان است .یک شبکه عصبی که گاهی پرسپترون های چند لایه هم نامیده می شود ، یک مدل ساده شده ای از پردازش اطلاعات در مغز انسان است .شبکه های عصبی بوسیله شبیه سازی یک سری اتصالات داخلی که بین نرون ها است کار می کنند.واحد های پردازشی در لایه ها مرتب شده اند و به طور معمول سه قسمت در یک شبکه عصبی وجود دارد: یک لایه ورودی یک یا چند لایه پنهان و یک لایه خروجی ، این واحد ها به وسیله اوزان مختلفی به یکدیگر متصل شده اند

رگرسیون خطی یکی از تکنیک های پیچیده آماری برای داده هایی است کهمعمولاً در سطح سنجش فاصله ای می باشند . رگرسیون خطی به دو صورت رگرسیون خطی ساده و رگرسیون خطی چند متغیره مطرح می گردد. رگرسیون خطی ساده به پیش بینی مقدار یک متغیر وابسته بر اساس مقدار یک متغیر مستقل می پردازد.اما رگرسیون چند متغیره روشی است برای تحلیل مشارکت جمعی و فردی دو یا چند متغیرمستقل در تغییرات یک متغیر وابسته

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید