بخشی از مقاله
کاربرد تکنیک داده کاوی جهت ارتقا کیفیت یادگیری در سیستم آموزش الکترونیکی
چکیده
یکی از چالشهای اساسی در مراکز آموزش مجازی ارتقا کیفیت یادگیری در سیستم آموزش الکترونیکی می باشد روشهای مختلف برای ارزیابی کیفیت یادگیری و عوامل موثر بر آن ارائه شده است اعم ازاستفاده از مطالعات کتابخانه ای و تدوین پرسشنامه که با استفاده از روشهای آماری نتایج آن مورد ارزیابی قرار می گیرد به دلیل نیاز به تدوین پرسشنامه های با پارامترهای کاملا مطمئن و عدم اطمینان به پاسخگویی صحیح توسط کاربران بنا به دلایل مختلف، از اینرو در این مقاله کاربرد تکنیک داده کاوی اطلاعات جهت پیش بینی وضعیت تحصیلی دانشجو و عوامل موثر در یادگیری دانشجویان و ارزشیابی آنلاین پیشنهاد می شود .در تکنیک داده کاوی برای رسیدن به مدل مورد نظر از انباره داده آن مرکز آموزشی استفاده می شود که با اعمال مراحل داده کاوی با استفاده از الگوریتم های مختلف نظیر شبکه های عصبی و ماشینهای تصمیم گیری و خوشه بندی به مدل مناسب و مورد نظر دست یافت هر سیستم آموزش مجازی می تواند با بدست آوردن مدل مناسب راهکارهای مناسبی را جهت افزایش یادگیری و افزایش کیفیت سیستمش ارائه نماید و به این ترتیب در ارتقاء علمی سیستم آموزشی خود گام بردارد.
واژههای کلیدی
تکنیک داده کاوی،آموزش الکترونیکی،کیفیت یادگیری،دانشگاه مجازی
.1 مقدمه
فن آوری اطلاعات و ارتباطات وجه تمایز عصر حاضر ما با دوران گذشته است آنچه که امروز تحت عناوین شکاف یا فاصله بین کشورها، ملت ها، اقشارو افراد مطرح است با میزان بهره مندی و کاربرد فن آوری اطلاعات و ارتباطات تناسب مستقیم دارد. از اینرو میزان توسعه و کاربرد فن آوری اطلا عات و ارتباطات در امر آموزش مهمترین شاخص پیشرفت بشمار می رود.
.پدیده " آموزش مجازی یا آموزش الکترونیکی امروزه پر اهمیت ترین عامل رشد علمی ، پژوهشی، فرهنگی باشد .
امکانات موجود به ویژه دانش زبان خارجی، آشنایی با ابزار الکترونیکی، تجربه بهره گیری از اینترنت و داشتن نظایر آنها شرایطی را بوجود آورده است که اجرای برنامه های آموزش مجازی را در این بخش ساده تر و در شرایط موجود تا حدود زیادی امکان پذیر نماید.، وجود این منابع، هسته های ایجاد
مراکز دانشگاهی مانند دانشگاه الکترونیکیe-University دانشگاه مجازی Virtual University و دانشکده الکترونیکی e-College
را با نام ها و کاربری های متفاوت میسر سا خته است که در یک دید شامل منابع آموزشی، محیط مجازی و ارتباطات دیجیتالی هستند.
بدین ترتیب تمامی کشورها به منظور رقابت باید این بستر را در مراکز آموزشی خود آماده نمایند چرا که در حال حاضر ایجاد دانشگاه های الکترونیکی از مهمترین و محوری ترین راه های پیشرفت و توسعه در میان ملت ها می باشد. اما آنچه که این مراکز آموزشی را از هم جدا می کند کیفیت آموزشی مرکز می باشد و امروزه اصلی ترین دغدغه متولیان این نوع سیستم های آموزشی این است که سیستمی ارائه نمایند که موثر بوده و کیفیت آموزشی بالایی داشته باشند بطوریکه بتواند دانشجویان بیشتر و ماندگاری را جذب نمایند و بتوانند با پیش بینی وضعیت تحصیلی و آموزشی دانشجویان عوامل موثر در کیفیت آموزشی را پیش
بینی نموده و در تدوین برنامه های آموزشی و دوره های آ«وزشی این عوامل را مد نظر قرار دهند .مسئله مهم دیگری که در این مراکز آموزشی مطرح است حجم بسیار بالایی از اطلاعات در پایگاه داده های آنهاست که ممکن است ماهها و سالها بدون استفاده باقی بماند و فقط افزایش حجم بانک اطلاعاتی سیستم را در بردارند و در صورتی که متولیان و مشاوران این سیستمها در جهت افزایش کیفیت این نوع سیستم ها اقدام به تدوین پرسشنامه هایی نموده و به این طریق موجب افزایش دوباره حجم اطلاعات بانک اطلاعاتی می شوند این در حالیست که با دانش نوین داده کاوی می توان انباره داده های موجود در پایگاه داده ها را مورد تجزیه و تحلیل قرار داده و با اعمال الگوریتمهای خوشه بندی این اطلاعات موجود را دسته بندی نموده و با اعمال ماشینهای تصمیم گیری این اطلاعات ثبت شده را به دانش اساسی تبدیل نمود به طوریکه در اتخاذ تصمیم گیریهای مناسب جهت افزایش کیفیت سیستم آموزشی موثر می باشد از اینرو در این مقاله ابتدا مسائل مربوط آموزش الکترونیکی و
یادگیری الکترونیکی و دانشگاه مجازی را عنوان نموده و در بخشهای بعد تکنیک های داده کاوی مورد مطالعه و بررسی قرار می دهیم و مراحل انجام عملیات داده کاوی را بررسی می نماییم و درادامه کاربرد تکنیک داده کاوی در سیستم آموزش مجازی در پیش بینی وضعیت تحصیلی و بدست آوردن عوامل موثر در یادگیری یک مرکز آموزشی خاص را بیان می نماییم
.2 یادگیری الکترونیکی
از یادگیری الکترونیکی تعاریف متعددی ارائه شده است یادگیری الکترونیکی معادل آموزش مجازی است که فراگیری الکترونیکی یا آموزش مجازی در ساده ترین شکل، به مفهوم ارائه محتوای درسی از طریق اینترنت می باشد.
هرنوع یادگیری که از طریق رسانه های الکترونیکی صورت پذیرد، یادگیری الکترونیکی گفته می شود .به عبارت دیگرکاربردهای فناوری اطلاعات و ارتباطات در فرایندهای یاددهی-یادگیری را آموزش الکترونیکی گویند .بنابراین فصل مشترک فناوری اطلاعات و ارتباطات وتکنولوژِی آموزشی؛یادگیری الکترونیکی و یا آموزش الکترونیکی می باشد که ازآن تحت عناوینی چون آموزش مجازی ،آموزش الکترونیکی، ویادگیری الکترونیکی یاد می نمایند؛ یادگیری الکترونیکی پو یا و سریع است، همچنین یادگیری الکترونیکی شخصی و جامع
یادگیری الکترونیکی یک ابداع آموزشی است که می تواند از طریق لوح فشرده ، شبکه محلی یا اینترنت ارائه شود یادگیری الکترونیکی شامل آموزش مبتنی بر رایانه و آموزش مبتنی بر وب است.
.3 معرفی داده کاوی
دانش داده کاوی یکی از ده دانش در حال توسعه ای است که دهه آینده را با انقلاب تکنولوژیک مواجه خواهد ساخت و بدین رو در سالهای اخیر در دنیا گسترش فوق العاده سریعی داشته است
دانش داده کاوی فرآیند کشف دانش پنهان درون داده ها است که با برخورداری از دامنه وسیع زیرزمینه های تخصصی با توصیف، تشریح، پیش بینی و کنترل پدیده های گوناگون پیرامونی، امروزه دارای کاربرد بسیار وسیع در حوزه های مختلف از جمله صنعتی، پزشکی، ارتباطات، کشاورزی، انرژی، علوم اجتماعی، فرهنگی، سیاسی، اقتصادی، بازرگانی، نظامی و آموزشی و ... است بگونه ایکه امروزه مرز و محدودیتی برای کاربرد این دانش در نظر گرفته نشده و زمینه های کاری این دانش را در تمامی عرصه های برخوردار از داده می دانند.
در طول دهه گذشته حجم زیادی از داده ها در پایگاه داده ها انباشته و ذخیره شده اند و نتیجه این انباشتگی این است که سازمان ها در داده غنی ولی در کسب دانش بسیار ضعیف می باشند. امروزه میزان داده های در دسترس هر 5 سال دو برابر می شود و سازمانی توانا است که قادر باشد حداقل 7 درصد از اطلاعاتش را مدیریت نماید. تحقیقات انجام یافته نشان از آن دارد که سازمان ها امروزه کمتر از یک درصد از داده هایشان را برای تحلیل استفاده می نمایند. بعبارت دیگر امروزه سازمان ها در اطلاعات غرق شده اند در حالیکه گرسنه دانش هستند چرا که سازمان ها داده های زیادی را در تصرف خود دارند درحالیکه هنوز با فقدان دانش پنهان درون داده ها مواجه هستندعنوان بخشها
.3.1 دادهکاوی بٍبیاکشف دانش درپایگاه داده ها بَب ) ) KDD
علم نسبتا تازه ای است که با توجه پیشرفت کشور در زمینه IT و نگاه های ویژه به دولت الکترونیک و نفوذ استفاده از سیستم های رایانه ای در صنعت و ایجاد بانک های اطلاعاتی بزرگ توسط ادارات دولتی، بانک ها و بخش خصوصی نیاز به استفاده از آن به طور عمیقی احساس می شود. داده کاوی یعنی کشف دانش و اطلاعات معتبر پنهان در پایگاه های داده. یا به بیان بهتر تجزیه و تحلیل ماشینی داده ها برای پیدا کردن الگوهای مفید و تازه و قابل استناد در پایگاه داده های بزرگ ، داده کاوی نامیده می شود. داده کاوی در پایگاه های داده کوچک نیز بسیار پرکاربرد است و از نتایج و الگوهای تولید شده بوسیله آن در تصمیم گیری های استراتژیک تجاری شرکتهای کوچک نیز می توان بهره های فراوان برد.
.3.2 مفاهیم اساسی در داده کاوی
:Bagging
این مفهوم برای ترکیب رده بندی های پیش بینی شده از چند مدل به کار می رود.فرض کنیدکه قصدداریدمدلی برای رده بندی پیش بینی بسازیدو مجموعه داده های مورد نظرتان کوچک است.شمامی توانید نمونه هایی( با جایگزینی) را از مجموعه داده ها انتخاب و برای نمونه های حاصل ازدرخت رده بندی استفاده نمایید.به طورکلی برای نمونه های مختلف به درخت های متفاوتی خواهید رسید.سپس برای پیش بینی با کمک درخت های متفاوت به دست آمده از نمونه ها ،یک رای گیری ساده انجام دهید.رده بندی نهایی ، رده بندی ایخواهد بود که درخت های مختلف آنرا پیش بینی کرده اند.
این مفهوم برای تولید مدلهای چندگانه (برای پیش بینی یا رده بندی)به کار میرود Boosting از روش C&RT یا CHAID استفاده وترتیبی از classifier ها را تولید خواهد کرد.
این مفهوم برای ترکیب پیش بینیهای حاصل از چند مدل به کار میرود.و هنگامی که انواع مدلهای موجود در پروژه خیلی متفاوت هستند، کاربرد دارد. فرض کنید که پروژه داده کاوی شما شامل Tree classifierها نظیرC&RT وCHAID ، تحلیل خطی و شبکه های عصبی است.هر یک از کامپیوترها،رده بندی هایی رابرای نمونه هاپیش بینی کرده اند.تجربه نشان میدهدکه ترکیب پیش بینی های چند روش دقیق تراز پیش بینی های هریک از روشهاست.پیش بینی های حاصل از چند classifier را می توان به عنوان ورودی meta-linear مورد استفاده قرار داد-. meta
linearپیش بینی هارا ترکیب می کند تا بهترین رده بندی پیش بینی شده حاصل شود.
.3.3 ابزار های داده کاوی
درختان تصمیم گیری شبکه های عصبی (شبکه های عصبی کوهونن و آرت برای
طبقه بندی و خوشه بندی ) قاعده های استقراء نزدیکترین همسایگی الگوریتمهای ژنتیک طبقه بندی خوشه بندی
کشف جمعی تصویری کردن
.3.4 مراحل داده کاوی
:Data Mining بخش اصلی فرایند که در آن با استفاده از روش ها و تکنیکهای خاص ، استخراج الگو های دانش صورت می گیرد. ارزیابی الگوها: تشخیص الگو های صحیح مورد نظر ، از سایر الگو ها در این مرحله انجام می شود. صحت الگوها بر اساس یک سری معیار های جذابیت سنجیده می شود.
برای اینکه الگوریتم Data Mining بتواند عمل استخراج دانش را بخوبی انجام دهد، نیاز به یک سری پیش پردازش ها بر روی مجموعه آموزشی و یک سری پس پردازش ها بر روی الگوهای استخراج شده دارد.
5.3. پیش پردازهای لازم جهت استخراج دانش
.1 پاکسازی داده : برای از بین بردن اغتشاش در داده
با توجه به عنوان ، این مرحله برای تشکیل محیطی پیوسته و یک پارچه جهت انجام مراحل بعدی و داده کاوی در آن، انجام می گیرد.در حالت کلی انبار داده مجموعه پیوسته و طبقه بندی شده است که دائما در حال تغییر بوده و دینامیک است که برای کاوش آماده می شود.
.2 جمع آوری داده : جمع آوری داده از منابع مختلف و قراردادن در انباره داده
.3انتخاب داده ها : داده های مرتبط به فرایند Data Mining از سایر داده ها جدا می شود. این مبحث را می توان بخشی از فرایند کاهش اطلاعات نیز دانست. در این مرحله برای کم کردن هزینه های عملیات داده کاوی، داده هایی از پایگاه داده انتخاب می شوند که مورد مطالعه هستند و هدف داده کاوی دادن نتایجی در مورد آنهاست.
4.تبدیل داده ها: داده ها به قالبی قابل استفاده برای Data Mining در می آیند. از اعمالی که در این مرحله صورت می گیرد ، می توان به خلاصه سازی و یا محاسبه مقادیر تجمعی اشاره کرد.
مشخص است برای انجام عملیات داده کاوی لزوما بایـد تبـدیلات خاصی روی داده ها انجام گیرد ممکن است این تبـدیلات خیلـی راحت و مختصر مثل تبدیل byte به integer باشد یـا خیلـی پیچیده و زمان بر و با هزینه های بالا مثل تعریف صفات جدیـد و یا تبدیل و استخراج داده ها از مقادیر رشته ای و ... باشد.
.5 کاوش در داده ها .
در این مرحله است که داده کاوی انجام می شود.در این مرحله با استفاده از تکنیک های داده کاوی داده ها مورد کاوش قرار گرفته ، دانش نهفته در آنها استخراج شده و الگو سازی صورت می گیرد. .6 تفسیر نتیجه .
در این مرحله نتایج و الگو های ارائه شده توسط ابزار داده کاو مورد بررسی قرار گرفته و نتایج مفید معیین می شود.
در شکل (1) فرایند کسب دانش از پایگاه دادهها به صورت شماتیک بیان شده استژلب
شکل-1فرایند تبدیل داده ها به دانش
.4 روش های آماری در افزایش کیفیت آموزش الکترونیکی
در روش های پیشین برای استخراج عوامل موثر در یادگیری از روش مطالعات کتابخانه ای استفاده می شد درتحقیقات مطالعاتی در چند مرحله انجام می شود. با توجه به هدف تحقیق و نتایج مطالعه کتابخانه ای، پرسشنامه ای تدوین می شود با توجه به موضوع تحقیق جامعه آماری تحقیق که شامل دانشجویان دوره های مجازی هستند انتخاب شده و این پرسشنامه توسط کاربران مورد نظر تکمیل می شود
در مرحله آخر و پس از دریافت پاسخ همه پاسخگویان مورد نظر، فایل با فرمت مورد نظر به نرم افزار آماری ارسال می شود و با توجه به پاسخ های کاربران و اعمال متغیرهای لازم نتایج استخراج می شود و پس از تجزیه و تحلیل نتایج بدست آمده عوامل موثر شناسایی می شوند
.4.1 معایب روش مطالعاتی
در این روش فرضیه هایی مد نظر می باشد و بر مبنای آن فرضیه ها سوالات طرح می شود و با بررسی و تجزیه و تحلیل سوالات پرسشنامه تدوین می گردد واین پرسشنامه به حجم محدودی از کاربران ارسال می گردد به عبارتی یک جامعه آماری انتخاب می گردد و امکان ارسال پرسش نامه به تمامی کاربران وجود ندارد از اینرو پرسشنامه فقط به افراد انتخاب شده محدود ارسال میگردد ودر بیشتر مواقع درصدی از افراد به پرسشنامه ها جواب نمی دهند و یا به صداقت جواب نمی دهند و یا بادقت جواب نمی دهند از اینرو نتایج بدست آمده از تحلیل پاسخهای پرسشنامه های کاربران دقت و درستی 111 درصد را نخواهدداشت در صورتی که حجم اطلاعات بسیار باشد انتخاب کردن یک جامعه
آماری محدود و حذف پرسشهای اضافی امری نه چندان مطلوب خواهد بود امروزه برای رفع این مسائل از روش داده کاوی اطلاعات جهت
کشف دانش استفاده میشود و هدف ما در این مقاله معرفی داده کاوی اطلاعات در استخراج عوامل موثر در یادگیری می باشد در این مقاله ما به بررسی نحوه استفاده از داده کاوی در افزایش
کیفیت سیستم های آموزش الکترونیک پرداخته شده است این امر مستلزم ارزشیابی و پیش گویی نتیجه تحصیلی کاربران سیستم آموزش الکترونیک می باشد اکتشاف در این مرحله معمولا با آماده سازی داده ها که ممکن
است شامل تمیز کردن داده ها ، تبدیل داده ها ، زیر مجموعه های انتخاب آثار ضبط شده و انجام برخی از عملیات اولیه انتخابشروع می شود . سپس بسته به ماهیت تحلیلی ، این مرحله از فرایند استخراج داده ها ممکن است شامل هر انتخاب ساده و سرراست برای یک مدل رگرسیون استادانه درست شده را به تجزیه و تحلیل اکتشافی با استفاده از طیف گسترده ای از روش های گرافیکی و آماری به منظور شناسایی متغیرهای مربوطه و تعیین پیچیدگی از طبیعت مدل ها باشد. البته ناگفته نماند که داده کاوی معمولا با نوشتن مقدار زیادی گزارش و تحقیق و استعلام در آنها اشتباه گرفته می شود. اما در واقع داده کاوی هیچ کدام از اینها را شامل نمی شود. داده کاوی توسط تجهیزات خاصی صورت می پذیرد، که عملیات کاوش را بر اساس تجزیه و تحلیل مکرر داده ها انجام می دهد. داده کاوی با آنالیز های متداول آماری نیز متفاوت است؛در