بخشی از مقاله

شخصی سازی سیستم های یادگیری الکترونیکی با استفاده از روشهای داده کاوی
چکیده
امروزه استفاده از سیستم های یادگیری الکترونیکی مبتنی بر وب رشد بسیاری داشته است زیرا این سیستم ها در هر زمان و در هر مکان قابل دسترسی می باشند. از انجایی که هر فراگیر بطور کلی دارای خصوصیات متفاوت مرتبط با یادگیری می باشد، لزوم سیستم های تطبیقی در این زمینه بسیار بدیهی می باشد. تطبیق با خصوصیات فراگیر به فراگیر کمک می کند تا به موضوعات بصورت کاراتری تسلط پیدا کند. یک خصوصیت مطلوب برای سیستمهای یادگیری الکترونیکی فراهم نمودن اطلاعات مناسب برای فراگیر طبق نیازها و علایقش میباشد. در این مقاله با استفاده از تکنیکهای داده کاوی، الگوهای رفتاری کاربران یک سیستم آموزشی مبتنی بر وب استخراج شده و از تحلیل نتایج ان برای پیشنهاد به کاربر استفاده شده است. برای این منظور یک سیستم نمونه و دادههای ان بررسی شده و نشان داده شده که چگونه با استفاده از تحلیل نتایج حاصل از آن می توان یک ماژول پیشنهاد کننده به سیستم مودل اضافه نمود.
واژههای کلیدی
سیستمهای یادگیری مبتنی بر وب، یادگیری الکترونیکی، شخصی سازی، تولید پیشنهاد، داده کاوی، سیستمهای تطبیقی


۱ - مقدمه
فناوری امروزی در سیستم های اطلاعاتی وضعیت آموزش و یادگیری را نیز متحول کرده است. بطوری که تمایل بسیاری به یادگیری الکترونیکی بمنظور دسترسی به اطلاعات عظیم موجود در وب ایجاد شده است. برای استفاده بهینه تر از این سیستمهای یادگیری الکترونیکی، تطبیق و شخصی سازی" در این سیستم ها یک الزام شده است. بیشتر سیستم های تطبیقی مبتنی بر وب درصدی از محتوا و پیمایش خود را طبق یک سری قوانین از پیش تعریف شده با تمایلات کاربر منطبق می کنند. با توجه به رفتارها و تمایلات متفاوت کاربران، تولید تمامی قوانین مناسب بسیار دشوار می باشد. این مسئله در سیستمهای یادگیری الکترونیکی پررنگتر میباشد، زیرا تطبیقی سیستم متناسب با سبک یادگیری هر فرد بطوری که فراگیر بتواند به راحتی به اطلاعات مورد علاقه اش دسترسی پیدا کند، بسیار اهمیت دارد. یکی از راه های انجام عمل تطبیق استفاده از دادههای جمع آوری شده توسط سیستم یادگیری الکترونیکی می باشد . متدها و تکنیک های استخراج دانش "کمک می کنند تا اطلاعات جالب توجه برای عمل تطبیق از این دادهها استخراج و از آنها برای تسهیل توسعه مدل تطبیقی استفاده شوند. استخراج دانش در سیستم های یادگیری الکترونیکی یک فرایند کامل است نه یک الگوریتم خاصی. هدف ان کشف الگوهای پنهان مورد علاقه در داده های جمع آوری شده در طول دوره یادگیری فراگیر می باشد. این فرایند شامل گام های اصلی استخراج دانش و سپس کاوش داده های وب " می باشد. در این فرایند ابتدا باید دامنه کاربرد بخوبی درک شود، مسئله بیان شود و داده ها جمع آوری گردد . سپس، داده های حاصل پاکسازی و پیش پردازش می شوند. ممکن است این مرحله شامل یکپارچه کردن داده های منابع مختلف، انتخاب صفات مربوط و تبدیل داده ها برای مرحله بعدی (داده کاوی) نیز باشد. در مرحله داده کاوی از تکنیک های مختلفی برای استخراج الگوها یا طبقه بندی استفاده می شود. در مرحله آخر استخراج دانش، اطلاعات کشف شده تحلیلی و تفسیر می شوند و برای استفاده کاربردی بمنظور بهبود تطبیقی سیستم های یادگیری الکترونیکی معرفی می شوند. ادامه این مقاله به این صورت خواهد بود که ابتدا در بخش دوم به بررسی مطالعات مرتبط در این زمینه پرداخته شده و متدهای داده کاوی و ارائه پیشنهاد در سیستمهای یادگیری الکترونیکی را از منظر هر کدام از آنها بیان شده است. در بخشی سوم دادههایی معرفی می شوند که عموماً در داده کاوی سیستمهای یادگیری الکترونیکی استفاده می شود . در بخش چهارم پیش پردازش داده ها توضیح داده شده است . سپس در بخش پنجم کار انجام شده بر روی داده های یک سیستم مودل نمونه و استفاده از نتایج آن در تولید پیشنهاد ارائه شده، و در نهایت در بخش ششم این مقاله با یک جمع بنجی و معرفی کارهای آینده خاتمه داده شده است.
۲ - کارهای مرتبط
استخراج دانش برای پیشنهاد لینک های پیمایشی " اغلب برپایه کاوش داده های کاربرد می باشد. رویکردهای کنونی اکثراً وارد ناحیه کاوش دادههای وب شده اند. تکنیکهای داده کاوی معمولاً برای این منظور استفاده می شود عبارتند از استخراج خوشه ها، استخراج قوانین انجمنی " و الگوهای ترتیبی " . از الگوهای کشف شده با روی کردهای متفاوتی برای پیشنهاد لینک های پیمای شی (بصورت سراسری یا محلی، مستقیم یا غیر مستقیم) استفاده می شود. منبع اصلی استخراج دانش در یک سیستم یادگیری الکترونیکی فایل گزارش " فعالیتهای یادگیری کاربر می - باشد و هدف اصلی کشف ویژگی های الگوی پیمایشی کاربر در یک جلسه یادگیری می باشد. یک جلسه یادگیری همانند تراکنش های خرید مشتری ها از یک فروشگاه الکترونیکی است،
بطوری که هر دو نشان دهنده این هستند که کاربر چه چیزی را ترجیح میدهد.
تکنیکهایی که در ۳ برای داده کاوی استفاده شده است عبارتند از: کاوش قوانین انجمنی "، کاوش الگوهای توالی " و کاوش الگوهای پیمای شی". قوانین انجمنی و توالی بطورکلی انواع برجسته الگوهای وب می باشند. کاوش قوانین انجمنی، یک سری از محتواهای مرتبط به هم را پیدا می کند؛ در صورتی که کاوش الگوهای توالی ترتیب محتواهای دیده شده را هم در نظر میگیرد، این محتواها لزوماً به هم متصل نیستند و به همین دلیل یافتن الگوی پیمایشی دشوار است. الگوهای پیمای شی اغلب بعنوان الگوهای توالی متصل نامیده می شوند که برای کشف توالیهای مکرر در جلسه های یادگیری کاربر استفاده میشوند.
الگوهای کشف شده برای پیشنهاد محتوای مرتبط به کاربر استفاده میگردد. نتیجه پیشنهاد، یک توالی از محتواها می - باشد که فراگیر احتمالاً باید آنها را در مرحله بعدی از فرایند یادگیری خود ببیند. از آنجایی که با چند نوع الگو کار می کنیم، باید بیان پیشنهاداتی که از هر نوع بدست می آوریم تفاوت قائل شویم. مناسب بودن هر نوع از الگوها برای پیشنهاد در شکل ۱ نشان داده شده است.

الگوهای پیمایشی برای تولید پیشنهاد معتبرتر می باشند زیرا در یک سیستم یادگیری الکترونیکی ترتیب مناسب محتواها برای یادگیری فراگیر بسیار اهمیت دارد . الگوهای توالی و قوانین انجمنی هم برای تولید پیشنهاد استفاده می - شوند، اما آنها راهنمای کلی تری نسبت به الگوهای پیمایشی می باشند. در نتیجه ارزیابی مناسب بودن پیشنهاد محتوا برمبنای نوع الگویی میباشد که پیشنهاد بر اساس آن بوده است. ارزیابی بر اساس یک مجموعه داده تست و همچنین بازخورد فراگیر انجام می شود.

در [9] برای تطبیق ابتدا مدلی برای کاربر ساخته می شود، که این مدل شامل خصوصیات شخصی فراگیر مانند سبک یادگیری، پیشینه دانشی کاربر و غیره می باشد . متدهای متفاوتی برای کشف مدل کاربر وجود دارد . تفاوت این متدها بر پایه صفاتی که استفاده می شود (خصوصیات شخصی، فاکتورهای رفتاری و غیره)، تکنیکها (شبکه بیزین "، درخت. درختهای تصمیم گیری " و غیره ) و همچنین زیرساخت (سیستمهای مدیریت یادگیری " ، یک واسطه کاربر خاص وغیرہ) می باشد . در ا۹ا سبک یادگیری کاربر بر مبنائی " FSLSM استخراج می شود. ابتدا علایق کاربر با استفاده از پرسش های ساده کشف می شود. فراگیر آن دسته از اشیائی را در طول یادگیری انتخاب می کند که نیازهای شی را برطرف سازند. سپس با استفاده از اطلاعات بدست آمده پروفایل کاربر تشکیل می شود. پروفایلهای تشکیل شده با الگوریتم طبقه بندیNBtree خوشه بندی می شوند. خوشه بندی پروفایلها با استفاده از یک مجموعه آموزشی "سیستم که شامل تمامی سبک های یادگیری است، بصورت برون خطی " انجام می شود. در نهایت مدل کاربر تشخیص داده می شود. این فرایند بصورت برون - خطی برای هر فراگیر فقط در اولین ورود به سیستم انجام می - شود، و سپس بر اساسی مدل کاربری اش محتوا و لینک های مربوط به او پیشنهاد می شود . سبک یادگیری فراگیرها با گذشت زمان به کندی تغییر می کند، به همین دلیل می توان در بازههای زمانی به نسبت طولانی این فرایند را بمنظور به روز کردن تغییرات در مدل کاربر تکرار نمود. در متدهایی برای پیشنهادهای خودکار برمبنای رفتار یک کاربر منفرد مطابق با تمامی کاربران موجود در سیستم پیشنهاد شده است . متد پیشنهادی، نسخه تغییر یافته الگوریتم داده کاوی استقرایی" بر روی فایلهای گزارش وبسایت میباشد و هدف ان کمک به کاربران برای انتخاب لینک - های بهسوی است. فرایند کشف قوانین انجمنی و تبدیل آنها به پیشنهادهایی برای کاربر بر مبنای تکنیک دو مرحله ای که نسخه تغییر یافتهای از الگوریتم استقرایی می باشد، تحلیل شده است. در مرحله اولی وجود قوانین انجمنی بررسی می شوند و در مرحله دوم قوانینی کشف می شوند که واقعا به هم ارتباط دارند. در سیستم پیاده سازی شده به محض اینکه کاربر جلسه را در سیستم وب خاتمه می دهد، همه دادهها به اضافه داده های اخیر دوباره برای پیشنهادهای بعدی پردازش می شوند. در [1] ابر روی تولید پیشنهادها برمبنای مدل موضعی کاربر و انتولوژی وب سایت بحث شد ه است . اکثر متدهای تحلیل دادههای کاربرد برای تولید پیشنهاد و بهبود تطبیق در سیستم وب، قادر به بررسی جنبه های معنایی وب نیستند . از آنجایی که آنتولوژی ها بهترین شیوه برای نمایش ساختار اطلاعات با درنظر گرفتن معانی می باشد، استفاده از انها یک گرایش جدید در کاوش وب را بوجود آورده است. در [4] از تمامی اطلاعات موجود در مورد کاربر در وب - سایت برای داده کاوی استفاده می شود تا مدل های کاربر استخراج، و درنهایت از این مدلها برای انجام عمل تطبیقی استفاده شود. کلی فرایند شخصی سازی وب بر مبنای کاوش دادههای کاربرد و با شامل سه فاز می باشد: پیش پردازش دادهها، کشف الگوها و تولید پیشنهاد. دو فاز اول بصورت برون خطی و فاز آخر بصورت برخط " اجرا می شود. پیش پردازش داده ها، فایلهای گزارش وب و پروفایل ها را به داده های مناسب برای داده کاوی تبدیل می کند. کشف الگوها با استفاده از تکنیک های داده کاوی مانند خوشه بندی، استخراج الگوهای ترتیبی و قوانین انجمنی انجام میشود. در نهای مت با استفاده از الگوهای کشف شده لینک ها یا محتواهایی به کاربر پیشنهاد می شود. دو نوع معماری برای سیستم پیشنهاد مبتنی بر وب در [4] معرفی شده است که عبارتند از: معماری پایهای برای سیستم پیشنهاد مبتنی بر وب : در این سیستم فقط آن دسته از اطلاعات فراگیر که در فایل های گزارشی ذخیره شده است، استفاده می شود. این سیستمها فقط از یک الگوریتم داده کاوی استفاده می کنند که معمولا الگوریتم کشف توالیهاست". که این الگوریتم بر روی تمامی جلسات پیمایشی کاربر" انجام می شود و بمنظور کشف الگوهای پیمای شی مکرر کاربر برای پیش بینی پیمایش کاربر و تقاضای صفحه بعدی او می باشد . یکی از مشکلات این نوع سیستمها این است که فراگیر جدید همین پیشنهادها را در پیمای شی جاری خود به کندی دریافت میکند. معماری پیشرفته برای سیستم پیشنهاد مبتنی بر وب و در این سیستم از اطلاعات دیگری در مورد فراگیر (مانند پروفایل ها) نیز استفاده می شود . این سیستم از چندین الگوریتم داده کاوی استفاده می کند مانند خوشه بندی و کشف الگوهای توالی. در این شیوه فراگیرهایی که رفتار و یا دانش مشابهی دارند در دسته های یکسانی قرار می گیرند و سپس الگوهای توالی در هر دسته کشف میشود. این سیستم می تواند پیشنهادها را شخصی کند. ابتدا فراگیرهای جدید را در دسته مناسب قرار می دهد، سپس از الگوهای توالی موجود در آن دسته برای شخصی کردن پیشنهادها برای فراگیر فراگیرهای مشابه و وضعیت جاری پیمایشی او، استفاده می - کند. در [5] نشان داده شده است که کاربرد تکنیک های داده کاوی در سیستم های مدیریت درسی، برای مدرسهای برخط مفید میباشد. و همچنین نشان داده شده است که تکنیکهای مجزای داده کاوی می توانند با هم برای بدست اوردن اطلاعات مورد علاقه به شیوهای سریع تر و کاراتر بکار گرفته شوند . ابتدا مدرس با استفاده از تکنیک های تصویری " یک دید کلی نسبت به فراگیرها بدست می آورد. و مثلاً اگر به نقاط غیرمعمول یا عجیبی برخورد نمود می تواند با دیدن مقادیر آماری اطلاعاتی در مورد آن بدست آورد. یا اینکه اگر گروه های مشابهی از فراگیرها در گراف پیدا کرد، می تواند با استفاده از تکنیک - های خوشه بندی فراگیرها را به گروه هایی دسته بندی کن د. همچنین از این گروه ها برای ساخت یک دسته کننده " برای دسته بندی فراگیرها استفاده میشود. در [6] تکنیکهای داده کاوی بطور کلی برای حل مسائل یادگیری الکترونیکی بررسی شده است. مراجع بر حسب اینکه از چه تکنیکهای مدلسازی (شبکههای عصبی، الگوریتم های ژنتیک، متدهای خوشه بندی و تصویری، منطق فازی، عامل های هوشمند، استدلال استناجی " و غیره) استفاده نموده است، سازماندهی شده است. همچنین اطلاعات بر حسب نوع مسائل داده کاوی (خوشهبندی، دسته بندی، پیش بینی و غیره ) نیز سازماندهی شده است. در نهایت آن دسته از مسائل یادگیری الکترونیکی که با تکنیک های داده کاوی قابل حل می باشند، بررسی شده است. این مسائل عبارتند از دسته بندی فراگیرها برپایه کارایی یادگیری آنها، شناسایی رفتارهای غیرمعمول یادگیری، پیمای شی سیستم یادگیری الکترونیکی و بهینه سازی تعاملات، خوشه بندی براساسی استفاده مشابه از سیستم یادگیری الکترونیکی، و قابلیت تطبیقی سیستم با نیازها و ظرفیتهای فراگیر. قوانین انجمنی گزینه خوبی برای کشف الگوهای ترتیبی است. در الگوهای ترتیبی تکرار موردها و همچنین توالی آنها اهمیت دارد [7] در یادگیری الکترونیکی به کمک الگوهای ترتیبی می توان با ارزیابی فعالیت های فراگیر، درسی ها را مطابق وضعیت او ارائه نمود. همچنین می توان سایت ها را
بجصورت مناسب سازماندهی نمود و به فراگیرهایی که خصوصیات مشابهی دارند پیشنهاد مناسبی ارائه کرد، و فعالیتهای شخصی سازی شده برای گروههای مختلف یادگیرندگان تولید نمود. حجم دادهها در سیستم های مدیریت یادگیری خیلی زیاد نیست زیرا تعداد فراگیرها خیلی زیاد نیست ؛ هر چند ممکن است در برخی سیستمهای مجازی این تعداد بیشتر شود. اما از آنجا که ممکن است تعداد دفعات تعامل یک فراگیر با سایت زیاد باشد ممکن است تعداد نمونه ها افزایش یابد ولی ویژگی مثبت در این نوع سیستمها اینست که داده ها تمیز و صحیح می باشند و به اختلال های" ناشی از دستگاههای اندازه گیری آلوده نیستند. برای آنکه قوانین مناسب را بیابیم باید پارامترها را درست تعریف کنیم. یا آنکه بعد از کشف آنها موارد نامفید را حذف کنیم. یک راه دیگر مبتنی بر کاربرد است، یعنی قوانینی را مفید درنظر می گیریم که با دانش قبلی کاربرد ر تضاد باشد (برای کاربر مطلب جدیدی باشد) یا آنکه کاربر بتواند روی آن کاری انجام دهد یا موارد دیگری که انتظارش را نداشته است. برای توضیح قابل فهم قانون استخراج شده نیاز به دانش فرد خبره داریم. راه دیگر برای قابل فهم شدن قوانین این است که آنتولوژیهای قابل فهم برای دامنه های اختصاصی فراهم آوریم تا مدرسان به راحتی معانی قوانین را درک کنند [7] در[10] از تکنیک خوشه بندی برای ساخت یک مدل داده کاوی استفاده شده است، که به وسیله این مدل ، ویزگی ها و متغیرهای پنهان در داده های جمع آوری شده از سیستم مودل، کشف میشود. در نهایت از نتایج این مدل برای تطبیق سازی درسی های موجود در سیستم استفاده شده است. ایدهای برای یک سیستم پیشنهاد دهنده برای سیستم - های یادگیری الکترونیکی بمنظور انتخاب بهتر منابع یا ابزار یادگیری، با استفاده از قوانین انجمنی در [11] ارائه شده است؛ بطوری که از فایل گزارش فراگیرها در سیستم مدیریت یادگیری مودل و اطلاعات تحصیلی، شخصی و تعاملات فراگیرها استفاده شده است . داده کاوی و ابزار آماری ، برای یافتن ارتباط بین رفتارهای دسترسی به سیستم ، عادات مطالعه، و کارایی کلی یادگیری مورد استفاده می باشد. در [12] نیز بر اساس قوانین انجمنی، الگوریتم استقرایی برای استخراج اطلاعات استفاده شده است. در نهایت ارتباط بین هر دو مفهوم محاسبه شده و نقشه مفهومی برای سیستم های یادگیری تطبیقی، ساخته میشود. با توجه به مطالعات انجام شده، سیستم مودلی را با هدف اضافه نمودن ماژول پی شنهاد دهنده انتخاب نمودیم. همچنین با درنظر گرفتن نوع داده هایی که از این سیستم در اختیار داریم تکنیک الگوهای ترتیبی را بمنظور برآورده ساختن هدف پژوهشی برگزیدیم.
۳ - دادههای مورد استفاده برای استخراج دانش هدف اصلی استخراج دانش در سیستم های یادگیری الکترونیکی کشف خصوصیات الگوهای رفتاری فراگیرها، یا گروهی از آنها در طول فرایند یادگیری می باشد. دادههای مورد استفاده برای استخراج دانش بسیار قابل توجه می باشد . در سیستمهای یادگیری الکترونیکی چند نوع داده وجود دارد که می تواند برای این فرایند مفید باشد[3]
• فایل گزارش فعالیتهای کاربر"
• سطح دانش کاربر"
• ساختار مدلل دامنه".
در ادامه هر کدام از این موارد توضیح داده میشود.
۱-۲ فایل گزارش فعالیتهای کاربر
این فایلها منبع اصلی داده کاوی میباشند. این دادهها نشان میدهند که سیستم یادگیری الکترونیکی چگونه توسط فراگیرها استفاده می شوند - کدام محتوا (عناصر اطلاعاتی ) را فراگیر دیده است و چه اطلاعاتی با آن نمایش داده شده است. مدخلهای فایل گزارش معمولاً شامل برچسب زمانی " می باشد که میتواند به تخمین زمان صرف شده بر روی یک مفهوم مفید باشد. اگر فایلهای گزارش سیستم در دسترس نباشد، گزارشهای بدست آمده از وب سرور را می توان استفاده نمود.
۲-۲ سطح دانش کاربر در فرایند استخراج دانش، دانستن سطح دانش هر فراگیر در یک مفهوم خاصی اهمیت بسیار دارد. ما معمولا به کاوش داده - های مربوط به فراگیرهای موفق علاقمند می باشیم، یعنی آن دسته از فراگیرهایی که سطح دانش بالایی در مورد محتوایی که دیده اند، دارند زیرا هدف ما کمک به فراگیرها برای یادگیری موفق می باشد . تخمین سطح دانش کاربر کاری پیچیده می باشد که توسط سیستم یادگیری الکترونیکی انجام می شود و در مدل کاربر ذخیره می شود. نتایج تست های بر خط یا تست های خارج از سیستم (تست هایی که بصورت کاغذی برگذار می شود) می تواند به تخمین سطح دانش کلی فراگیر کمک کند. سطح دانش کلی برای تعیین زیرمجموعه - ای از دادههای حاصل در مرحله بعدی استخراج دانش برای داده کاوی، استفاده می شود.
۳-۲ ساختار مدل دامنه
ساختار مدل دامنه منبع مهمی برای کشف الگوهای مفید موجود در دادههای کاربرد می باشد. مدل دامنه در سیستم یادگیری الکترونیکی ترکیبی از مجموعه عناصر اطلاعاتی می باشد . این عناصر اطلاعاتی در سیستم یادگیری الکترونیکی را می توان بصورت مستقیم نام گذاری کرد، مانند محتوا، موارد اطلاعاتی، عناوین، خروجی های یادگیری، یک روی کرد برای ساختار محتوای دامنه در سیستم های یادگیری الکترونیکی، استفاده از سلسله مراتب " می باشد.
۴ - پیش پردازش دادهها هدف مرحله پیش پردازش کشف جلسه های یادگیری هر فراگیر و همچنین کشف تناقض ها و خطاهای بالقوه موجود در دادههای کاربرد می باشد. نتیجه مرحله پیش پردازش توالی از محتوای یادگیری دیده شده، به همراه زمان صرف شده بر روی آنها و دادههایی در مورد کاربر می باشد. گام های زیر برای پیش پردازش دادههای سیستم یادگیری الکترونیکی مبتنی بر وب می باشد [3]
• حذف مدخلهای بی ربط

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید