بخشی از مقاله

*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***

پیشبینی عملکرد تحصیلی دانش آموزان بر اساس نمرات تاریخچهای

 


چکیده: انتخاب رشته تحصیلی دانشآموزان سال اول دبیرستان، تاثیر بسیار زیادی در آینده تحصیلی آنها میگذارد. به همین دلیل، این امر دارای اهمیت بالایی است و یکی از دغدغههای دانشآموزان در دوران تحصیل میباشد که باید با دقت و به صورت علمی انجام شود. علم دادهکاوی شاخهای در علم کامپیوتر و فناوری اطلاعات است که میتواند با استخراج الگوهای مناسب و دانش نهفته در دادههای مورد بررسی، راهکارهای مناسبی را در این زمینه ارائه دهد و کمک شایانی به تصمیمگیرندگان نماید. در این مقاله با استفاده از یک الگوریتم دادهکاوی، آینده تحصیلی دانشآموزان سال اول دبیرستان پیشبینی میشود و میزان موفقیت و شکست آنها در رشتههای مختلف به آنها گزارش میشود. در این روش پیشنهادی، نمرات دروس اصلی سالهای سوم راهنمایی و اول دبیرستان هر دانشآموز به عنوان ورودی گرفته میشود و سپس سعی میشود که بر اساس این نمرات و با استفاده از داده کاوی، نمرات دروس اصلی سال سوم دبیرستان این دانشآموز و موفقیت یا شکست او در دوره پیشبینی شود. بدین ترتیب هر دانشآموز پیشاپیش از آینده تحصیلی تخمین زده شده برای رفتنش به رشتههای مختلف باخبر میشود و سعی میکند رشتهای را انتخاب کند که آینده موفقتری در پیش رو دارد. دقت روش پیشنهادی برای پیشبینی آینده تحصیلی بر روی دادههای یکی از دبیرستانهای پسرانه شهر اصفهان ارزیابی شده است و همچنین نتایج به دست آمده از تنظیمات مختلف الگوریتم و مقایسهی میزان درستی آنها نیز ارائه شده است.

واژههای کلیدی: آینده تحصیلی، انتخاب رشته، پیشبینی، دادهکاوی، نمرات تاریخچهای

1

-1 مقدمه

یکی از مسائل فکری مدیران آموزشی انتخاب رشتهی دانشآموزان در سال اول دبیرستان است. در بیشتر دبیرستانها، مدیران و معاونان با این مشکل مواجه هستند که هر دانشآموز برای ادامه تحصیلات دبیرستان، چه رشتهای را انتخاب کند. مسئله مهمتر اینکه دانشآموز در رشتهی انتخابیاش به چه میزان موفق خواهد بود و آیا معدل خوبی کسب خواهد کرد یا نه؟ جواب اینگونه سوالات را میتوان از طریق پیش-بینی آینده تحصیلی هر دانشآموز به دست آورد. این پیشبینی به منظور انجام برنامهریزیهای تحصیلی مناسب، ارائه مشاورههای تحصیلی، انجام اقدامات پیشگیرانه و یا تشویقهای انگیزشی انجام میشود. همچنین با این روش، از صرف هزینههای بیجهت و هدر رفتن منابع و استعدادهای جامعه پیشگیری میشود.

امروزه در اکثر ادارات آموزش و پرورش و مدارس، بانک اطلاعات وسیعی از اطلاعات دانشآموزان موجود است که حجم بالایی از اطلاعات مربوط به سوابق آموزشی، تحصیلی و غیره را شامل میشود. پیدا کردن الگوها و دانش نهفته در این اطلاعات میتواند به مدیران عرصه آموزشی در جهت ارتقاء و بهبود فرآیندهای آموزشی و مشاوره کمک شایانی کند. تکنیکهای پیشبینی، الگوهای قابل فهم، ناشناخته، مفید، معتبر و بدیع را از دادههای آموزشی استخراج میکنند و از این الگوها برای پیشبینی دادههای آینده استفاده میکنند.
در این مقاله از الگوریتم -Kنزدیکترین همسایه K-Nearest Neighbor) یا به اختصار (KNN جهت پیشبینی آینده تحصیلی دانش-آموزان استفاده خواهد شد؛ بدین ترتیب که با استفاده از دادههای تاریخچهای، مدلهایی برای پیشبینی استخراج میگردد و سپس، وضعیت تحصیلی آینده هر دانشآموز براساس مشخصات تحصیلیاش و همچنین مدل استخراج شده، تخمین زده میشود. از این تخمینها، برای هدایت تحصیلی دانشآموز و انتخاب رشته مناسب برای او استفاده میگردد.

در ادامه مقاله، ابتدا در بخش 2، برخی پژوهشهای انجام شده در کشور برای پیشبینی در حوزههای آموزشی مرور میگردند. سپس در بخش 3، داده کاوی و روش نزدیکترین همسایه برای انجام داده کاوی به اختصار توضیح داده میشوند. سپس در بخش 4، روش ارائه شده در این مقاله برای پیشبینی آینده تحصیلی دانشآموزان شرح داده میشود. در بخش 5 به ارزیابی روش پیشنهادی پرداخته میشود و نهایتا در بخش 6، مقاله نتیجهگیری میشود.

-2 مروری بر استفاده از پیشبینی در آموزش و پرورش

در این بخش، نمونههایی از پژوهشهای انجام شده در کشور مرور میگردند که در آنها از روشهای داده کاوی و پیشبینی در حوزه های مختلف آموزش و پرورش یا دانشگاه استفاده کردهاند.
در اولین پژوهش مورد بررسی، با استفاده از تکنیکهای دادهکاوی وضعیت تحصیلی آینده دانشآموزان که شامل دورهی فارغالتحصیلی از تحصیلات متوسطه و وضعیت فارغالتحصیلی از مدارس روزانه یا بزرگسال است پیشبینی شده است(تویسرکانی & نصیری, .(1390 در این پروژه برای ساخت مدلهای مورد نظر از تکنیکهای مختلفی نظیر درخت تصمیم، ماشین پشتیبان تصمیم (SVM) و شبکههای عصبی استفاده شده است. در پژوهش بعدی، میزان افت و پیشرفت تحصیلی دانشآموزان در هنگام تبدیل شدن مدرسه از حالت سنتی به هوشمند پرداخته شده است و برای این منظور از الگوریتم ژنتیک برای دادهکاوی استفاده شده است(پور, شوکور, & نادریفر, .(1389 در پژوهش بعدی از روش خوشهبندی دادهها برای انتخاب رشته دانشآموزان پایهی دوم دبیرستان استفاده شده است(جوانی & توام, .(1390 در این تحقیق، دادهها بر اساس عوامل آموزشی مرتبط (یعنی نمرات موثر هر رشته در پایهی سوم راهنمایی و اول دبیرستان) که مربوط به 300 دانشآموز فارغ-التحصیل شهرستان بهبهان میباشد، خوشهبندی شدهاند تا رشتهی تحصیلی مناسب برای دانشآموزان پایه دوم دبیرستان را تعیین کنند. آخرین پژوهشی که در این بخش مورد بررسی قرار میگیرد، مربوط به پیشبینی وضعیت تحصیلی دانشجویان با استفاده از ترکیب مدلهای پیشبینی است(تاری, مینایی, فراهی, & پیرزاده, .(1390 در این پژوهش، مدلهای پیشبینی از قبیل C5.0 و شبکه عصبی بر روی پایگاه داده انتخاب واحد دانشجویان دانشگاه پیام نور استان قم از سال 1379 تا 1389 اعمال شده است. سپس از ترکیب مدلها، مدل ترکیبی جدیدی ایجاد شده است که دارای دقت ارزیابی بیشتری میباشد.

-3 مروری بر داده کاوی و روش نزدیکترین همسایه

داده کاوی عبارت است از استخراج اطلاعات و دانش وکشف الگوهای پنهان از پایگاه دادههای بزرگ و پیچیده( Azzalini, Scarpa, .(& Walton, 2012; Zaki & Meira, 2014 در دادهکاوی روشهای تحلیل گوناگونی برای کشف الگوهای پنهانی وجود دارد که کمک میکنند تا سازمانها با جستجو در دادهها بتوانند الگوها و روندها و روابط بین دادهها را پیدا کرده و از این طریق، رفتارهای آینده را پیشبینی کنند تا تصمیمگیری مدیران بهبود پیدا کند(.(Han, Kamber, & Pei , 2011; Suh, 2012 یکی از کاربردهای دادهکاوی پیشبینی می

2

باشد. پیشبینی عبارت است از تجسم یک موقعیت در آینده، بر اساس اطلاعات گذشته. در پیشبینیهای مبتنی بر گذشته، آمار و ارقام و اطلاعات گذشته، اساس پیشبینی آینده قرار میگیرد(.(Zaki & Meira, 2014
یک نمونه از این روشهای داده کاوی، که برای پیشبینی مبتنی بر گذشته نیز مورد استفاده قرار میگیرند، روشهای مبتنی بر نمونه هستند که روشهای تنبل (Lazy) نیز نامیده میشوند( .(Tom, 1997 روشهای یادگیری مبتنی بر نمونه، نمونههای آموزشی را به صورت ساده و خام ذخیره میکنند و پردازشی روی آنها انجام نمیشود تا اینکه یک نمونه جدید برای طبقهبندی شدن اضافه شود. زمانی که یک نمونه جدید وارد میشود به منظور نسبت دادن یک مقدار تابع هدف برای نمونه جدید، مجموعهای از نمونههای مشابه و مرتبط (که همسایههای نمونه جدید محسوب میشوند) از حافظه بازیابی میشوند و برای طبقهبندی نمونه جدید مورد استفاده قرار میگیرند( Suh, 2012; .(Tom, 1997

الگوریتم -Kنزدیکترین همسایه پایهترین الگوریتم روشهای مبتنی بر نمونه است. این الگوریتم همهی نمونهها را به مانند نقطههایی در فضای N بعدی فرض میکند. نزدیکترین همسایههای هر نمونه بر طبق فاصله اقلیدسی انتخاب میشوند. برای این منظور فاصله نمونه جدید در فضای N بعدی با همه دادههای موجود (که دادههای آموزشی نامیده میشوند) محاسبه میشود و K تا از نقاط که کمترین فاصله را با نمونه جدید داشته باشند به عنوان -Kنزدیکترین همسایه انتخاب میشوند. سپس براساس نتایج آنها، نتیجه مورد نظر برای داده جدید در خروجی پیشبینی میشود. تابع هدف در الگوریتم -Kنزدیکترین همسایه میتواند به یکی از دو حالت پیوسته یا گسسته باشد. در حالت تابع هدف گسسته، آن مقدار از تابع هدف که بین K تا همسایه انتخاب شده برای نمونه جدید، متداولتر است یافته میشود و به عنوان مقدار تابع هدف برای نمونه جدید اعلام میگردد(.(Tom, 1997 شبه کد الگوریتم -Kنزدیک ترین همسایه با تابع هدف گسسته در شکل 1 آورده شده است.

برای محاسبه تابع هدف پیوسته، باید خط آخر الگوریتم -Kنزدیکترین همسایه که در شکل 1 ارائه شده است با رابطه (1) جایگزین شود. بدین ترتیب، بین مقادیر تابع هدف K تا همسایه میانگینگیری میشود و به عنوان مقدار تابع هدف برای نمونه جدید اعلام میگردد(.(Tom, 1997

در روش -Kنزدیکترین همسایه، علاوه بر معیار فاصله اقلیدسی، میتوان از معیار فاصله برداری نیز برای یافتن K تا نزدیکترین همسایه استفاده کرد(.(Han et al., 2011)(Tom, 1997


شکل -1 الگوریتم -Kنزدیکترین همسایه .(Tom , 1997)

-4 روش پیشنهادی

در این بخش به توضیح روش پیشنهادی پرداخته میشود. همانطور که گفته شد در بیشتر دبیرستانها، این مساله مطرح است که هر دانشآموز برای ادامه تحصیلات دبیرستانش، چه رشتهای را انتخاب کند. مسئله مهمتر اینکه دانشآموز در رشتهی انتخابیاش به چه میزان موفق خواهد بود. به دلیل اهمیت بالای انتخاب رشتهی دانشآموزان، در این مقاله، روشی ارائه میشود که میتواند آینده تحصیلی دانشآموزان را پیشبینی کند. این پیشبینی بر مبنای داده کاوی و با استفاده از الگوریتم -Kنزدیکترین همسایه انجام میشود.


3

در نظام آموزشی فعلی، پس از اینکه دانشآموزان، سال اول دبیرستان را میگذرانند، به انتخاب رشته تحصیلی برای ادامه دوره دبیرستان میپردازند. در روش پیشنهادی، نمرات دروس اصلی سالهای سوم راهنمایی و اول دبیرستان هر دانشآموز به عنوان ورودی گرفته میشود و سپس سعی میشود که بر اساس این نمرات و با استفاده از داده کاوی و الگوریتم -Kنزدیکترین همسایه، نمرات دروس اصلی سال سوم دبیرستان این دانشآموز و موفقیت یا شکست او در دوره پیشبینی شود. این پیشبینی یکبار با فرض اینکه دانشآموز رشته تجربی را انتخاب کند و یکبار با فرض اینکه دانشآموز رشته ریاضی را انتخاب کند، انجام میشود. سپس با توجه به پیشبینیهای انجام شده و میزان موفقیت تخمینی دانشآموز در دو رشته، به دانشآموز پیشنهاد میشود که که در صورت انتخاب کدام رشته، موفقتر خواهد بود.

در ادامه این بخش، ابتدا در بخش 1-4 به معرفی دادههای مورد استفاده در روش پیشنهادی پرداخته می شود و در بخش 2-4، آمادهسازی و تمیز کردن دادهها شرح داده میشود. سپس در بخش 3-4، چگونگی استفاده از الگوریتم -Kنزدیکترین همسایه برای پیشبینی آینده دانشآموزان توضیح داده میشود.

-1-4 دادههای مورد استفاده

مرحله اول داده کاوی، جمعآوری و فراهم کردن دادهها میباشد. در این مقاله، دادههای مورد نیز برای روش پیشنهادی، از یکی از دبیرستانهای پسرانه شهر اصفهان جمعآوری شدهاند. در این دبیرستان، تحصیل در دو رشتهی تجربی و ریاضی امکانپذیر است. دادههای جمعآوری شده، شامل نمرات دروس اصلی سالهای سوم راهنمایی و اول دبیرستان و سوم دبیرستان 351 دانشآموز میباشد. لازم به ذکر است که این اطلاعات بدون ذکر نام و دیگر مشخصات فردی هستند و هر دانشآموز تنها با شمارهای که به آن اختصاص داده ایم، شناخته میشود.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید