بخشی از مقاله
پروژه امار جامعه کل دانش اموزانی که کتاب امار و احتمال را مطالعه کرده اند
اي خواجه مكن تا تواني طلب علم كاندر طلب دانش پر روزي بماني
رو مسخرگي پيشه كن و مطربي آموز تا دد خود از مهتر كهتر سازي
مقدمه
آموزش پرورش قصد دارد ميزان سواد دانشآموزان وضعيت تحصيلي آنان و تعداد قبولشدگان در يكي از سنوات تحصيلي را بدانند و با استفاده از آنان تعدادي كتب كسر يا اضافه نمايند و يا برنامهريزي ديگري را تنظيم نمايند تا ميزان سواد دانشآموزان ارتقا يابند. بدينمنظور رئيس وقت آموزش و پرورش طبق بخشن نامههاي مختلف به هر يك از واحدهاي تاليف كتب درسي از آنان خواست كه در مورد وضعيت كساني كه به آنها كتب تدريس مي شود و نيز ميزان مرغوبيت آنان تحقيق كنند.
روشهاي جمعآوري دادهها:
بسياري از گروههایي كه روش درست تحقيق را نميدانستند در اين مهم باز ماندند و گروه آمار تحقيقات خود را آغاز كرد. اين گروه ابتدا جامعه را معرفي نمود.
((جامعه كل دانشآموزاني است كه اين كتاب را مطالعه مي كنند.))
با توجه به كثرت جامعه و هزينه سر سام آور وقت گير بودن نمي توانستند سر شماري كنند بس تصميم ديگري گرفتند. يكي از اعضا پيشنهاد كرد كه از دانش آموزان تهران نمونه گيري كنند كه مورد موافقت سر گروه واقع نشد سر رگروه دلايل خود را براي رد اين در خواست چنين اعلام كرد :
1- دانش آموزان تهراني به دليل اينكه داراي امكانات فراواني هستند وضعيت تحصيلي آنان بسيار بهتر ازمناطق محروم نقاط كشور است .
2- دانش آموزان به صورت تصادفي انتخاب نشده اند و ممكن است نمودار آنها با نموداري كه مي خواهند بدست آورند فرق داشته باشد .
سر گروه اعلام كرد كه كل شهرهاي ايران را روي كاغذ بنويسند و از اين شهرها 100شهررا بصورت قرعه كشي و كاملا تصادفي انتخاب نمايند سپس اسم مدارس اين شهرها را نيز به روي كاغذ آورند و100 دبيرستان را به صورت تصادفي انتخاب نمايندو سپس اسم هر يك از دانش آموزان آن مدارس را بنويسند و از آن صد دانش آموز انتخاب نمايند و نمرات آنها را مورد برسي قرار دهند و با ابنكه اسم كليه دانش آموزاني كه به آنها كتاب آمار به آنها تدريس شده است روي كاغذ نوشته شود و100دانش آموزانتخاب شوند اكثريت اعضا به روش دوم راي دادند .
اسم كليدي دانش آموزان را روي كاغذ نوشته و 100دانش آموز را انتخاب نمودند نمرات اين دانش آموزان به شرح زير است .
19 15 18 17.75 16.5 14.5 15.25 20 16 19.75
18.75 19 20 14 20 19 10.25 11.75 13 20
18 20 15 16 18 18 19 20 20 20
18 19 19 19.75 20 17 19 14.5 14 12
20 20 20 18.5 20 19 10 12.75 10.25 18
18 19.5 20 20 17.75 17.75 17.5 14 15.5 14
17 15 16 14 19 10.25 12.5 14 16 17
13 12 10 11 19.25 17 19 20 20 18
20 20 18 20 20 18 18 20 20 20
20 20 20 20 20 20 20 20 20 20
ِ
اين عددها يا به عبارتي دادها با استفاده از داده هاي از پيش تهيه شده بدست آمده است
سپس اين گروه به مرور هدف پرداخت وضعيت دانش آموزان درس آمار و خود سازي و نيز تعداد دانش آموزاني كه نمره بالاي 15 آورده اند.
با وجود اين مطلب دادهها را دسته بندي كردند و نوع داد ها را مشخص نمودند وضعيت دانش آموزان در متغیر كيفي و ترتيبي بود و تعداد دانش آموزاني كه بالاي 15 نمره اخذ نمودهاندو نیزكمي پیوسته است. يكي از اعضا به اين متغير ها اعتراض كردند و مدعي شد كه سر گروه اشتباه كرده است.
سر گروه در پاسخ به او چنين گفت وضعيت دانش آموزان قابل شمارش نسبت به متغير ها كيفي است و نيز اگر داده ها را از كوچك به بزرگ مرتب كنيم نوعي ترتيب طبيعي بين داده ها بوجود مي آيد و آن اين است كه داده ها از كوچك به بزرگ مرتب شده اند در مورد تعداد دانش آموزاني كه بالاي 15نمره گرفته اند نيز بايد بگوييم كه تعداد دانش آموزان قابل شمارش است پس متغير كمي استي و نيز اينكه اين متغيرها پيوسته نيز است زيرا علاوه بر 17 18 17.25 17.5 17.75 را نيز در بر مي گيرد .
با توجه به پاسخ سر گروه آن فرد قانع شد.
در ادامه سر گروه از يكي از اعضا خواست كه داده ها را از كوچك به بزرگ مرتب كند و نيز اين كار را كرد .
12.5 12 12 11.75 11 10.25 10.25 10.25 10 10
14.5 14 14 14 14 14 14 13 13 12.75
16 16 16 16 15.5 15.25 15 15 15 14.5
18 17.75 17/75 17.5 17.25 17 17 17 17 16.5
18 18 18 18 18 18 18 18 18 18
19 19 19 19 19 19 19 19 18.75 18.5
20 20 20 20 19.75 19.75 19.5 19.25 19 19
20 20 20 20 20 20 20 20 20 20
20 20 20 20 20 20 20 20 20 20
20 20 20 20 20 20 20 20 20 20
سپس فراواني مطلق داده ها را بديت آوريد به عنوان مثال داده 20/34 بار تكرار شده است پس مي شود :x2=34 و بقيه داده ها را اين چنين بدست مي آوريم.
f12= 2 f17.5=1 f11=1 f10.25=3 F10=2
F14.5=2 F14=6 F13= 2 f12.75=1 F12.5=1
F16.5=1 F16=4 F15.5=1 F15.25=1 F15=3
F17.75 2 F17.5=1 F17.25=1 F17=4
F19=10 F18.75=1 F18.5=1 F18=11
F20=34 F19.75=2 F19.5=1 F19.25=1
دسته بندي
اولين اقدامي كه در مطالعه يك جامع بر اسا سداده ها انجام ميدهيم آن است كه ببينيم آيا مي توان جامعه را به چند دسته جدا تفكيك كرد د رمطا لعه متغيرهاي گسسته جدول فراواني بدون دسته بندي كار آمد است ولي اگر متغير پيوسته باشد اين روش براي منظم كردن داده هاي عملي نيستلذا براي تنظيم داده ها در اين قبيل موارد مراحل زير را طي مي كنيم .
دامنه تغيرات:
اولين نكتهاي كه در اين مرحله مدنظر قرار ميگيرد، آن است كه ببينيم آيا متغير در فاصله زيادي تغيير ميكند يا درفاصله كمي قرار ميگيرد. طول بازهاي را كه متغير در آن تغيير ميكند، دامنه تغييرات ميگوييم.براي بيان روشنتر، فرض كنيد:
كوچكتريين داده = a و بزرگترين داده = b
در اين صورت تفاضل a از b يعني b-a را دامنع تغييرات ميگويند و با علامت R نشان ميدهيم.
R = b – a
بزرگي دامنهي تغييرات نشاندهندهي تفاوت زياد در جامعه است. هرچقدر اين دامنه كمتر باشد، افراد جامعه از لحاظ اين متغير به هم نزديكترند. اگر دامنهي تغييرات صفر باشد، تمام افراد با هم برابر و يكسانند.
دامنه تغييرات را بدست مي آوريم
R = b - a R = 20 – 10 = 10
سپس با فرمول كه در آنR دامنه تغييرات C طول دسته و k تعداد دسته است. جدول فراواني را مي خوانيم كه به 5 دسته تقسيم كنيم در نتيجه داريم:
پس از اينكه طول دستهها را بدست آورديم، از كران پايين به اندازه طول دسته انتخاب ميكنيم و تا كران بالا ادامه ميدهيم كه در نتيجهي آن طول دستههاي ما ميشود.
10-12, 12-14, 14-16, 16-18, 18-20
مركز دسته
براي دستهي [ai , bi ]، ai را كران پايين و bi را كران بالا و xi را مركز آن دسته مي ناميم و از رابطه زير بدست مي آوريم:
به همين ترتيب مركز 5دسته بالا را بدست ميآوريم. داريم:
فراواني مطلق:
پس از بدست آوردن مركز دسته ها فراواني مطلق هر دسته را نيز بدست مي آوريم
مهدي = F5 مهدي = F4 مهدي = F3 مهدي = F2 مهدي = F1
F5=61 F4=13 F3=13 F2= 6 F1=7
ملاحظه مي شود كه %7 داده ها در دستهي اولو%6داده ها در دستهاي دوم %13 درصداز داده ها را در دسته چهارم و%61 از داده ها در دستهي پنجم قرار دارند.
فراواني نسبي:
اگر f1 فراواني دسته اي باشد و تعداد داده ها n باشد كسر را فراواني نسبي داده مي گوييم فراواني نسبي هر يك از دادهها را بدست ميآوريم
پس از آن درصد فراواني نسبي را بدست ميآريم.
اگر هر كدام را به 100 ضرب كنيم، درصد فراواني نسبي به دست ميآيد. داريم:
ملاحظه مي شود كه درصد فراواني نسبي با درصد فراواني مطلق برابر است
فراواني تجمعي :
فراواني تجمعي هر دسته برابر است تعداد اشيايي كه مقدار آنها از كران آن دسته كمتر است.
فراواني تجمعي هر دسته را بدست مي آوريم:
جدول فراواني ها طي مراحل فوق بدست مي آوريم:
فراواني تجمعي درصد فراواني نسبي فرواني نسبي فراواني مطلق مركز دسته طول دسته
7 7% 07/0 7 11 12-10
12 6% 06/0 6 13 14-12
26 13% 13/0 13 15 16-14
39 13% 13/0 13 17 18-16
100 61% 61/0 61 19 20-18
100% 1 100 جمع
نمودارها و تحليل داده ها :
نمودار ميلهاي
نمودار مستطيلي
نمودار چندبر فراواني
نمودار دايرهاي
شاخص هاي مركز:
1- مد: دادهاي است كه بيشترين با ر تكرارشده است در مراحل قبلي فراواني هر داده را بدست مي آوريم. حال با استفاده از آنها مي خواهيم كه مد را پيدا كنيم مد دادهي20است كه به ميزان 34 بار تكرار شده است.
2- ميانه: پس از مرتب كردن داده ها مقداري را كه تعداد داده ها بعد از آن با مقدار داده ها قبل از آن برابر استميانه مي ناميم ميانه را از فرمول بدست مي آوريم كه در آن Md ميانه و N تعداد داده هاست.
سر گروه با بيان اين مطلب از يكي از همكاران خانم خواست كه ميانه را بدست آور وي نيز اين كار را نمود پس نوشت كه جواب 50.5 آمد خانم همكار دو يا سه چهار با ميانه را بدست آورد و در هر با جواب 50.5 مي آمد سپس او كه مي دانست داده اي به نام 50.5 ندارد اعلام داشت كه از به دست آوردن ميانه عاجز استسر گروه با تشويق به وي گفتكه عمليات وي كاملا صحيح بوده و جواب بدست آمده كاملا صحيح است.
اين گفته سر گروهموجب تعجب اعضاء گروه شد. خانم همكار از سر گروه پرسيد كه اين امر چگونه ممكن استما داده اي به شماره 50.5 نداريم سر گروه در پاسخ وي گفت: ((اگر تعداد داده هاي ما فرد باشد دادهاي كه بدست مي آيد به صورت يك عدد طبيعي مضرب يك است و آن داده ميانه است اگر داده ها زوج باشد جواب معادله n/5 مي آيد كه n يك عدد طبيعي است براي بدست آوردنميانه در اين موارد ميانگين رو دادهاي كه در وسط است ميانه مي باشد پس ميالنگين دو دادهاي x50 و x51 ميانه است.))
با توجه بك گفته سر گروه خانم همكار دو باره ميانه را بدست آورد كه در نتيجه آن عدد18.25 ميانه است.
نمودار جعبه اي
با كفتن اين اسم همهاعضاء گروه به فكر جعبهميوه افتادنند يكي از اعضاءاز سر گروه پرسيد كه با جعبه سيب چه نموداري مي توان درست كرد ؟سر گروه خندهاي كرد در پاسخ گفت: از نمودارهايي كه تا كنون خواندهايم، هركدام به طريقي دادهها را نمايش ميدادند. فكر ميكنيد كدام نمودار بهتر از بقيه پراكندگي دادهها را نشان ميدهد؟
چارك
ميانه نيمه اول داده را چارك اول (Q1) و ميانه نيمه دوم داده ها را چارك سوم (Q3) مي ناميم. در ضمن چارك دوم همان ميانه است.
سرگروه در ادامه افزود ((نمودار جعبهاي نمودار تصويرياست كه داده ها را بر اساس پنج مقدار نمايش مي دهد اين مقادير عبارتند از
1-كوچكترين داده
2- چارك اول
3-ميانه
4- چارك سوم
5- بزكترين داده...
سپس براي درك بيشتر اعضا نمودار ساده رسم كرديم.
ميانگين
براي محاسبه ميانگين همه داده ها را بايد جمع كرد ه بر تعداد كل داده ها تقسيم مي كنيم يعني:
قضيه: اگر X ميانگين X1…….Xn باشد آن گاه مجموع اختلافات داده ها از ميانگين برابر است با صفر
اثبات
زيرامي دانيم مجموع مقاديربرابر حاصل ضرب ميانگين در تعداد آن ها است يعني:
در برخي از محاسبات ممكن است اعداد بسيار بزرگ باشد جمع كردن اين اعداد و تقسيم آن ها همراه با خطاهايي خواهد بود شايد بگوييد در عصر رايانه ها بزرگي اعداد مشكلي نخواهد بود. ولي به هر حال اين اعداد را بايد به طريقي وارد كنيم كه در اين مرحله بزرگي انها اشكالاتي را ايجاد خواهد كرد.اگر بتوانيم تدبيري بينديشيم تااز اعدادكوچكتر استفاده كنيم اين مشكل را دور زده ايم.قضيه زير راه حل مناسب اين مسئله را ارائه مي كند.
مقايسه ميانگين و ميانه:
ميانگين شاخص خوبي براي نشان دادن مركزيت داده هاست در بعضي از مسائل اين شاخص نمي تواند مؤثر باشد.مثلا انتظار ميرود در يك كلاس تمامي دانش اموزان نمره خوبي بگيرند. اگر نمرات خوب باشد مسلما ميانگين هم بالا خواهد بود ولي آيا بالا بودن ميانگين نمرات نشان دهنده وضع خوب كلاس است .ممكن است تعداد كمي نمره20گرفته باشند وتعداد زيادي نمره 10 يا 12. وضع اين كلاس رضايت بخش نخواهد بود براي آنكه وضع كلاس را بتوانيم خوب ارزيابي كنيم حداقل نصف كلاس بايد نمره خوبي آورده باشند.
آن چه نمره اي است كه نمره نصف دانش آموزان كلاس از آن بيش تر است ؟
_اگر ميانه خيلي از ميانگين كو چكتر باشد تعبير آن است ؟
_اگر ميانه خيلي بزرگ تر از ميانگين باشد تعبير آن است؟
میانگین وزن دار
سرگروه با گفتن این عنون موجب خنده ی اعضای گروه شد ویکی از جایش بلند شد وگفت میانگین وزنی علی آقا 250 کیلو است وهمه خندیدند . سر گروه اعضا را دعوت به سکوت کرد وگفت : برای محاسبه میانگین وزنی در حالت کلی فرض کنید داده های Xn… ,X1 به ترتیب دارای ضرایب Wn… ,W1 این اطلاعات را برای سادگی می توانیم در جدول زیر خلاصه کنیم :
x1 x2 ..... xn دادهها
w1 w2 ..... wn ضريب (دادهها)
در این صورت میانگین داده های بالا با احتساب ضرایب مربوطه به صورت زیر محاسبه می شود:
ميانگين وزني
در مواردی که ما با میانگین وزن دار مواجه می شویم محاسبه میانگین در یک جدول فراوانی است . دیدیم که در یک جدول فراوانی قرار شد تمام افرادی که در یک دسته قرار دارند برابر مرکز دسته فرض کنیم. پس مرکز دسته به اندازه فراوانی آن دسته تکرار می شود ، واین مانند آن است که ما به مرکز دسته وزنی برابر فراوانی آن دسته داده باشیم ، پس اگر بخاهیم میانگین را حساب کنیم باید مرکز دسته ها را در فراوانی های نظیر ، ضرب وبا هم جمع کرده وپس از آن بر مجموع فراوانی ها (که همان تعداد داده هاست ) تقسیم کنیم .
این مفهوم میانگین برای محاسبات از روی جدول فراوانی مناسب تر است
شاخص های پراکندگی
1- دامنه تغییرات
2- انحراف میانگین
3- واریانس
4- انحراف معیار
5- ضریب تغییرات
دامنه تغییرات :
در فصول قبل در این مورد بحث شد و برابر است با R=b-a دامنه تغییرات باشد
20-10=10 R=
واریانس :
دامنه تغییرات شاخص مناسبی است . اما در تصمیم گیری های کلان از ارزش آماری زیادی برخوردار نیست . زیرا ما به شاخص هایی نیاز داریم که هم پراکندگی داده ها وهم فراوانی آنها را مد نظر قرار دهند.