بخشی از مقاله
پروژه آمار توصیفی
فهرست مطالب
پيشگفتار 1
دیدگاههایی درمورد آمار 1
دید کلی 2
نقش آمار در زندگی روزمره 2
نقش آمار در پژوهشهای علمی 2
کاربرد آمار 3
فصل اول
آمار توصيفي
جمعيت 4
نمونه 5
متغير 5
مقياسهاي اندازهگيري 6
داده 7
فصل دوم
جدولهاي آماري
فراواني مطلق 9
فراواني نسبي 9
فراواني تجمعي 11
فراواني نسبي تجمعي 12
فصل سوم
نمودارهاي آماري
هيستوگرام 13
چندبر فراواني 13
چندبر فراواني تجمعي: 13
منحنيهاي فراواني و فراواني تجمعي 13
نمايش نمودار تنه و شاخه 14
نمودار جعبهاي 14
فصل چهارم
معيارهاي مركزي
ميانگين 22
ميانگين حسابي 23
ميانگين وزني 23
ميانگين هندسي 24
ميانه 25
نما 27
چندكها 29
مقايسه معيارهاي مركزي 32
داده پرت 32
فصل پنجم
معيارهاي پراكندگي
دامنه 34
ميانگين انحراف از ميانگين 34
واريانس 35
انحراف معيار 36
ضريب تغييرات 37
ضريب چولگي و كشيدگي 38
منحنيهاي فراواني 39
ضريب چولگي 40
ضریب کشیدگی 43
نمودار جعبهای 44
تشخیص داده پرت به روش چارکها و رابطه داده پرت با نمودار جعبهای (نمودار جعبهای اصلاح شده) 49
منابع 54
پيشگفتار
در عصر حاضر كسي نميتواند منكر این واقعیت باشد كه آمار نقشي لاینفک در زندگي روزمره ما بازي ميكند. اخبار روزانه رسانههاي گروهی با گزارشی از وضع هوا به پایان ميرسند و در طول اخبار، به جریانهای بازار بورس و سهام اشاره ميشود و روزنامهها خبر از افزایش نرخ اجناس ميدهند.
آمار به عنوان پايه يك روش و راه موثر در بررسی مسائل موجود، در بسیاری از زمينههاي علمي از جمله جامعه شناسي، کشاورزی، فيزيك و .... به كار گرفته ميشود. در دانش امروزي، معمولاً سعی ميشود كه اطلاعات موجود در يك زمينه خاص، در قالب اعداد نمایش داده شود تا به هنگام تجزیه و تحلیل اطلاعات، فهم بهتری از پدیده مورد مطالعه به دست آمده و امکان مقایسه فراهم گردد. در يك جمله آمار مجموعهاي از روشهای جمع آوری، تهيه و تنظیم و تجزیه و تحلیل اطلاعات است كه براي كسب يك يا چند نتیجه به خدمت گرفته ميشود.
دیدگاههایی درمورد آمار
تهيه آمار كاری وقتگير و زمان بر و اصولا كسالتآور است.
آمار گورستانی از اعداد و ارقام است كه در هر اداره و سازمان نمونهای از آن پيدا میشود.
آمار مجموعهای از روابط و فرمولهای رياضی پيچيده و گيجكننده است.
آمار شامل نمودارها و جدولهايی از اعداد است.
آمار فرايندی است كه در آن هر ده سال افرادی را به منازل فرستاده و اطلاعات خانوارها مانند تعداد فرزندان، سن افراد خانوار را از آنها كسب میكنند.
آمار ابزاری است كه بسياری با توسل به آن افكار عمومی را به نفع خود جلب میكنند.
آمار مفهومی است كه براي ثبت و نمايش اطلاعات عددی به كار میرود، مانند تعداد بيكاران، جمعيت نواحی جنوب شهر تهران، تعداد افراد تلف شده در اثر شيوع يك بيماری يا مقدار مسافت طی شده در زمان معينی به وسيله برنده مسابقه دو.
دید کلی
بیشتر مردم با کلمه آمار، به مفهومی که برای ثبت و نمایش اطلاعات عددی بکار میرود، آشنا هستند: تعداد بیکاران، قیمت روزانه بعضی از سهام در بازار بورس، مثالهایی از این مفهوماند. ولی این مفهوم با موضوع منطبق با موضوع اصلی مورد بحث آمار نیست. آمار عمدتا با وضعیتهای سروکار دارد که در آنها وقوع یک پیشامد بطور حتمی قابل پیش بینی نیست. استنتاجهای آماری غالباً غیر حتمیاند زیرا مبتنی بر اطلاعات ناکاملی هستند. معادل کلمه آمار در زبان انگلیسی Statistics است که از لحاظ تاریخی از کلمه لاتین Status مشتق شده است.
نقش آمار در زندگی روزمره
پی بردن به واقعیات امور از طریق گردآوری و تعبیر دادهها، منحصر به پژوهشگران حرفهای نیست. این امر در زندگی روزمره همه مردم که میکوشند آگاهانه، ناآگاهانه مسائلی را درباره جامعه، محیط زندگی خود و کل دنیا درک کنند، معمول است. برای کسب اطلاع از وضع بیکاری، اثر یک مسکن در رفع بیماری و سایر مسائل مورد علاقه در زندگی روزمره، اطلاعات و ارقام را جمعآوری و آنها را تفسیر مینماییم یا کوشش میکنیم که تفسیرهای دیگران را بفهیم. بنابراین، هر روز از طریق تجزیه و تحلیل ضمنی اطلاعات مبتنی بر واقعیات، عمل کسب آگاهی انجام میگیرد.
نقش آمار در پژوهشهای علمی
موضوع آمار عبارت است از هنر علم جمع آوری، تعبیر و تجزیه و تحلیل دادهها و استخراج تعمیمهای منطقی در مورد پدیدههای تحت بررسی. با توجه به مراحل اساسی یک تحقیق علمی که عبارتند از: مشخص کردن هدف، جمع آوری اطلاعات، تجزیه و تحلیل دادهها و بیان یافتههای آشکار است که آمار بطور وسیعی در قلمرو تمام تحقیقات علمی بکار میرود. به ویژه، در مرحله جمع آوری اطلاعات، آمار راهنمای محقق در انتخاب روشها و وسایل مناسب برای جمعآوری دادههای اطلاعاتی است. در مراحل بعد از گرد آوری دادهها، نیاز بیشتری به روشهای آماری وجود دارد.
کاربرد آمار
کاربرد روشهای آماری در قلمروهای گوناگون از علوم انسانی، علوم مهندسی، رشتههای علمی جدیدی پدید آورده است که در ارتباط متقابل با آمار هستند. نظیر آمار زیستی، روانسنجی، آمار مهندسی، آمار بازرگانی، اقتصادسنجی و جمعیتشناسی. به علاوه علم آمار در رشتههای بسیار دیگری که هنوز از ترکیب آنها با آمار شاخههایی با اسامی خاص پدید نیامده، از قبیل علوم سیاسی، هواشناسی و محیطشناسی نقش عمدهای ایفا میکند.
فصل اول
آمار توصيفي
براي اينكه نتايج مناسب و مطلوب از اطلاعات كه در آمارگيريها جمعآوري ميكنيم، به دست آيد بايد:
– اعداد نماينده واقعي مشاهدات بوده و غيرواقع يا غلط نباشند
– به نحو مفيدي تهيه و تنظيم شوند
– به نحو صحيح تجزيه و تحليل گردند
– قابل نتيجه گيري صحيح باشند
به طور كلي، روشهایی که بوسیلة آنها میتوان اطلاعات جمعآوری شده را تنظیم، طبقهبندی و خلاصه نمود و آنها را بوسیلة نمودارهایی نمایش داد، به آمار توصیفی موسوم است. هدف آمار توصيفي توجيه نيست، بلكه توصيف استخراج نكات اساسي و تحقق بخشيدن به تركيب اطلاعات به كمك زبان اعداد است. برای معرفی این روشها نیاز به برخی اصطلاحات داریم که در ذیل به معرفی آنها میپردازیم.
جمعيت
مجموعة تمام افراد یا اشیایی که مطالعات آماری در مورد یک یا چند صفت آنها در یک مکان و زمان معین انجام میگیرد به جمعیت موسوم است. هر یک از این افراد یا اشیا را یک عضو جمعیت مینامند و تعداد اعضای جمعیت را اندازة جمعیت مینامند.
مثال1: اندازه قد يا وزن دانشجويان بيست ساله يك شهر، تعداد لامپهاي سالم و يا ناسالم توليد شده در يك كارخانه و در يك روز معين، مثالهايي از جمعيتهاي آماري هستند.
مثال2: اگر بخواهیم معدل دانشجویان یک دانشکده در یک نیمسال را مورد بررسی قرار دهیم آنگاه جمعیت مورد نظر کلیة دانشجویان آن دانشکده میباشند و صفت مورد مطالعه معدل نیمسال تحصیلی آنها است. همینطور اگر بخواهیم میزان کالری موجود در غذاهای کنسرو شده در یک کارخانه کنسرو سازی در یک روز معین را مورد بررسی قرار دهیم آنگاه جمعیت مورد نظر تمامی غذاهای کنسرو شده کارخانه در آن روز و صفت مورد مطالعه میزان کالری موجود در آنها میباشد.
نكته:
معمولا مطالعه ويژگيهاي مورد نظر، به هنگامی كه جمعیت آماری بسیار گسترده باشد، مستلزم صرف هزینه و وقت زيادي ميباشد و در بسیاری از مواقع، اين امر اصولا امکان پذیر نیست. بنابراین در چنین موردی، براي مطالعه ویژگی مورد نظر، به قسمتی از جمعیت آماری اکتفا ميكنيم
نمونه
زیر مجموعهای از جمعیت که طبق یک قاعده و ضابطة خاصی برای مطالعة صفتی از جمعیت انتخاب میشود را یک نمونه گویند. تعداد اعضای نمونه به اندازة نمونه موسوم است.
نکته:
اين نمونه وقتي مفيد و قابل قبول خواهد بود كه بتواند نماينده خوبي براي كل جمعيت مورد مطالعه باشد. با توجه به اهميت اين موضوع شاخهاي از آمار تحت عنوان نظريه نمونهگيري با بررسي نمونهاي به اين امر مهم ميپردازد. در بسياري از موارد، معمولا نمونه تصادفي ساده را در نظر ميگيرند.
مثال: براي بررسی اندازه قد دانشجویان بیست ساله يك شهر، انتخاب مثلاً 150 نفر از بین اين جمعیت به طور تصادفی، يا انتخاب 100 لامپ به تصادف از لامپهاي توليدي يك کارخانه در يك روز معین، براي تعيين كيفيت لامپهاي توليدي اين کارخانه مثالهايي از نمونه تصادفی هستند.
متغير
خصوصیت مورد مطالعه، از فردی به فرد دیگر، يا از شي به شي دیگر در جمعیت آماری تغيير ميكند، كه آن را اصطلاحاً متغير ميناميم.
معمولاً دو نوع متغير در آمار مورد نظر هستند:
‗ متغيرهاي گروهي، نظير رنگ، نژاد، شغل و گروه خوني كه شامل چند گروه يا طبقه ميباشند.
‗ متغيرهاي عددي كه ممكن است نتيجه شمارش باشد، مانند تعداد احشام هر خانوار در يك روستا،تعداد حوادث در يك كارخانه در روزهاي مختلف و يا نتيجه اندازهگيري باشد، مثل قد دانشجويان بيست ساله در يك شهر، حجم شربت مولتي ويتامين با استاندارد خاص.
متغير:
• متغيرهاي گسسته
1. متغيرهاي گروهي
2. متغيرهاي عددي كه از راه شمارش بهدست آمده اند
• متغيرهاي پیوسته
1. متغيرهايي را كه از طريق اندازهگيري به دست آمده باشند
مقياسهاي اندازهگيري
در بسیار از مسائل پيشرو، اندازهگيري ویژگی يك متغیر مستلزم آگاهی و شناخت خاصي است. به طور كلي چهار نوع مقیاس براي اندازهگيري وجود دارد:
§ مقياس اسمي
§ مقياس ترتيبي
§ مقياس فاصلهاي
§ مقياس نسبتي
مقياس اسمي:
اين نوع مقياس اندازهگيري عمدتاً براي طبقه بندي دادهها به كار ميرود و منظور از آن اطلاق يك عدد طبيعي به دادههاي متفاوت است.
مثال: اختصاص اعداد 1 تا 4 به گروههاي خوني A, B, AB, O.
توجه داشته باشيد كه:
اين اعداد را نميتوان براي مقايسه يا چهار عمل اصلي به كار برد
مقياس ترتيبي:
اين نوع مقياس اندازهگيري عموما براي طبقه بندي دادهها به منظور يك نوع برتري به كار ميرود.
مثال: در يك كارخانه ممكن است كارگران را به سه دسته ساده، نيمه ماهر و ماهر تقسيمبندي كنيم. اطلاق به ترتيب اعداد 1 تا 3 به اين سه دسته يك مقياس ترتيبي است.
توجه داشته باشيد كه:
اين اعداد تنها براي مقايسه به كار ميروند و نميتوان با آنها چهار عمل اصلي را انجام داد.
مقياس فاصله اي:
اين نوع مقياس اندازهگيري عموما در زمينههاي كه علاوه بر حفظ ترتيب به نحوي فاصله بين ويژگيها را نيز حفظ ميكند. به عبارت ديگر در چنين مقياسي نسبت تفاضلها ثابت ميماند.
مثال: اندازهگيري ضريب هوشي دانش آموزان كلاس اول دبستان در شهر اصفهان.
توجه داشته باشيد كه:
در اين نوع مقياس، عدد صفر يك مفهوم قراردادي است.
مقياس نسبتي:
اين نوع مقياس اندازهگيري علاوه بر حفظ فاصله، نسبت را نيز حفظ ميكند. به عبارت ديگر در اين نوع اندازهگيري نسبت دو مقدار بستگي به واحد اندازهگيري ندارد.
داده
در یک بررسی آماری، بایستی صفت مورد مطالعه را به صورت اعداد و ارقام نمایش دهیم. اگر صفت مورد مطالعه کمی، مانند وزن، حجم، درجة حرارت و غیره باشد آنگاه این عمل به سادگی با اندازهگیری امکان پذیر است اما اگر صفت مورد مطالعه کیفی، مانند گروه خون، شغل، رنگ چشم و غیره باشد آنگاه بایستی با یک قاعده معین این مسائل کیفی را با اعداد و ارقام نشان داد. در هر صورت این اعداد و ارقام را داده ها گویند که به دو صورت گسسته و پیوسته میباشند. دادههای گسسته دادههایی هستند که بین دو مقدار متصور آنها هیچ عدد دیگری وجود نداشته باشد، مانند تعداد فرزندان یک خانواده که شامل مقادیر 0، 1، 2 و... است و همچنین صفت شغل افراد که به آن مثلاً اعداد 1، 2، 3 و... را نسبت میدهیم و بین این مقادیر عدد دیگری در رابطه با صفت موردنظر وجود ندارد. دادههای پیوسته داده هایی هستند که بین هر دو مقدار متصور آنها همواره عدد دیگری وجود دارد، مانند وزن افراد که بین دو نفر با وزنهای نزدیک به هم همواره میتوان فردی را با وزنی بین وزن دو فرد یاد شده در جمعیت یافت. از جمله دادههای گسسته میتوان دادههای مربوط به صفات گروه خون، رنگ، نژاد، شغل، تعداد کالاهای تولیدی و غیره را برشمرد و از جمله دادههای پیوسته میتوان دادههای مربوط به صفات وزن، طول قد، فشار گاز، قطر لوله تولیدی یک کارخانه و غیره را برشمرد.
داده خام:
معمولا به دادههاي جمع آوري شده كه انبوهي عدد است و هيچ نوع پردازشی روي آنها انجام نشده است داده خام ميگويند.
در آمار بعد از جمعآوری دادهها به بررسی آماری بر روی آنها میپردازیم. در مرحلة نخست با توجه به اهداف بررسی، داده ها را تنظیم، طبقه بندی و خلاصه میکنیم به طوری که بتوانیم اطلاعات مفیدی برای نیل به اهداف و نتایج مورد نظر به دست آوریم. انجام این کار در سه مرحله به شرح زیر صورت میپذیرد:
الف) تنظیم و طبقه بندی دادهها در یک جدول
ب) ترسیم نمودارهای گوناگون از روی مقادیر ارائه شده در جدول
ج) خلاصه کردن داده ها به یک یا چند عدد موسوم به شاخص یا آماره
سه موضوع فوق از موضوعات اساسی بحث آمار توصیفی است که در ذیل به معرفی و بررسی آنها میپردازیم.
فصل دوم
جدولهاي آماري
نخستین گام در خلاصه کردن دادهها، طبقه بندی و تنظیم آنها در یک جدول موسوم به جدول آماری است. یک جدول آماری بایستی به نحوی تنظیم شود که بتوان از آن به راحتی اطلاعات نهفته در دادهها را استخراج کرد. متداولترین جدول آماری جدول فراوانی است که در آن دادهها، تعداد موجود از هر داده و درصد موجود از هر داده مشخص میشود. پيش از آنكه نحوه تنظيم جدول فراواني را بيان نماييم، اطلاع از اصطلاحات زير ضروري است.
فراواني مطلق
هرگاه nداده y1, y2, k, yn از k نوع x1, x2, k, xk، با فرض ، به ترتيب با تعدادهاي تشكيل شده باشند، آنگاه را فراواني مطلق ميگوييم. به عبارت ديگر تعداد دفعاتي را كه در دادههاي تكرار ميشود، فراواني ميناميم و آن را با نماد نمايش ميدهيم.
به خاطر داشته باشيد كه:
اگر اندازه نمونه برابر n باشد، آنگاه براي
فراواني نسبي
مثال: دادههاي زير ميزان تصادف منجر به مرگ رد 30 منطقه را نشان ميدهد. فراواني دادها را تعيين نماييد.
7 6 6 3 4 3 5 5 6 8
3 4 8 4 7 5 8 5 5 3
6 5 5 6 6 5 6 7 8 2
مشاهده ميشود كه دادههاي تكرار اعداد 2،3،4،5،6،7،8 ميباشند،بنابراين جدول زير را براي فراواني دادهها خواهيم داشت:
2
3
4
5
6
7
8 1
4
3
8
7
3
4
نسبت فراواني به اندازه نمونه را فراواني نسبي ميناميم. اگر فراواني در يك نمونه با اندازه n، برابر fi باشد، آنگاه فراواني نسبي xi را با نماد ri نمايش خواهيم داد، به طوري كه:
به خاطر داشته باشيد كه
براي
مثال: دادههاي زير ميزان تصادف منجر به مرگ رد 30 منطقه را نشان ميدهد. فراواني نسبي را محاسبه كنيد.
7 6 6 3 4 3 5 5 6 8
3 4 8 4 7 5 8 5 5 3
6 5 5 6 6 5 6 7 8 2
جمع فراوانيهاي fi، تعداد كل جمعيت يعني n است و جمع فراوانيهاي نسبي ri برابر يك ميباشد.
فراواني تجمعي
با توجه به تعريف فراواني، فراواني تجمعي رديف i را با نماد نمايش ميدهيم و به صورت زير تعريف ميكنيم:
به خاطر داشته باشيد كه
براي اندازه نمونه n و آنگاه:
مثال: دادههاي زير ميزان تصادف منجر به مرگ رد 30 منطقه را نشان ميدهد. فراواني تجمعي را تعيين نماييد.
7 6 6 3 4 3 5 5 6 8
3 4 8 4 7 5 8 5 5 3
6 5 5 6 6 5 6 7 8 2
فراواني نسبي تجمعي
با توجه به تعريف فراواني نسبي، فراواني نسبي تجمعي رديف i را با نماد Ri نماد نمايش ميدهيم و به صورت زير تعريف ميكنيم:
به خاطر داشته باشيد كه:
براي اندازه نمونه n و آنگاه:
مثال: دادههاي زير ميزان تصادف منجر به مرگ رد 30 منطقه را نشان ميدهد. فراواني نسبي تجمعي را تعيين نماييد.
7 6 6 3 4 3 5 5 6 8
3 4 8 4 7 5 8 5 5 3
6 5 5 6 6 5 6 7 8 2
فصل سوم
نمودارهاي آماري
معمولا دادهها را با نمودارهاي مختلف نمايش ميدهند. عموما اين نمودارها در ارتباط با دادههاي پيو.سته به كار گرفته مي شود و منظور از نمايش آنها، تجسم عيني اطلاعات نهفته در دادهها است. در اين بخش به معرفي چند نمودار معروف اكتفا ميكنيم:
هيستوگرام
نمودار دادههاي پيوسته را نمودار هيستوگرام مينامند. در اين نمودار محور افقي كران طبقات و محور عمودي فراواني را نشان ميدهد. در اين نمودار بايد مستطيل يا ستونها به هم چسبيده باشند.
چندبر فراواني
براي رسم اين نمودار، xi يا نماينده طبقات در هر مستطيل را بوسيله خطاهاي شكسته به يكديگر متصل ميكنيم و به خاطر زيبايي اين نمودار از كوچكترين كران جدول فاصله طبقات (W) را كم كرده و به بزرگترين كران جدول فاصله طبقات (W) را اضافه ميكنيم و ابتدا و انتهاي نمودار را به وسط قاعدههاي جديد يا همان xiهاي طبقههاي جديد وصل ميكنيم.
چندبر فراواني تجمعي:
براي رسم اين نمودار محور افقي را xi (نماينده طبقات) و محور عمودي را Ri درنظر بگيريد و نقاط تلاقي آنها را بوسيله خطهاي شكسته به هم وصل كنيد.
منحنيهاي فراواني و فراواني تجمعي
براي رسم منحني فراواني محور افقي را xi و محور عمودي را fi و براي رسم منحني فراواني تجمعي محور افقي را xi و محور عمودي را Ri قرار دهيد و نقاط تلاقي را به يكديگر وصل كنيد.
نمايش نمودار تنه و شاخه
اين نوع نمودار براي دادههاي كمي بكار ميرود. براي رسم اين نمودار ابتدا بهتر است دادهها را به صورت صعودي مرتب كنيم و ارقام مشاهدات را به دو قسمت به نامهاي تنه و شاخه تقسيم كنيم. تنه شامل يك يا چند رقم و شاخه شامل ارقام باقيمانده است. مثلاً عدد 32 را به 3 تنه و 2 شاخه تقسيم ميكنيم.
توجه: اگر دادههاي ارقام اعشاري باشند، آنها را سرراست ميكنيم.
نمودار جعبهاي
رسم اين نمودار را در انتهاي فصل پنجم به طور جامع توضيح ميدهيم.
مثال 1: نمرات 80 دانشجو در امتحانات نهايي درس احتمال و آمار به شرح زير است:
93 76 88 62 90 68 82 75 84 68
75 85 59 71 93 60 73 88 79 73
72 63 78 95 62 74 87 75 65 61
60 68 74 69 77 94 75 82 78 66
71 83 79 60 95 75 61 89 78 99
75 71 65 76 85 78 97 67 62 79
74 50 76 62 78 88 57 73 80 65
77 85 75 76 63 72 81 73 67 86
موارد زير را بدست آوريد.
الف) تشكيل جدول فراواني ب) رسم نمودارهاي آماري
حل: اندازه واقعي مدلها در فاصله [5/99-5/49] است.
در آن r تمام ارقام گرد شده است. C تعداد طبقات است كه برابر 5 ميباشد. اندازه طبقات برابر:
Ri Fi ri fi xi كلاس
3
3 54.5 49.5-59.5
24
21 64.5 59.5-69.5
57
33 74.5 69.5-79.5
72
15 84.5 79.5-89.5
1 80
8 94.5 89.5-99.5
-- -- 1 80 -- sum
نمودار هيستوگرام:
كه در آن:
كران بالاي طبقه + كران پايين طبقه = xi xi: نمايده طبقات هستند
2
نمودار چندبر فراواني
نمودار چندبر فراواني
نمودار منحني فراواني
نمودار منحني فراواني تجمعي
پس از ساختن نمودار اوليه معمولا بهتر است مقادير هر شاخه را از كوچك به بزرگ، با تعداد دفعات تكرار، مرتب كرد، به صورت زير:
مثال 2: معدل 50 دانشجوي دانشگاه با تقريب تا يك رقم اعشار، به شرح زير است:
1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2
8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2
8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1
9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2
4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1
قسمتهاي زير را محاسبه كنيد.
الف) تشكيل جدول فراواني
ب) رسم نمودارهاي آماري
چون دادهها تا يك رقم اعشار گرد شدهاند، بنابراين ميتوان گفت كه اندازه واقعي معدلها در فاصله [1.35,2.95] است.
براي محاسبه فاصله طبقات (W) ابتدا نياز به محاسبات زير است كه در آن r تعداد ارقام گرد شده است.
كه در آن:
C: تعداد طبقات
W: طول واقعي كلاس
R: دامنه است.
Ri Fi ri fi xi كلاس
0.08 4 0.08 4 1.45 1.35-1.55
0.20 10 0.12 6 1.65 1.55-1.75
0.44 22 0.24 12 1.85 1.75-1.95
0.62 31 0.18 9 2.05 1.95-2.15
0.78 39 0.16 8 2.25 2.15-2.35
0.90 45 0.12 6 45.2 2.35-2.55
0.94 47 0.04 2 2.65 2.55-2.75
1.00 50 0.06 3 2.85 2.75-2.95
-- -- 1.00 50 -- sum
هيستوگرام
چندبر فراواني
چندبر فراواني تجمعي
نمودار منحني فراواني تجمعي
نمودار منحني فراواني
نمودار تنه و شاخه
فصل چهارم
معيارهاي مركزي
با استفاده از جدول فراواني و رسم نمودارها ميتوانيم دادهها را به نحو مطلوبي تنظيم كرده و اطلاعات نهفته را تا حدودي مشخص كنيم. با اين حال براي ارايه يك گزارش مناسب،بهتر است آنها را در يك يا چند عدد مناسب نيز خلاصه كنيم. چنين عددي ميتواند معيار مركزي باشد. مهمترين معيارهاي مركزي ميانگين، ميانه و نما است كه در بخش این به شرح هر يك از آنها خواهيم پرداخت.
هرگاه n داده y1, y2, k, yn از k نوع ، با فرض ، به ترتيب با تعدادهاي تشكيل شده باشند، آنگاه را فراواني ميگوييم.
ميانگين
ميانگين به عنوان يك شاخص مركزي به صورت ذيل تعريف ميگردد:
حاصل جمع دادهها = ميانگين
تعداد دادهها
مثال: ميانگين دادههاي زير را كه در خصوص تعداد فرزند كارمندان يك اداره است را بدست آوريد:
5 5 4 3 3 2 2 1 1 1 1 0 0
يعني به طور متوسط كارمندان داراي 15/2 فرزند هستند.
توجه: ميانگين جمعيت را با حرف يوناني نشان داده و آنرا "مو" تلفظ ميكنند. ميانگين نمونه را با حرف نمايش داده و آن را "ايكس بار" مينامند. ميانگين انواع مختلف دارد كه مختصر به چند نوع آن اشاره خواهيم كرد.
مثال: فرض كنيد تعداد دانشجويان تهران 2000 نفر ميباشند. بطور تصادفي يك نمونه 100 تايي گرفته شده است تا قد دانشجويان مورد بررسي قرار گيرد و واحد اندازهگيري بر حسب سانتيمتر تا نزديكترين واحد سر راست شدهاند كه نتايج آن بصورت زير درآمده است.
i كران طبقات fi xi
1
2
3
4
5 149.5-156.5
156.5-163.5
163.5-170.5
170.5-177.5
177.5-184.5 15
20
30
25
10 153
160
167
178
181
Sum --- 100 --
يعني بطور متوسط قد دانشجويان 65/166 سانتيمتر است.
يادآوري: k تعداد طبقات در جدول فرواني است.
ميانگين حسابي
ميانگين حسابي براي دادهها وقتي بكار گرفته ميشوند كه دادههاي آماري داراي اهميت مساوي باشند كه آن را با نماد نمايش ميدهند و فرمول آن به صورت زير است:
ميانگين وزني
اگر دادههاي آماري داراي اهميت مساوي نباشند، به هر يك از اين دادهها، وزني به تناسب اهميت آن اختصاص ميدهند، يعني متناظر هر يك از دادههاي وزني به صورت درنظر ميگيريم. به عبارت ديگر wi وزنهايي است كه به هر يك از xiها به ازاي نسبت داده شده است. ميانگين وزني را معمولاً با نماد نمايش ميدهيم و فرمول آن به صورت زير است:
مثال: در يك شهر كه 3 روزنامه محلي منتشر ميشود، 18 درصد خانوارهاي ساكن اين شهربا هيچ يك از روزنامهها مشترك نيستند، اما درصد آنها با يكي از روزنامه، 17 درصد با دو روزنامه، 4 درصد هر سه روزنامه مشتركند. متوسط اشتراك خانواده اين شهر را با اين روزنامهها بدست آوريد.
i xi wi
1
2
3
4 0
1
2
3 0.18
0.61
0.17
0.04
1
ميانگين هندسي
تعاريف مختلفي براي اين نوع ميانگين آوردهاند، اما رايجترين آنها اين است:
فرض كنيد n مشاهده مثبت غيرصفر بصورت ذيل داريم:
در اينصورت ميانگين هندسي را به صورت زير تعريف ميكنيم:
در مسائل اقتصادي يا جمعيتشناسي ميانگين هندسي را معمولاً هرگاه xiها از درصد يا نسبت تشكيل شده باشند بكار ميبرند.
تذكر:
ميانگين هندسي همواره از ميانگين حسابي كوچكتر است به استثناء موارد نادري كه تمام مقادير يكسان ميباشند كه در اين صورت ميانگين هندسي و حسابي برابر ميشوند.
مثال: فرض كنيد ميزان توليد كارخانهاي در چهار سال متوالي 2، 4، 6 و 27 باشد. در حالتهاي زير ميزان افزايش متوسط را بدست آوريد.
الف) سال پايه ثبت باشد (يعني توليد امسال را نسبت به يك سال درنظر ميگيرند).
ب) سال پايه ثابت نباشد (يعني توليد هر سال را نسبت به سال قبل درنظر ميگيرند).
حل) الف:
ب:
ميانه
اگر دادهها را از كوچك به بزرگ مرتب نماييم، عدد m را ميانه اين دادهها ميناميم، اگر نصف دادهها در سمت چپ و نصف داده در سمت راست اين عدد قرار گيرد
محاسبه ميانه براي دادههاي گسسته
اگر y1, y2, k, yn دادههاي ما باشند و شكل مرتب شده آنها را با . نمايش دهيم. آنگاه:
مثال: تعداد كتابهاي منتشر شده سال 79 در 15 انتشاراتي به شرح زير است. ميانه را بدست آوريد.
4 3 2 10 1
9 8 6 5 4
11 2 10 10 9
ابتدا دادهها را به صورت صعودي مرتب ميكنيم. داريم:
11 10 10 10 9 9 8 6 5 4 4 3 2 2 1
چون تعداد دادهها فرد است، پس ميانه دادهها است. پس:
در نتيجه ميانه برابر 6 ميباشد.
محاسبه ميانه براي دادههاي پيوسته
براي محاسبه ابتدا ستون فراواني انباشته (Fi) را تشكيل ميدهيم. را محاسبه كرده و هر طبقهاي را كه برابر يا بلافاصله بزرگتر از n/2 باشد را به عنوان رده ميانه درنظر ميگيريم. فرمول ميانه به صورت زير ميباشد:
كه در آن:
LM: كران پايين رده ميانه
n: تعداد دادهها
Fb: فراواني انباشته قبل از رده ميانه
fm: فراواني رده ميانه
W: طول (فاصله) رده ميانه است.
مثال: معدل 50 دانشجوي دانشگاه با تقريب تا يك رقم اعشار، به شرح زير است:
1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2
8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2
8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1
9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2
4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1
fi xi كلاس
4 1.45 1.35-1.55
6 1.65 1.55-1.75
12 1.85 1.75-1.95
9 2.05 1.95-2.15
8 2.25 2.15-2.35
6 45.2 2.35-2.55
2 2.65 2.55-2.75
3 2.85 2.75-2.95
50 -- sum
ميانه را حساب كنيد.
حل: ستون فراواني انباشته را تشكيل ميدهيم، داريم: ، پس طبقه 15/2-99/1 چون فراواني انباشته آن را بلافاصله بعد از 25 است رده ميانه است.
Fi fi xi كلاس
4 4 1.45 1.35-1.55
10 6 1.65 1.55-1.75
22 12 1.85 1.75-1.95
31 9 2.05 1.95-2.15
39 8 2.25 2.15-2.35
45 6 45.2 2.35-2.55
47 2 2.65 2.55-2.75
50 3 2.85 2.75-2.95
-- 50 -- Sum
نما
دادهاي كه فراواني آن نسبت به ديگر دادهها بيشتر باشد، نما يا مد ناميده ميشود و آن را با نماد M نمايش ميدهيم.
محاسبه نما براي دادههاي گسسته
براي به دست آوردن نما، نخست فراواني دادهها را پيدا ميكنيم و دادهاي را كه فراواني آن بيشتر باشد، به عنوان نما اختيار ميكنيم و اگر دو داده، داراي فراواني يكسان و بيش از ديگر فراوانيها باشند، هر دو را به عنوان نما اختیار ميكنيم و دادهها را دو نمايي ميگوييم، به شرط آن كه اين دو داده در يك صف غيرنزولي، كنار هم نباشند. در صورتي كه اين دو داده در يك صف غير نزولي، كنار هم باشند نصف مجموع آنها را به عنوان نما اختيار ميكنيم. اگر تمام داده داراي فراواني يكسان باشند،ميگوييم دادهها بدون نما هستند. به ياد داشته باشيد كه نما، به عنوان يك معيار تمركز در دادههاي گروهي به كار گرفته ميشود.
مثال: براي دادههاي 2، 2، 5، 7، 9، 9، 9، 10، 10، 11، 12و 18 نما برابر 9=M است، زيرا فراواني داده 9 بيش از فراواني ديگر دادهها است.
مثال: براي دادهها 2، 3، 4، 4، 4، 5، 5، 7، 7، 7و 9، دو داده 4 و 7 به عنوان نما اختيار ميشوند، زيرا فراواني اين دو داده، بيش از فراواني دادههاي ديگر است.
مثال: براي دادههاي 3، 5، 8، 10، 12، 15و 16، نما وجود ندارد، زيرا تمام دادهها داراي فراواني يكسان هستند.
مثال: براي دادهها 2، 3، 4، 4، 4، 5، 5، 5، 7، 7 و 9، 2 داده 4 و 5 را كه داراي بيشترين فراواني هستند به عنوان نما بر ميگزينيم، اما از آنجا كه اين دو داده در يك صف غير نزولي در كنار يكديگر قرار دادند، نصف مجموف دو داده به عنوان نما اختيار ميشود، يعني 5/4=M.
محاسبه تما براي دادههاي پيوسته:
براي محاسبه نما در اين حالت ستون فراواني را درنظر ميگيريم و هر طبقهاي كه بيشترين فراواني را داشته باشد، آن طبقه را به عنوان نما تعيين ميكنيم. فرمول نما در اين حالت به صورت زير است:
كه در آن:
LM: كران پايين رده نما
d1: اختلاف فراواني رده نما با رده قبل از خودش
d2: اختلاف فراواني رده نما با رده بعد از خودش
W: طول (فاصله) رده نما ميباشد.
مثال: معدل 50 دانشجوي دانشگاه با تقريب تا يك رقم اعشار، به شرح زير است:
1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2
8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2
8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1
9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2
4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1
نما را بدست آوريد.
از روي جدول ملاحظه ميشود كه فراواني رده 95/1_75/1 داراي بيشترين فراواني است بنابراين به عنوان رده نما در نظر ميگيريم.
چندكها
چندك يك معيار كليتر از ميانه است و درعنوان حالت خاص ميانه را نيز در بر ميگيرد. اگر p يك عدد حقيقي بين صفر و يك باشد، آنگاه عدد را چندك مرتبه p ميناميم. هرگاه p 100% دادهها سمت چپ و (p -1) 100% دادهها سمت راست باشند. چندكهاي معروف عبارتند از:
چاركها
چاركها به ازاي 75/0، 5/0، 25/0 =p به دست ميآيند و آنها را به ترتيب با نماد (چارك اول)، (چارك دوم) و (چارك سوم) نشان ميدهند.
دهكها
دهكها به ازاي 9/0،.....،2/0،1/0=p به دست ميآيند و آنها را به ترتيب با نماد (دهك اول)، (دهك دوم)، ...... و (دهك نهم) نشان ميدهند.
صدكها
صدكها به ازاي 99/0،.....02/0، 01/0=p به دست ميآيند و آنها را به ترتيب با نماد (صدك اول)، (صدك دوم)،.....و (صدك نود و نهم) نشان ميدهند.
محاسبه چندك براي دادههاي گسسته
فرض كنيد y1, y2, k, yn دادههاي ما باشند و شكل مرتب شده آنها را با نمايش دهيم. براي محاسبه چندك
محاسبه چندك براي دادههاي پيوسته
براي محاسبه چندك در فرمول ميانه اولاً را به جاي m و p را به جاي 5/0 درنظر ميگيريم. سپس ساير مراحل را مانند روش محاسبه ميانه انجام ميدهيم كه فرمول آن به صورت زير ميشود:
كه در آن:
: كران پايين رده چندك
n: تعداد دادهها
Fb: فراواني انباشته قبل از رده چندك
: فراواني رده چندك
w: طول (فاصله) رده چندك است.
مثال: معدل 50 دانشجوي دانشگاه با تقريب تا يك رقم اعشار، به شرح زير است:
1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2
8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2
8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1
9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2
4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1
fi xi كلاس
4 1.45 1.35-1.55
6 1.65 1.55-1.75
12 1.85 1.75-1.95
9 2.05 1.95-2.15
8 2.25 2.15-2.35
6 45.2 2.35-2.55
2 2.65 2.55-2.75
3 2.85 2.75-2.95
50 -- Sum
چندك مرتبه 25/0 را محاسبه كنيد.
ستون فراواني تجمعي را محاسبه ميكنيم. با توجه به ستون فراواني تجمعي در جدول فراواني، كلاسي را كه چندك در آن قرار دارد مشخص ميكنيم. براي اين كار np را محاسبه ميكنيم. چون طبقه سوم بلافاصله بعد از 5/12 آمده است، بنابراين طبقه سوم (95-1-75/1) به عنوان چندك مرتبه 25/0 انتخاب ميكنيم.
Fi fi xi كلاس
4 4 1.45 1.35-1.55
10 6 1.65 1.55-1.75
22 12 1.85 1.75-1.95
31 9 2.05 1.95-2.15
39 8 2.25 2.15-2.35
45 6 45.2 2.35-2.55
47 2 2.65 2.55-2.75
50 3 2.85 2.75-2.95
-- 50 -- Sum
مقايسه معيارهاي مركزي
داده پرت
دادهاي كه با ساير دادههاي ديگر اختلاف زيادي داشته باشد، داده پرت ناميده ميشود. در اين حالت بايستي شاخص مركزي مناسبي براي دادهها انتخاب و محاسبه شود.
مثال: دادههاي زير در خصوص تعداد ماموريت كارمندان يك اداره است. ميانگين و ميانه را محاسبه كرده و بيان كنيد كدام شاخص مركزي ماموريت دادهها را بهتر نشان دهد.
90 15 14 13 13 12 11 9 7 7 5 3 2 2 1
حل. محاسبه ميانگين:
محاسبه ميانه:
چون دادهها به صورت صعودي مرتب شدهاند و تعداد آنها (n) فرد است، بنابراين ميانه است. در نتيجه ميانه است. حال وضعيت مكاني داده پرت، ميانگين و ميانه را در دادهها كه به صورت زير است، درنظر ميگيريم.