بخشی از مقاله

پروژه آمار توصیفی


فهرست مطالب

پيشگفتار 1
دیدگاه‌هایی درمورد آمار 1
دید کلی 2
نقش آمار در زندگی روزمره 2


نقش آمار در پژوهش‌های علمی 2
کاربرد آمار 3
فصل اول
آمار توصيفي
جمعيت 4
نمونه 5
متغير 5
مقياسهاي اندازهگيري 6
داده 7
فصل دوم


جدولهاي آماري
فراواني مطلق 9
فراواني نسبي 9
فراواني تجمعي 11
فراواني نسبي تجمعي 12
فصل سوم


نمودارهاي آماري
هيستوگرام 13
چندبر فراواني 13
چندبر فراواني تجمعي: 13
منحني‌هاي فراواني و فراواني تجمعي 13
نمايش نمودار تنه و شاخه 14
نمودار جعبه‌اي 14
فصل چهارم
معيارهاي مركزي
ميانگين 22
ميانگين حسابي 23
ميانگين وزني 23
ميانگين هندسي 24
ميانه 25
نما 27
چندكها 29
مقايسه معيارهاي مركزي 32
داده پرت 32
فصل پنجم


معيارهاي پراكندگي
دامنه 34
ميانگين انحراف از ميانگين 34
واريانس 35
انحراف معيار 36
ضريب تغييرات 37
ضريب چولگي و كشيدگي 38
منحني‌هاي فراواني 39
ضريب چولگي 40


ضریب کشیدگی 43
نمودار جعبه‌ای 44
تشخیص داده پرت به روش چارک‌ها و رابطه داده پرت با نمودار جعبه‌ای (نمودار جعبه‌ای اصلاح شده) 49
منابع 54


پيشگفتار
در عصر حاضر كسي نمي‌تواند منكر این واقعیت باشد كه آمار نقشي لاینفک در زندگي روزمره ما بازي مي‌كند. اخبار روزانه رسانه‌هاي گروهی با گزارشی از وضع هوا به پایان مي‌رسند و در طول اخبار، به جریان‌های بازار بورس و سهام اشاره مي‌شود و روزنامه‌ها خبر از افزایش نرخ اجناس مي‌دهند.
آمار به عنوان پايه يك روش و راه موثر در بررسی مسائل موجود، در بسیاری از زمينه‌هاي علمي از جمله جامعه شناسي، کشاورزی، فيزيك و .... به‌ كار گرفته مي‌شود. در دانش امروزي، معمولاً سعی مي‌شود كه اطلاعات موجود در يك زمينه خاص، در قالب اعداد نمایش داده شود تا به هنگام تجزیه و تحلیل اطلاعات، فهم بهتری از پدیده مورد مطالعه به‌ دست آمده و امکان مقایسه فراهم گردد. در يك جمله آمار مجموعه‌اي از روش‌های جمع آوری، تهيه و تنظیم و تجزیه و تحلیل اطلاعات است كه براي كسب يك يا چند نتیجه به خدمت گرفته مي‌شود.
دیدگاه‌هایی درمورد آمار


تهيه آمار كاری وقت‌گير و زمان بر و اصولا كسالت‌آور است.
آمار گورستانی از اعداد و ارقام است كه در هر اداره و سازمان نمونه‌ای از آن پيدا می‌شود.
آمار مجموعه‌ای از روابط و فرمول‌های رياضی پيچيده و گيج‌كننده است.
آمار شامل نمودارها و جدول‌هايی از اعداد است.
آمار فرايندی است كه در آن هر ده سال افرادی را به منازل فرستاده و اطلاعات خانوارها مانند تعداد فرزندان، سن افراد خانوار را از آنها كسب می‌كنند.


آمار ابزاری است كه بسياری با توسل به آن افكار عمومی را به نفع خود جلب می‌كنند.
آمار مفهومی است كه براي ثبت و نمايش اطلاعات عددی به كار می‌رود، مانند تعداد بيكاران، جمعيت نواحی جنوب شهر تهران، تعداد افراد تلف شده در اثر شيوع يك بيماری يا مقدار مسافت طی شده در زمان معينی به وسيله برنده مسابقه‌ دو.
دید کلی
بیشتر مردم با کلمه آمار، به مفهومی که برای ثبت و نمایش اطلاعات عددی بکار می‌رود، آشنا هستند: تعداد بیکاران، قیمت روزانه بعضی از سهام در بازار بورس، مثال‌هایی از این مفهوم‌اند. ولی این مفهوم با موضوع منطبق با موضوع اصلی مورد بحث آمار نیست. آمار عمدتا با وضعیت‌های سروکار دارد که در آنها وقوع یک پیشامد بطور حتمی قابل پیش بینی نیست. استنتاج‌های آماری غالباً غیر حتمی‌اند زیرا مبتنی بر اطلاعات ناکاملی هستند. معادل کلمه آمار در زبان انگلیسی Statistics است که از لحاظ تاریخی از کلمه لاتین Status مشتق شده است.
نقش آمار در زندگی روزمره
پی بردن به واقعیات امور از طریق گردآوری و تعبیر داده‌ها، منحصر به پژوهشگران حرفه‌ای نیست. این امر در زندگی روزمره همه مردم که می‌کوشند آگاهانه، ناآگاهانه مسائلی را درباره جامعه، محیط زندگی خود و کل دنیا درک کنند، معمول است. برای کسب اطلاع از وضع بیکاری، اثر یک مسکن در رفع بیماری و سایر مسائل مورد علاقه در زندگی روزمره، اطلاعات و ارقام را جمع‌آوری و آنها را تفسیر می‌نماییم یا کوشش می‌کنیم که تفسیرهای دیگران را بفهیم. بنابراین، هر روز از طریق تجزیه و تحلیل ضمنی اطلاعات مبتنی بر واقعیات، عمل کسب آگاهی انجام می‌گیرد.
نقش آمار در پژوهش‌های علمی


موضوع آمار عبارت است از هنر علم جمع آوری، تعبیر و تجزیه و تحلیل داده‌ها و استخراج تعمیم‌های منطقی در مورد پدیده‌های تحت بررسی. با توجه به مراحل اساسی یک تحقیق علمی که عبارتند از: مشخص کردن هدف، جمع آوری اطلاعات، تجزیه و تحلیل داده‌ها و بیان یافته‌های آشکار است که آمار بطور وسیعی در قلمرو تمام تحقیقات علمی بکار می‌رود. به ویژه، در مرحله جمع آوری اطلاعات، آمار راهنمای محقق در انتخاب روش‌ها و وسایل مناسب برای جمع‌آوری داده‌های اطلاعاتی است. در مراحل بعد از گرد آوری داده‌ها، نیاز بیشتری به روش‌های آماری وجود دارد.
کاربرد آمار


کاربرد روش‌های آماری در قلمروهای گوناگون از علوم انسانی، علوم مهندسی، رشته‌های علمی جدیدی پدید آورده است که در ارتباط متقابل با آمار هستند. نظیر آمار زیستی، روان‌سنجی، آمار مهندسی، آمار بازرگانی، اقتصادسنجی و جمعیت‌شناسی. به علاوه علم آمار در رشته‌های بسیار دیگری که هنوز از ترکیب آنها با آمار شاخه‌هایی با اسامی خاص پدید نیامده، از قبیل علوم سیاسی، هواشناسی و محیط‌شناسی نقش عمده‌ای ایفا می‌کند.

فصل اول
آمار توصيفي
براي اينكه نتايج مناسب و مطلوب از اطلاعات كه در آمارگيري‌ها جمع‌آوري مي‌كنيم، به‌ دست آيد بايد:
– اعداد نماينده واقعي مشاهدات بوده و غيرواقع يا غلط نباشند
– به نحو مفيدي تهيه و تنظيم شوند
– به نحو صحيح تجزيه و تحليل گردند
– قابل نتيجه گيري صحيح باشند
به طور كلي، روشهایی که بوسیلة آنها می‌توان اطلاعات جمع‌آوری شده را تنظیم، طبقه‌بندی و خلاصه نمود و آنها را بوسیلة نمودارهایی نمایش داد، به آمار توصیفی موسوم است. هدف آمار توصيفي توجيه نيست، بلكه توصيف استخراج نكات اساسي و تحقق بخشيدن به تركيب اطلاعات به كمك زبان اعداد است. برای معرفی این روشها نیاز به برخی اصطلاحات داریم که در ذیل به معرفی آنها می‌پردازیم.
جمعيت
مجموعة تمام افراد یا اشیایی که مطالعات آماری در مورد یک یا چند صفت آنها در یک مکان و زمان معین انجام می‌گیرد به جمعیت موسوم است. هر یک از این افراد یا اشیا را یک عضو جمعیت می‌نامند و تعداد اعضای جمعیت را اندازة جمعیت می‌نامند.
مثال1: اندازه قد يا وزن دانشجويان بيست ساله يك شهر، تعداد لامپ‌هاي سالم و يا ناسالم توليد شده در يك كارخانه و در يك روز معين، مثالهايي از جمعيت‌هاي آماري‌ هستند.


مثال2: اگر بخواهیم معدل دانشجویان یک دانشکده در یک نیمسال را مورد بررسی قرار دهیم آنگاه جمعیت مورد نظر کلیة دانشجویان آن دانشکده می‌باشند و صفت مورد مطالعه معدل نیمسال تحصیلی آنها است. همین‌طور اگر بخواهیم میزان کالری موجود در غذاهای کنسرو شده در یک کارخانه کنسرو سازی در یک روز معین را مورد بررسی قرار دهیم آنگاه جمعیت مورد نظر تمامی غذاهای کنسرو شده کارخانه در آن روز و صفت مورد مطالعه میزان کالری موجود در آنها می‌باشد.
نكته:
معمولا مطالعه ويژگي‌هاي مورد نظر، به هنگامی كه جمعیت آماری بسیار گسترده باشد، مستلزم صرف هزینه و وقت زيادي مي‌باشد و در بسیاری از مواقع، اين امر اصولا امکان پذیر نیست. بنابراین در چنین موردی، براي مطالعه ویژگی مورد نظر، به قسمتی از جمعیت آماری اکتفا مي‌كنيم
نمونه
زیر مجموعه‌ای از جمعیت که طبق یک قاعده و ضابطة خاصی برای مطالعة صفتی از جمعیت انتخاب می‌شود را یک نمونه گویند. تعداد اعضای نمونه به اندازة نمونه موسوم است.
نکته:
اين نمونه وقتي مفيد و قابل قبول خواهد بود كه بتواند نماينده خوبي براي كل جمعيت مورد مطالعه باشد. با توجه به اهميت اين موضوع شاخه‌اي از آمار تحت عنوان نظريه نمونه‌گيري با بررسي نمونه‌اي به اين امر مهم مي‌پردازد. در بسياري از موارد، معمولا نمونه تصادفي ساده را در نظر مي‌گيرند.
مثال: براي بررسی اندازه قد دانشجویان بیست ساله يك شهر، انتخاب مثلاً 150 نفر از بین اين جمعیت به طور تصادفی، يا انتخاب 100 لامپ به تصادف از لامپ‌هاي توليدي يك کارخانه در يك روز معین، براي تعيين كيفيت لامپهاي توليدي اين کارخانه مثالهايي از نمونه تصادفی هستند.
متغير
خصوصیت مورد مطالعه، از فردی به فرد دیگر، يا از شي به شي دیگر در جمعیت آماری تغيير مي‌كند، كه آن را اصطلاحاً متغير مي‌ناميم.


معمولاً دو نوع متغير در آمار مورد نظر هستند:
‗ متغيرهاي گروهي، نظير رنگ، نژاد، شغل و گروه خوني كه شامل چند گروه يا طبقه مي‌باشند.
‗ متغيرهاي عددي كه ممكن است نتيجه شمارش باشد، مانند تعداد احشام هر خانوار در يك روستا،‌تعداد حوادث در يك كارخانه در روزهاي مختلف و يا نتيجه اندازه‌گيري باشد، مثل قد دانشجويان بيست ساله در يك شهر، حجم شربت مولتي ويتامين با استاندارد خاص.
متغير:
• متغير‌هاي گسسته


1. متغير‌هاي گروهي
2. متغير‌هاي عددي كه از راه شمارش به‌دست آمده اند
• متغير‌هاي پیوسته
1. متغيرهايي را كه از طريق اندازه‌گيري به دست آمده باشند
مقياسهاي اندازهگيري
در بسیار از مسائل پيش‌رو،‌ اندازه‌گيري ویژگی يك متغیر مستلزم آگاهی و شناخت خاصي است. به طور كلي چهار نوع مقیاس براي اندازه‌گيري وجود دارد:
§ مقياس اسمي
§ مقياس ترتيبي
§ مقياس فاصله‌اي
§ مقياس نسبتي
مقياس اسمي:
اين نوع مقياس اندازه‌گيري عمدتاً براي طبقه بندي داده‌ها به كار مي‌رود و منظور از آن اطلاق يك عدد طبيعي به داده‌هاي متفاوت است.
مثال: اختصاص اعداد 1 تا 4 به گروه‌هاي خوني A, B, AB, O.
توجه داشته باشيد كه:
اين اعداد را نمي‌توان براي مقايسه يا چهار عمل اصلي به كار برد
مقياس ترتيبي:
اين نوع مقياس اندازه‌گيري عموما براي طبقه بندي داده‌ها به منظور يك نوع برتري به كار مي‌رود.
مثال: در يك كارخانه ممكن است كارگران را به سه دسته ساده، نيمه ماهر و ماهر تقسيم‌بندي كنيم. اطلاق به ترتيب اعداد 1 تا 3 به اين سه دسته يك مقياس ترتيبي است.
توجه داشته باشيد كه:
اين اعداد تنها براي مقايسه به كار مي‌روند و نمي‌توان با آنها چهار عمل اصلي را انجام داد.
مقياس فاصله اي:
اين نوع مقياس اندازه‌گيري عموما در زمينه‌هاي كه علاوه بر حفظ ترتيب به نحوي فاصله بين ويژگي‌ها را نيز حفظ مي‌كند. به عبارت ديگر در چنين مقياسي نسبت تفاضل‌ها ثابت مي‌ماند.
مثال: اندازه‌گيري ضريب هوشي دانش آموزان كلاس اول دبستان در شهر اصفهان.
توجه داشته باشيد كه:
در اين نوع مقياس، عدد صفر يك مفهوم قراردادي است.
مقياس نسبتي:


اين نوع مقياس اندازه‌گيري علاوه بر حفظ فاصله، نسبت را نيز حفظ مي‌كند. به عبارت ديگر در اين نوع اندازه‌گيري نسبت دو مقدار بستگي به واحد اندازه‌گيري ندارد.
داده
در یک بررسی آماری، بایستی صفت مورد مطالعه را به صورت اعداد و ارقام نمایش دهیم. اگر صفت مورد مطالعه کمی، مانند وزن، حجم، درجة حرارت و غیره باشد آنگاه این عمل به سادگی با اندازه‌گیری امکان پذیر است اما اگر صفت مورد مطالعه کیفی، مانند گروه خون، شغل، رنگ چشم و غیره باشد آنگاه بایستی با یک قاعده معین این مسائل کیفی را با اعداد و ارقام نشان داد. در هر صورت این اعداد و ارقام را داده ها گویند که به دو صورت گسسته و پیوسته می‌باشند. داده‌های گسسته داده‌هایی هستند که بین دو مقدار متصور آنها هیچ عدد دیگری وجود نداشته باشد، مانند تعداد فرزندان یک خانواده که شامل مقادیر 0، 1، 2 و... است و همچنین صفت شغل افراد که به آن مثلاً اعداد 1، 2، 3 و... را نسبت می‌دهیم و بین این مقادیر عدد دیگری در رابطه با صفت موردنظر وجود ندارد. داده‌های پیوسته داده هایی هستند که بین هر دو مقدار متصور آنها همواره عدد دیگری وجود دارد، مانند وزن افراد که بین دو نفر با وزنهای نزدیک به هم همواره می‌توان فردی را با وزنی بین وزن دو فرد یاد شده در جمعیت یافت. از جمله داده‌های گسسته می‌توان داده‌های مربوط به صفات گروه خون، رنگ، نژاد، شغل، تعداد کالاهای تولیدی و غیره را برشمرد و از جمله داده‌های پیوسته می‌توان داده‌های مربوط به صفات وزن، طول قد، فشار گاز، قطر لوله تولیدی یک کارخانه و غیره را برشمرد.
داده خام:
معمولا به داده‌هاي جمع آوري شده كه انبوهي عدد است و هيچ نوع پردازشی روي آنها انجام نشده است داده خام مي‌گويند.
در آمار بعد از جمع‌آوری داده‌ها به بررسی آماری بر روی آنها می‌پردازیم. در مرحلة نخست با توجه به اهداف بررسی، داده ها را تنظیم، طبقه بندی و خلاصه می‌کنیم به طوری که بتوانیم اطلاعات مفیدی برای نیل به اهداف و نتایج مورد نظر به دست آوریم. انجام این کار در سه مرحله به شرح زیر صورت می‌پذیرد:
الف) تنظیم و طبقه بندی داده‌ها در یک جدول
ب) ترسیم نمودارهای گوناگون از روی مقادیر ارائه شده در جدول
ج) خلاصه کردن داده ها به یک یا چند عدد موسوم به شاخص یا آماره
سه موضوع فوق از موضوعات اساسی بحث آمار توصیفی است که در ذیل به معرفی و بررسی آنها می‌پردازیم.

فصل دوم
جدولهاي آماري
نخستین گام در خلاصه کردن داده‌ها، طبقه بندی و تنظیم آنها در یک جدول موسوم به جدول آماری است. یک جدول آماری بایستی به نحوی تنظیم شود که بتوان از آن به راحتی اطلاعات نهفته در داده‌ها را استخراج کرد. متداولترین جدول آماری جدول فراوانی است که در آن داده‌ها، تعداد موجود از هر داده و درصد موجود از هر داده مشخص می‌شود. پيش از آنكه نحوه تنظيم جدول فراواني را بيان نماييم، ‌اطلاع از اصطلاحات زير ضروري است.


فراواني مطلق
هرگاه nداده y1, y2, k, yn از k نوع x1, x2, k, xk، با فرض ، به ترتيب با تعدادهاي تشكيل شده باشند،‌ آنگاه را فراواني مطلق مي‌گوييم. به عبارت ديگر تعداد دفعاتي را كه در داده‌هاي تكرار مي‌شود، فراواني مي‌ناميم و آن را با نماد نمايش مي‌دهيم.
به خاطر داشته باشيد كه:
اگر اندازه نمونه برابر n باشد، آنگاه براي

فراواني نسبي
مثال: داده‌هاي زير ميزان تصادف منجر به مرگ رد 30 منطقه را نشان مي‌دهد. فراواني دادها را تعيين نماييد.
7 6 6 3 4 3 5 5 6 8
3 4 8 4 7 5 8 5 5 3
6 5 5 6 6 5 6 7 8 2
مشاهده مي‌شود كه داده‌هاي تكرار اعداد 2،3،4،5،6،7،8 مي‌باشند،‌بنابراين جدول زير را براي فراواني داده‌ها خواهيم داشت:


2
3
4
5


6
7
8 1
4
3
8
7


3
4

نسبت فراواني به اندازه نمونه را فراواني نسبي مي‌ناميم. اگر فراواني در يك نمونه با اندازه n، برابر fi باشد، آنگاه فراواني نسبي xi را با نماد ri نمايش خواهيم داد، به طوري كه:

به خاطر داشته باشيد كه
براي

مثال: داده‌هاي زير ميزان تصادف منجر به مرگ رد 30 منطقه را نشان مي‌دهد. فراواني نسبي را محاسبه كنيد.
7 6 6 3 4 3 5 5 6 8
3 4 8 4 7 5 8 5 5 3
6 5 5 6 6 5 6 7 8 2

جمع فراواني‌هاي fi، تعداد كل جمعيت يعني n است و جمع فراواني‌هاي نسبي ri برابر يك مي‌باشد.
فراواني تجمعي
با توجه به تعريف فراواني، فراواني تجمعي رديف i را با نماد نمايش مي‌دهيم و به صورت زير تعريف مي‌كنيم:

به خاطر داشته باشيد كه
براي اندازه نمونه n و آنگاه:

مثال: داده‌هاي زير ميزان تصادف منجر به مرگ رد 30 منطقه را نشان مي‌دهد. فراواني تجمعي را تعيين نماييد.
7 6 6 3 4 3 5 5 6 8
3 4 8 4 7 5 8 5 5 3
6 5 5 6 6 5 6 7 8 2

فراواني نسبي تجمعي
با توجه به تعريف فراواني نسبي،‌ فراواني نسبي تجمعي رديف i را با نماد Ri نماد نمايش مي‌دهيم و به صورت زير تعريف مي‌كنيم:

به خاطر داشته باشيد كه:
براي اندازه نمونه n و آنگاه:

مثال: داده‌هاي زير ميزان تصادف منجر به مرگ رد 30 منطقه را نشان مي‌دهد. فراواني نسبي تجمعي را تعيين نماييد.
7 6 6 3 4 3 5 5 6 8
3 4 8 4 7 5 8 5 5 3
6 5 5 6 6 5 6 7 8 2



فصل سوم
نمودارهاي آماري
معمولا داده‌ها را با نمودارهاي مختلف نمايش مي‌دهند. عموما اين نمودارها در ارتباط با داده‌‌هاي پيو.سته به كار گرفته مي شود و منظور از نمايش آنها،‌ تجسم عيني اطلاعات نهفته در داده‌ها است. در اين بخش به معرفي چند نمودار معروف اكتفا مي‌كنيم:
هيستوگرام
نمودار داده‌هاي پيوسته را نمودار هيستوگرام مي‌نامند. در اين نمودار محور افقي كران طبقات و محور عمودي فراواني را نشان مي‌دهد. در اين نمودار بايد مستطيل يا ستون‌ها به هم چسبيده باشند.
چندبر فراواني
براي رسم اين نمودار، xi يا نماينده طبقات در هر مستطيل را بوسيله خطاهاي شكسته به يكديگر متصل مي‌كنيم و به خاطر زيبايي اين نمودار از كوچكترين كران جدول فاصله طبقات (W) را كم كرده و به بزرگترين كران جدول فاصله طبقات (W) را اضافه مي‌كنيم و ابتدا و انتهاي نمودار را به وسط قاعده‌هاي جديد يا همان xiهاي طبقه‌هاي جديد وصل مي‌كنيم.
چندبر فراواني تجمعي:
‌براي رسم اين نمودار محور افقي را xi (نماينده طبقات) و محور عمودي را Ri درنظر بگيريد و نقاط تلاقي آنها را بوسيله خط‌هاي شكسته به هم وصل كنيد.


منحني‌هاي فراواني و فراواني تجمعي
براي رسم منحني فراواني محور افقي را xi و محور عمودي را fi و براي رسم منحني فراواني تجمعي محور افقي را xi و محور عمودي را Ri قرار دهيد و نقاط تلاقي را به يكديگر وصل كنيد.
نمايش نمودار تنه و شاخه
اين نوع نمودار براي داده‌هاي كمي بكار مي‌رود. براي رسم اين نمودار ابتدا بهتر است داده‌ها را به صورت صعودي مرتب كنيم و ارقام مشاهدات را به دو قسمت به نام‌هاي تنه و شاخه تقسيم كنيم. تنه شامل يك يا چند رقم و شاخه شامل ارقام باقيمانده است. مثلاً عدد 32 را به 3 تنه و 2 شاخه تقسيم مي‌كنيم.
توجه: اگر داده‌هاي ارقام اعشاري باشند، آنها را سرراست مي‌كنيم.
نمودار جعبه‌اي
رسم اين نمودار را در انتهاي فصل پنجم به طور جامع توضيح مي‌دهيم.
مثال 1: نمرات 80 دانشجو در امتحانات نهايي درس احتمال و آمار به شرح زير است:
93 76 88 62 90 68 82 75 84 68
75 85 59 71 93 60 73 88 79 73
72 63 78 95 62 74 87 75 65 61
60 68 74 69 77 94 75 82 78 66
71 83 79 60 95 75 61 89 78 99
75 71 65 76 85 78 97 67 62 79
74 50 76 62 78 88 57 73 80 65
77 85 75 76 63 72 81 73 67 86
موارد زير را بدست آوريد.
الف) تشكيل جدول فراواني ب) رسم نمودارهاي آماري
حل: اندازه واقعي مدل‌ها در فاصله [5/99-5/49] است.


در آن r تمام ارقام گرد شده است. C تعداد طبقات است كه برابر 5 مي‌باشد. اندازه طبقات برابر:

Ri Fi ri fi xi كلاس

3
3 54.5 49.5-59.5

24
21 64.5 59.5-69.5

57
33 74.5 69.5-79.5

72
15 84.5 79.5-89.5
1 80
8 94.5 89.5-99.5
-- -- 1 80 -- sum


نمودار هيستوگرام:

كه در آن:
كران بالاي طبقه + كران پايين طبقه = xi xi: نمايده طبقات هستند
2

نمودار چندبر فراواني


نمودار چندبر فراواني

نمودار منحني فراواني

نمودار منحني فراواني تجمعي


پس از ساختن نمودار اوليه معمولا بهتر است مقادير هر شاخه را از كوچك به بزرگ، با تعداد دفعات تكرار، ‌مرتب كرد، به صورت زير:

مثال 2: معدل 50 دانشجوي دانشگاه با تقريب تا يك رقم اعشار،‌ به شرح زير است:
1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2
8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2
8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1
9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2
4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1

قسمت‌هاي زير را محاسبه كنيد.
الف) تشكيل جدول فراواني
ب) رسم نمودارهاي آماري
چون داده‌ها تا يك رقم اعشار گرد شده‌اند، بنابراين مي‌توان گفت كه اندازه واقعي معدل‌ها در فاصله [1.35,2.95] است.
براي محاسبه فاصله طبقات (W) ابتدا نياز به محاسبات زير است كه در آن r تعداد ارقام گرد شده است.

كه در آن:
C: تعداد طبقات
W: طول واقعي كلاس
R:‌ دامنه است.

Ri Fi ri fi xi كلاس
0.08 4 0.08 4 1.45 1.35-1.55
0.20 10 0.12 6 1.65 1.55-1.75
0.44 22 0.24 12 1.85 1.75-1.95
0.62 31 0.18 9 2.05 1.95-2.15
0.78 39 0.16 8 2.25 2.15-2.35
0.90 45 0.12 6 45.2 2.35-2.55
0.94 47 0.04 2 2.65 2.55-2.75
1.00 50 0.06 3 2.85 2.75-2.95
-- -- 1.00 50 -- sum


هيستوگرام

چندبر فراواني

چندبر فراواني تجمعي

نمودار منحني فراواني تجمعي

نمودار منحني فراواني

نمودار تنه و شاخه


فصل چهارم
معيارهاي مركزي
با استفاده از جدول فراواني و رسم نمودارها مي‌توانيم داده‌ها را به نحو مطلوبي تنظيم كرده و اطلاعات نهفته را تا حدودي مشخص كنيم. با اين حال براي ارايه يك گزارش مناسب،‌بهتر است آنها را در يك يا چند عدد مناسب نيز خلاصه كنيم. چنين عددي مي‌تواند معيار مركزي باشد. مهمترين معيارهاي مركزي ميانگين‌،‌ ميانه و نما است كه در بخش این به شرح هر يك از آنها خواهيم پرداخت.
هرگاه n داده y1, y2, k, yn از k نوع ، با فرض ، به ترتيب با تعدادهاي تشكيل شده باشند،‌ آنگاه را فراواني مي‌گوييم.
ميانگين
ميانگين به عنوان يك شاخص مركزي به صورت ذيل تعريف مي‌گردد:
حاصل جمع داده‌ها = ميانگين
تعداد داده‌ها
مثال: ميانگين داده‌هاي زير را كه در خصوص تعداد فرزند كارمندان يك اداره است را بدست آوريد:
5 5 4 3 3 2 2 1 1 1 1 0 0

يعني به طور متوسط كارمندان داراي 15/2 فرزند هستند.
توجه: ميانگين جمعيت را با حرف يوناني نشان داده و آنرا "مو" تلفظ مي‌كنند. ميانگين نمونه را با حرف نمايش داده و آن را "ايكس بار" مي‌نامند. ميانگين انواع مختلف دارد كه مختصر به چند نوع آن اشاره خواهيم كرد.


مثال: فرض كنيد تعداد دانشجويان تهران 2000 نفر مي‌باشند. بطور تصادفي يك نمونه 100 تايي گرفته شده است تا قد دانشجويان مورد بررسي قرار گيرد و واحد اندازه‌گيري بر حسب سانتيمتر تا نزديكترين واحد سر راست شده‌اند كه نتايج آن بصورت زير درآمده است.
i كران طبقات fi xi
1
2
3
4
5 149.5-156.5
156.5-163.5
163.5-170.5
170.5-177.5
177.5-184.5 15
20
30
25
10 153
160
167
178
181
Sum --- 100 --


يعني بطور متوسط قد دانشجويان 65/166 سانتيمتر است.
يادآوري: k تعداد طبقات در جدول فرواني است.
ميانگين حسابي
ميانگين حسابي براي داده‌ها وقتي بكار گرفته مي‌شوند كه داده‌هاي آماري داراي اهميت مساوي باشند كه آن را با نماد نمايش مي‌دهند و فرمول آن به صورت زير است:

ميانگين وزني
اگر داده‌هاي آماري داراي اهميت مساوي نباشند، به هر يك از اين داده‌ها، وزني به تناسب اهميت آن اختصاص مي‌دهند، يعني متناظر هر يك از داده‌هاي وزني به صورت درنظر مي‌گيريم. به عبارت ديگر wi وزن‌هايي است كه به هر يك از xiها به ازاي نسبت داده شده است. ميانگين وزني را معمولاً با نماد نمايش مي‌دهيم و فرمول آن به صورت زير است:

مثال: در يك شهر كه 3 روزنامه محلي منتشر مي‌شود، 18 درصد خانوارهاي ساكن اين شهربا هيچ يك از روزنامه‌ها مشترك نيستند، اما درصد آنها با يكي از روزنامه، 17 درصد با دو روزنامه، 4 درصد هر سه روزنامه مشتركند. متوسط اشتراك خانواده اين شهر را با اين روزنامه‌ها بدست آوريد.
i xi wi
1
2
3
4 0
1
2
3 0.18
0.61
0.17
0.04
1

ميانگين هندسي
تعاريف مختلفي براي اين نوع ميانگين آورده‌اند، اما رايجترين آنها اين است:
فرض كنيد n مشاهده مثبت غيرصفر بصورت ذيل داريم:

در اينصورت ميانگين هندسي را به صورت زير تعريف مي‌كنيم:

در مسائل اقتصادي يا جمعيت‌شناسي ميانگين هندسي را معمولاً هرگاه xiها از درصد يا نسبت تشكيل شده باشند بكار مي‌برند.
تذكر:
ميانگين هندسي همواره از ميانگين حسابي كوچكتر است به استثناء موارد نادري كه تمام مقادير يكسان مي‌باشند كه در اين صورت ميانگين هندسي و حسابي برابر مي‌شوند.
مثال: فرض كنيد ميزان توليد كارخانه‌اي در چهار سال متوالي 2، 4، 6 و 27 باشد. در حالت‌هاي زير ميزان افزايش متوسط را بدست آوريد.


الف) سال پايه ثبت باشد (يعني توليد امسال را نسبت به يك سال درنظر مي‌گيرند).
ب) سال پايه ثابت نباشد (يعني توليد هر سال را نسبت به سال قبل درنظر مي‌گيرند).
حل) الف:

ب:

ميانه
اگر داده‌ها را از كوچك به بزرگ مرتب نماييم،‌ عدد m را ميانه اين داده‌ها مي‌ناميم، ‌اگر نصف داده‌ها در سمت چپ و نصف داده در سمت راست اين عدد قرار گيرد
محاسبه ميانه براي داده‌هاي گسسته
اگر y1, y2, k, yn داده‌هاي ما باشند و شكل مرتب شده آنها را با . نمايش دهيم. آنگاه:

مثال: تعداد كتاب‌هاي منتشر شده سال 79 در 15 انتشاراتي به شرح زير است. ميانه را بدست آوريد.
4 3 2 10 1
9 8 6 5 4
11 2 10 10 9
ابتدا داده‌ها را به صورت صعودي مرتب مي‌كنيم. داريم:
11 10 10 10 9 9 8 6 5 4 4 3 2 2 1
چون تعداد داده‌‌ها فرد است، پس ميانه داده‌ها است. پس:

در نتيجه ميانه برابر 6 مي‌باشد.
محاسبه ميانه براي داده‌هاي پيوسته
براي محاسبه ابتدا ستون فراواني انباشته (Fi) را تشكيل مي‌دهيم. را محاسبه كرده و هر طبقه‌اي را كه برابر يا بلافاصله بزرگتر از n/2 باشد را به عنوان رده ميانه درنظر مي‌گيريم. فرمول ميانه به صورت زير مي‌باشد:

كه در آن:
LM: كران پايين رده ميانه
n: تعداد داده‌ها
Fb: فراواني انباشته قبل از رده ميانه
fm: فراواني رده ميانه
W: طول (فاصله) رده ميانه است.
مثال: معدل 50 دانشجوي دانشگاه با تقريب تا يك رقم اعشار،‌ به شرح زير است:
1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2
8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2
8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1


9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2
4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1
fi xi كلاس
4 1.45 1.35-1.55
6 1.65 1.55-1.75
12 1.85 1.75-1.95
9 2.05 1.95-2.15
8 2.25 2.15-2.35
6 45.2 2.35-2.55
2 2.65 2.55-2.75
3 2.85 2.75-2.95
50 -- sum
ميانه را حساب كنيد.
حل: ستون فراواني انباشته را تشكيل مي‌دهيم، داريم: ، پس طبقه 15/2-99/1 چون فراواني انباشته آن را بلافاصله بعد از 25 است رده ميانه است.
Fi fi xi كلاس
4 4 1.45 1.35-1.55
10 6 1.65 1.55-1.75
22 12 1.85 1.75-1.95
31 9 2.05 1.95-2.15
39 8 2.25 2.15-2.35
45 6 45.2 2.35-2.55
47 2 2.65 2.55-2.75
50 3 2.85 2.75-2.95
-- 50 -- Sum


نما
داده‌اي كه فراواني آن نسبت به ديگر داده‌ها بيشتر باشد،‌ نما يا مد ناميده مي‌شود و آن را با نماد M نمايش مي‌دهيم.
محاسبه نما براي داده‌هاي گسسته
براي به دست آوردن نما،‌ نخست فراواني داده‌ها را پيدا مي‌كنيم و داده‌اي را كه فراواني آن بيشتر باشد،‌ به عنوان نما اختيار مي‌كنيم و اگر دو داده،‌ داراي فراواني يكسان و بيش از ديگر فراواني‌ها باشند، ‌هر دو را به عنوان نما اختیار مي‌كنيم و داده‌ها را دو نمايي مي‌گوييم،‌ به شرط آن كه اين دو داده در يك صف غيرنزولي، ‌كنار هم نباشند. در صورتي كه اين دو داده در يك صف غير نزولي،‌ كنار هم باشند نصف مجموع آنها را به عنوان نما اختيار مي‌كنيم. اگر تمام داده داراي فراواني يكسان باشند،‌مي‌گوييم داده‌‌ها بدون نما هستند. به ياد داشته باشيد كه نما، ‌به عنوان يك معيار تمركز در داده‌هاي گروهي به كار گرفته مي‌شود.
مثال: براي داده‌هاي 2، 2، 5، 7، 9، 9، 9، 10، 10، 11، 12و 18 نما برابر 9=M است، زيرا فراواني داده 9 بيش از فراواني ديگر داده‌ها است.


مثال: براي داده‌ها 2، 3، 4، 4، 4، 5، 5، 7، 7، 7و 9، دو داده 4 و 7 به عنوان نما اختيار مي‌شوند، زيرا فراواني اين دو داده، بيش از فراواني داده‌هاي ديگر است.
مثال: براي داده‌هاي 3، 5، 8، 10، 12، 15و 16، نما وجود ندارد، زيرا تمام داده‌ها داراي فراواني يكسان هستند.
مثال: براي داده‌ها 2، 3، 4، 4، 4، 5، 5، 5، 7، 7 و 9، 2 داده 4 و 5 را كه داراي بيشترين فراواني هستند به عنوان نما بر مي‌گزينيم، ‌اما از آنجا كه اين دو داده در يك صف غير نزولي در كنار يكديگر قرار دادند، ‌نصف مجموف دو داده به عنوان نما اختيار مي‌شود،‌ يعني 5/4=M.
محاسبه تما براي دادههاي پيوسته:


براي محاسبه نما در اين حالت ستون فراواني را درنظر مي‌گيريم و هر طبقه‌اي كه بيشترين فراواني را داشته باشد، آن طبقه را به عنوان نما تعيين مي‌كنيم. فرمول نما در اين حالت به صورت زير است:

كه در آن:
LM: كران پايين رده نما
d1: اختلاف فراواني رده نما با رده قبل از خودش
d2: اختلاف فراواني رده نما با رده بعد از خودش
W: طول (فاصله) رده نما مي‌باشد.

مثال: معدل 50 دانشجوي دانشگاه با تقريب تا يك رقم اعشار،‌ به شرح زير است:
1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2
8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2
8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1
9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2
4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1
نما را بدست آوريد.
از روي جدول ملاحظه مي‌شود كه فراواني رده 95/1_75/1 داراي بيشترين فراواني است بنابراين به عنوان رده نما در نظر مي‌گيريم.

چندكها
چندك يك معيار كلي‌تر از ميانه است و درعنوان حالت خاص ميانه را نيز در بر مي‌گيرد. اگر p يك عدد حقيقي بين صفر و يك باشد، ‌آنگاه عدد را چندك مرتبه p مي‌ناميم. هرگاه p 100% داده‌ها سمت چپ و (p -1) 100% داده‌ها سمت راست باشند. چندك‌هاي معروف عبارتند از:
چاركها
چاركها به ازاي 75/0، 5/0، 25/0 =p به دست مي‌آيند و آنها را به ترتيب با نماد (چارك اول)،‌ (چارك دوم) و (چارك سوم) نشان مي‌دهند.
دهكها
دهكها به ازاي 9/0،.....،2/0،1/0=p به دست مي‌آيند و آنها را به ترتيب با نماد (دهك اول)، (دهك دوم)، ...... و (دهك نهم) نشان مي‌دهند.
صدكها
صدكها به ازاي 99/0،.....02/0، 01/0=p به دست ميآيند و آنها را به ترتيب با نماد (صدك اول)، (صدك دوم)،.....و (صدك نود و نهم) نشان ميدهند.


محاسبه چندك براي دادههاي گسسته
فرض كنيد y1, y2, k, yn داده‌هاي ما باشند و شكل مرتب شده آنها را با نمايش دهيم. براي محاسبه چندك

محاسبه چندك براي داده‌هاي پيوسته
براي محاسبه چندك در فرمول ميانه اولاً را به جاي m و p را به جاي 5/0 درنظر مي‌گيريم. سپس ساير مراحل را مانند روش محاسبه ميانه انجام مي‌دهيم كه فرمول آن به صورت زير مي‌شود:

كه در آن:
: كران پايين رده چندك
n: تعداد داده‌ها
Fb: فراواني انباشته قبل از رده چندك
: فراواني رده چندك
w: طول (فاصله) رده چندك است.
مثال: معدل 50 دانشجوي دانشگاه با تقريب تا يك رقم اعشار،‌ به شرح زير است:
1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2
8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2
8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1
9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2
4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1
fi xi كلاس
4 1.45 1.35-1.55
6 1.65 1.55-1.75
12 1.85 1.75-1.95
9 2.05 1.95-2.15
8 2.25 2.15-2.35
6 45.2 2.35-2.55
2 2.65 2.55-2.75
3 2.85 2.75-2.95
50 -- Sum
چندك مرتبه 25/0 را محاسبه كنيد.
ستون فراواني تجمعي را محاسبه مي‌كنيم. با توجه به ستون فراواني تجمعي در جدول فراواني، كلاسي را كه چندك در آن قرار دارد مشخص مي‌كنيم. براي اين كار np را محاسبه مي‌كنيم. چون طبقه سوم بلافاصله بعد از 5/12 آمده است، بنابراين طبقه سوم (95-1-75/1) به عنوان چندك مرتبه 25/0 انتخاب مي‌كنيم.


Fi fi xi كلاس
4 4 1.45 1.35-1.55
10 6 1.65 1.55-1.75
22 12 1.85 1.75-1.95
31 9 2.05 1.95-2.15
39 8 2.25 2.15-2.35
45 6 45.2 2.35-2.55
47 2 2.65 2.55-2.75
50 3 2.85 2.75-2.95
-- 50 -- Sum
مقايسه معيارهاي مركزي
داده پرت
داده‌اي كه با ساير داده‌هاي ديگر اختلاف زيادي داشته باشد، داده پرت ناميده مي‌شود. در اين حالت بايستي شاخص مركزي مناسبي براي داده‌ها انتخاب و محاسبه شود.
مثال: داده‌هاي زير در خصوص تعداد ماموريت كارمندان يك اداره است. ميانگين و ميانه را محاسبه كرده و بيان كنيد كدام شاخص مركزي ماموريت داده‌ها را بهتر نشان دهد.
90 15 14 13 13 12 11 9 7 7 5 3 2 2 1
حل. محاسبه ميانگين:

محاسبه ميانه:
چون داده‌ها به صورت صعودي مرتب شده‌اند و تعداد آنها (n) فرد است، بنابراين ميانه است. در نتيجه ميانه است. حال وضعيت مكاني داده پرت، ميانگين و ميانه را در داده‌ها كه به صورت زير است، درنظر مي‌گيريم.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید