مقاله در مورد تعاریف و تنظیم داده های آماری

word قابل ویرایش
62 صفحه
12700 تومان
127,000 ریال – خرید و دانلود

تعاریف و تنظیم داده های آماری

۱- تعاریف و توزیعهای آماری
۱-۱- تعریف علم آمار :
قبل از آنکه علم آمار تعریف گردد لازم است کمی راجع به تاریخچه آن سخن به میان بیاید تاریخچه علم آماررا می توان از بدو تشکیل دولتها آغاز کرد ، زیرا کلمه آمار Statusticesاز کلمه State به معنی دولت گرفته شده است . دولتهای اولیه نیز برای پی بردن به سلطه و قلمروخود احتیاج به آن داشتند . البته در آن زمان منظور از آمار ارقام و اطلاعات مورد نیاز دولتها برای گرفتن مالیات و سربازی و سایر امور مربوطه به کشورداری و سیاست بوده است .

از چند هزار سال قبل از مسیح در کشورهای مصر و چین و هندوستان قدیم سرشماری نفوس و همچنین اندازه میزان – دارائی تحت نفوذ دولتها انجام گردیده است و یا اینکه اغلب به طور ناقص انجام گردیده است ، با این حال همین شمارشهای ابتدائی پایه و اساس آمار امروزی را بنیان نهاده است ولی تقریباً در نیم قرن اخیر همراه با سایر علوم ، علم آمار نیز سیر صعودی را پیموده و گاهی پیشتاز و پیش قراول بعضی از علوم بوده است ، که با استفاده از آن بود که اغلب علوم چند برابر سرعت سیر عادی خود را گرفتند ، زیرا روشها و فنونی که برای تحقیقات علمی ضروری هستند از علم آمار بدست می‌آید ، بخصوص در علوم فیزیکی و زیست شناسی و اجتماعی و اقتصادی بکار برده می شود . ناگفته نماند گاه ممکن است که یک روش معین تنها به منظور استفاده در یک رشته خاص پژوهش علمی طرح ریزی شده باشد . این بدان معنی نیست که در آن رشته بخصوص آمار کاربرد زیادی دارد .
از آنجائیکه علم آمار ریشه و علایقش به کلیه علوم بشری رسیده است ، امروزه در تمامی دانشگاههای جهان در اکثر رشته های مختلف دانشگاهی اعم از رشته های پزشکی ، فنی ، کشاورزی و برنامه ریزی و… تدریس می شود . برای آنکه هدف این درس بهتر معلوم شود ، لازم است بدواً علم آمار را تعریف نمائیم .
حال چند تعریف را از بین کلیه تعاریف که جامع تر به نظر می آید بیان می کنیم . لازم به تذکر است که برای علم آمار تعاریف زیادی شده است .
– آمار علمی است که خواص جامعه را مورد بررسی قرار می دهد .
– آمار علمی است که مشخصات جامعه ها را به صورت کمی ولی بادر نظراوضاع کیفی آنها مورد بررسی قرار میدهد .
– آمار علمی است که اصول وروش جمع آوری اطلاعات آماری ، نمایش دادن آنها ، تجزیه و تحلیل و استنتاج آماری را مورد بحث قرار می‌دهد .

 

۴-۳- واریانس ۱
در میانگین قدر مطلق انحرافات برای اینکه انحرافات مثبت و منفی یکدیگر را خنثی نکنند آن را به صورت قدر مطلق بیان کردیم . این منظور از راه مجذور کردن انحرافات نیز ممکن بود تا فرمول از حالت جبری خارج نشود . بدین طریق مشخص کننده جدیدی از پراکندگی که از هر حیث بر مشخص کننده های قبلی برتری دارد بدست خواهد آمد که آن را واریانس می نامند و یا ، نمایش می دهند . ( واریانس واقعی جامعه را با نشان می دهند )

و عادتاً در این کتاب آن را با نشان خواهیم داد .

در صورتیکه داده های آماری به صورت جدول توزیع فراوانی باشد به بیان دیگر فراوانیهای مقادیر صفت یکسان نباشد ( مانند میانگین حسابی سا ده و میانگین وزنی ) فرمول واریانس به صورت زیر خواهد بود .

معمولا صورت واریانس یعنی مجموع مجذور و انحرافات از میانگین را با (۲) و به طور خلاصه با SS نمایش می دهند در نتیجه فرمول واریانس در حالت کلی به زیر خواهد بود .

چو ن محاسبه واریانس به این صورت خالی از اشکال نیست (چرا ؟) بدین جهت صورت کسر واریانس (SS) را بسط داده به صورت زیر در می آیند .

(اثبات این فرمول بعهده دانشجویان گذارده می شود )
در نتیجه فرمول کلی واریانس عبارت خواهد بو د:

وگاهی را با علامت اختصاری یعنی عامل تصحیح (Correction Factor)
نشان می دهند .

و با استفاده از نتیج می شود که
در نتیجه فرمول عبارت خواهد بود از :

و فرمول واریانس نیز به صورت زیر در می آید .

ویا

در صورتی که داده های آماری به صورت فراوانی نسبی بیان شود فرمول واریانس برابر خواهد بود

مانند تمام مشخص کننده های پیش بهتر است محاسبه آن به کمک جدول انجام گیرد . یادآور می شود که در مقایسه دو یا چند جامعه ، جامعه ایکه واریانس آن کمتر است مقادیر صف

ت متغیر مورد مطالعه آن جامعه یکنواخت تر از جامعه های دیگر می باشد .
تبصره ((در مواردی که تعداد نمونه نسبت به تعداد کل جامعه خیلی کوچک باشد واریانس را از فرمول بدست می آورند ))

۴-۳-۱- خواص واریانس

چون فرمول واریانس به صورت جبری بیان گردیده است لذا با توجه به فرمول آن می توان خواص زیر را بیان کرد و این خواص به ما کمک می کند که محاسبات را آسان تر بدست آوریم .
۱- اگر از تمامی مقادیرصفت یک مقدار ثابت a کسر یا اضافه نمائیم مقدار آن تغییر نمی کند .

۲- اگر تمام مقادیر صفت را بر مقدار ثابت تقسیم (یا ضرب ) نمائیم واریانس متغیر اصلی برابر کوچکتر ( اگر ضرب شود برابر بزرگتر) می شود .

۳- اگر کلیه فراوانیها را به یک عدد ثابت تقسیم نمائیم مقدار وایانس تغییر نمی کند ( مانند میانگین )
۴- اگر k جامعه به حجمهای و میانگین یا واریانسهای را باهم جمع نمائیم واریانس جامعه کل که از ترکیب شدن آنها تشکیل شده است مساوی است با میانگین واریانس های جامعه های جزء ، بعلاوه واریانس میانگینهای آنها در حول میانگین کل یعنی :

که در آن میانگین کل می باشد .

مثال ۱۱- واریانس توزیعهای زیر را محاسبه نموده و بیان کنید که کد ام یک یکنواخت تر است .

برای حل توزیع Y از کلیه مقادیر صفت (y) 1000 کم کرده و فراوانیها را بر ۱۰۰ تقسیم می کنیم طبق خواص واریانس مقدار آن تغییر نمی کند و در نتیجه خواهیم داشت :

چون کوچکتر از است در نتیجه جامعه x یکنواخت تر از جامعه y می باشد .
مثال ۱۲- برای جدول توزیع فراوانی زیر واریانس را محاسبه نمائید (مثل ۶ میانگین )

۴-۴- انحراف معیار ۱
یکی دیگر از مشخص کننده های پراکندگی انحراف معیار است ، این مشخص کننده بر سایر مشخص کننده های پراکندگی رجحان دارد . در پاراگراف زیر راجع به انحراف معیار سخن می رانیم .
انحراف معیار عبارت است از جذر واریانس و آن را با علامت S یا نمایش می دهند وقتی از جامعه نمونه انتخاب شود انحراف معیار نمونه ها از فرمول
محاسبه می شود .
حال بیان می کنیم که چرا این مشخص کننده بر دیگر مشخص کننده های پراکندگی برتری دارد ، اگر صف متغییر X مثلا بیانگر ساعت باشد در این صورت واریانس مساوی است با مجذور ساعت . و یا اگر گویای مزد کارگران باشد واریانس مساوی با مجذور تومان می شود . این مطلب هرگز صحیح نیست و تصور گمراه کننده ای ایجاد می کند . اینجاست که باید گفت مقیاس پارامت

ر پراکندگی باید بر حسب همان واحدی بیان گردد که مقادیر متغییر (داده های آماری ) بر حسب آن واحد اندازه گیری می شود . بدین دلیل جذر واریانس به عنوان یک مشخص کننده برتر نسبت به سایر مشخص کننده ها ی پراکندگی به کار برده می شود .
در اینجا بیان این نکته ضروری است که انحراف معیار هرگز از انحراف متوسط کوچکتر ن

می شود( ) و برای نمونه های بزرگتر اگرتوزیع مقادیر نرمال نزدیکتر باشد می توان گفت که نسبت انحراف معیار بر انحراف متوسط تقریباً برابر با ۲۵/۱ می باشد به عنوان مثال واریانس را که قبلاً محاسبه کرده بودیم ، انحراف معیار آن را محاسبه می کنیم :

لازم است گفته شود که برای این دادها میانگین قدر مطلق انحرافات نیز قبلا محاسبه گردیده است به طوری که ملاحظه می شود می باشد .

۷- ضریب همبستگی ۱
ضریب همبستگی که آن را با r و یا با p نشان می دهند شاخصی است که به منظور تعیین نوع همبستگی و میزان درجه رابطه بین صفات بکار برده می شود و مقدار آن بین یک و منهای یک نوسان می کند یعنی اگر بیان کننده این است که بین متغیر های همبستگی به طور کامل ولی معکوس وجود دارد که البته این دو حالت بندرت پیش می آید ولی اگر باشد معنی و مفهوم آن این است که بین دو متغیر مورد مطالعه مطلقاً همبستگی وجود ندارد وقتی r منفی باشد بیانگر این مطلب است که در معادله مقدار a مثبت است .( )
فرمول ضریب همبستگی عبارت است از

که آن را ضریب همبستگی پیرسون می نامند . که در آن قبلا گفته شده و نیز عبارت است از
یعنی صورت کسر واریانس x و y تواما می باشد که آن را کواریانس (Covariance) y و X می نامند . و فرمول آن عبارت است از :

البته کواریانس عبارت است از مشخص کننده ای است که برای تعیین جهت همبستگی بکار برده می شود .
با توجه به اینکه مخرج r یا P عبارت است از در نتیجه ضریب همبستگی را

می توان چنین نیز نوشت :

می توان آن را به صورت ساده زیر نشان داد :

لازم به یاد آوری است که اگر جدول مورد مطالعه ( داده های آماری ) دو بعدی باشد مجموع حاصل ضرب های یعنی چنین خواهد بود :

مجذور را ضریب تعیین می نامند که راجع به آن بعداً سخن به میان خواهد آمد .
تبصره ۱: با توجه به فرمول ضریب همبستگی پیرسون معلوم می شود که اگر مقادیر صفت متغیر x و y را تغیر دهیم میزان کمیت r تغیر نمی کند یعنی متغییر و انجام گیرد ضریب همبستگی x و y برابر با ضریب همبستگی خواهد بود .
( با استفاده از خواص واریانس )

تبصره –۲- ضریب r متقارن است ، یعنی اگر جای x و y را عوض کنیم مقدار r تغییر نمی کند .
مثال ۲ – برای داده های مثال یک مطلوب است ضریب همبستگی .
حل : برای محاسبه r ( ضریب همبستگی ) جدول زیر را تشکیل می دهیم .

در نتیجه :

مثال ۳- نتایج مشاهدات بر روی دو صفت yو x به توسط جدول زیر بیان شده است مطلوب است ضریب همبستگی

دلیل اینکه مقدار r در هر دو مثال یکی شده این است که اگر در مثال سوم تغییر انجام گیرد همان مقادیر مثال دو بدست می آید .

در نتیجه :

تمرین – ثابت کنید اگر مبداء مختصات را به نقطه انتقال دهیم معادله خط رگوسیون به صورت زیر در می آید .

۸- استاندارد کردن ضریب همبستگی –
با توجه به فرمول ضریب همبستگی ملاحظه می شود که مقدار آن از واحد های اندازه گیری x و y تبعیت می کند . حال برای این که مقدار r از واحدهای اندازه گیری xو y تبعیت نکند . مقادیر x و y را به صورت استاندارد تبدیل می کنند .

در واقع همبستگی بین x و y به همبستگی بین صفات ا

ستاندارد شده آنها تبدیل می شود . در نتیجه معادله خط رگرسیونی به صورت تبدیل می شود . بنابراین :
و یا خواهد بود .

۳ – فضای نمونه یا فضای حوادث
مجموعه تمامی نتایج ممکن ازمایش را فضای نمونه یا فضا

ی حوادث می نامند . برای مثال یک تاس را می ریزیم ممکن است رویه یک یا دو …یا شش بیاید . مجموعه که تمام نتایج ممکن این تجربه را نشان می دهد به نام فضای نمونه ای ای آزمایش نامیده می شود هر کدام از عضوهای مجموعه S را به نام یک نقطه از فضای نمونه ای می نامند .
و یا اگر دو تاس را بریزیم فضای نمونه ای این آزمایش عبارت است از که در آن .
تمرین : یک سکه را سه بار پرتاب می کنیم ، مطلوب است فضای نمونه ای این آزمایش .

۴-فراوانی مطلق و نسبی
از آنجا که ارتباط نزدیک بین احتمال یک حادثه با فراوانی نسبی آن در یک سری آرمایش که تعداد آنها به اندازه کافی زیاد باشد برقرار است لذا بار دیگر فراوانی نسبی یک حادثه را بازگو می نمائیم .
مقدار مشاهدات در یک آزمایش را فراوانی مطلق می نامند مثلا اگر یک سکه n بار ترپات شود بارشیر بیاید آنگاه را فراوانی مطلق و را فراونی نسبی حادثه می نامند و به صورت نشان می دهند می دانیم که همیشه بر قرار است و در حالتی که است که باشد و همچنین در صورتی که صادق است باشد یعنی حادثه A وقوع نیابد .

۵-تعریف احتمال برمبنای فراوانی نسبی
فرض کنیم هریک از دانشجویان کلاس یک سکه پرتاب می کنند اگردانشجوی اولی بار و دومی و سومی بارو … همین طور I ام بار سکه ای را پرتاب کنند ، اگر تعداد رویه شیر آمدن به ترتیب برای دانشجوی اولی ، دومی سومی و…
و برای بار رخ دهد آنگاه فراوانی نسبی شیر آمدن در پرتاب سکه برای هریک از دانشجویان برابر با :
می باشد .
اگر به جای n ها عدد گذارده شود ملاحظه می شود که با بزرگ شدن n فراوانیهای نسبی به عدد ۵/۰ نزدیکتر می شوند .
با توجه به مطالب بالامی توان گفت کمیت ثابت که در حول آن فراوانی نسبی حادثه در سری آزمایشهای زیاد گرد هم می آید به عنوان اندازه اسکان وقوع حادثه قبول می شود ، احتمال آن حادثه نامیده می شود و آن را با یا نمایش می دهند در عمل به عنوان مقدار تقریبی احتمال حادثه تصادفی ، فراوانی نسبی آن حادثه در آزمایش های با n بزرگ قبول می شود یعنی همواره

البته طبق قانون اعداد بزرگ که برنولی اثبات کرده

یعنی احتمال اینکه اختلاف فراوانی نسبی حادثه A ، از احتمال آن حادثه کوچکتر از باشد برابر با یک است . این مسئله به نام قانون اعداد بزرگ معروف است که آن را اولین بار برنولی طرح کرد . این قانون می گوید :
اگر تعداد آزمایشها را زیاد به سمت بینهایت میل دهیم فراوانی نسبی نیز به سمت احتمال وقوع حادثه میل خواهد کرد .

۶- تعریف کلاسیک احتمال
احتمال یک حادثه عددی است که اندازه اسکان آن حادثه را نشان می دهد و آن را به طور کلاسیک به طریق زیر تعیین می کنند .
اگر نتایج یک آزمایش بتواند کلا به n حالت هم احتمال ( یعنی لحاظ وقوع حادثه هیچ گونه امتیازی به هم نداشته باشند ) و ناسازگار ( مانعت الجمع یعنی با وقوع یکی

از آنها وقوع حالات دیگر امکان پذیر نباشد ) واقع شود و m حالت آن برای حادثه معین A مساعد باشد احتمال وقوع حادثه A کسری است برابر با به عبارت ساده تر نسبت حالات مساعد برحالات ممکنه را احتمال می نامند.

 

نظور از کل حالات ممکنه عبارت است از مجموعه حوادث در یک آزمایش که دو بدو ناسازگار و هم احتمال باشند با توجه به تعریف احتمال می توان گفت که شمردن حالتهای ممکن و مساعد مهمترین قسمت حل مسائل احتمالات است .
مثال ۱- یک تاس بازی کاملا منظم و همگن را می ریزیم احتمال آمدن رویه پنج چقدر است ؟
حل : موقع ریختن تاس تعداد کل حالات ممکن ۶ است که هم احتمال و ضمناً ناسازگارند زیرا موقع ریختن تاس دو یا چند روی آن نمی توانند باهم بیایند . از این ۶ حالت یک حالت مساعد برای وقوع حادثه فوق وجود دارد پس احتمال این حادثه مساوی است با
مثال ۲ – دو تاس بازی را باهم می ریزیم احتمال اینکه لااقل روی یکی از آنها پنج بیاید چیست ؟
حل : تعداد کل حالات ممکن مساوی است با ۳۶ زیرا هر روی یکی از تاس های باهر کدام از ۶ روی تاس دیگر می تواند بیاید . پس تعداد کل حالات مساوی است با ۳۶=۶*۶ این حالات هم احتمال و ناسازگارند . حال برای شمارش تعداد حالات مساعد چنین استدلال می کنیم :
رویه پنج یکی از تاس ها می تواند با هر کدام از ۶ رویه تاس دومی بیاید در این صورت ۶ حالت پیش می آید که روی یکی از تاس ها پنج بیاید ، به همین طریق روی پنج تاس دومی می تواند با هر کدام از شش رویه تاس اولی بیاید پس در اینجا نیز شش حالت پیش می آید که یکی از رویه ها پنج باشد ولی در حالتی که هر دو تاس پنج بیاید در هر دو حالت باهم برابرند بنابر این در حالت دوم تنها پنج حالت را باید در نظر گرفت ، به این ترتیب تعداد حالت مساعد برابر با ۱۱=۵+۶ خواهد شد واحتمال این حادثه یعنی اینکه لااقل روی یکی از تاس ها پنج باشد مساوی است با
به طوری که ملاحظه می شود برای محاسبه احتمال می باید دقیقاً تعداد حالات ممکن و حالات مساعد را شمرد ، همچنین می باید هم احتمال بودن و ناسازگار بودن حالات را در نظر گرفت .
باید متذکر شد که گاهی تعدادکل نتایج آزمایش (کل حالات ممکنه ) و تعداد نتایج مساعد بر حادثه A را بسادگی نمی توان تعیین کرد ولی می توان نسبت آ“ها را بدست آورد .

۷- قضایای مربوط به احتمال
۱- احتمال کمیت غیر منفی است .
۲- احتمال حادثه یقین (I) مساوی است با یک
۳- احتمال حادثه غیر ممکن (O) مساوی است با صفر
۴- برای هر حادثه دلخواه A رابطه بر قرار است .
۵- اگر حادثه A حادثه B را ملزم کند یعنی آنگاه رابطه بر قرار خواهد بود .
۶- اگر حوادث Aو B هم ارز باشند آنگاه احتمال های آنها مساوی خواهند بود .

۷- مجموع احتمال وقوع حادثه A و عدم وقوع حادثه A یعنی مساوی است با یک

۸- قضیه حاصل جمع احتمالات – اگر حادثه A به S حالت تجزیه گردد .
یعنی :

ویا

آنگاه احتمال حادثه A مساوی خواهد بود با حاصل جمع احتمال ها ی حوادث

یعنی :

این قضیه در صورتی صادق است که حوادث ناسازگار باشند ، در مورد سازگار بودن حوادث بعداً سخن خواهد رفت .
مثال ۳ – در یک کیسه ۵ مهره سفید و ۴ مهر ه سیاه و ۳ مهره قرمز و ۶ مهره آبی است یک مهره به طور تصادفی از آن خارج می کنیم احتمال اینکه مهره انتخابی رنگی باشد ( سفید نباشد ) چقدر است .
حل – سیاه ، قرمز ، و آبی بودن را به ترتیب می نامیم و با استفاده از قضیه حاصل جمع خواهیم داشت :

مثال ۴ – دهکده ای از دو قسمت علیا و سفلی

این فقط قسمتی از متن مقاله است . جهت دریافت کل متن مقاله ، لطفا آن را خریداری نمایید
word قابل ویرایش - قیمت 12700 تومان در 62 صفحه
127,000 ریال – خرید و دانلود
سایر مقالات موجود در این موضوع
دیدگاه خود را مطرح فرمایید . وظیفه ماست که به سوالات شما پاسخ دهیم

پاسخ دیدگاه شما ایمیل خواهد شد