دانلود مقاله کاربرد آمار در علوم رفتاری همراه با دستورات SPSS و نحوه ی تفسیر خروجی ها

word قابل ویرایش
426 صفحه
30000 تومان
300,000 ریال – خرید و دانلود

کاربرد آمار در علوم رفتاری همراه با دستورات SPSS و نحوه ی تفسیر خروجی هاکاربرد آمار در علوم رفتاری همراه با دستورات SPSS و نحوه ی تفسیر خروجی ها

SPSS  آشنایی با ۱ـ۱ ـ نحوه ی ورود به: SPSS قبل از آشنایی با محیط SPSS و نحوه ی ورود به محیط آن بهتر است با محیط ویندوز آشنا شویم . ویندوز دارای یک محیط گرافیکی به نام میزکار   است ،که از قسمت های متفاوتی تشکیل شده است .این قسمت ها عبارتند از :۱ـ نمادهای گرافیکی یا آیکون   :آیکونها تصاویر کوچکی هستند که هریک از تصاویر با کاربردهای آن متناسب

است . کاربردی که هرآیکون می تواند داشته باشد عبارتند از :  یکی اجرای یک برنامه و دیگری باز کردن پنجره .۲ـ نوار کار   : نوار کار ، خود از قسمت های زیر تشکیل شده است :الف ـ نوار ابزار   ب ـ برنامه های در حال اجرا : ویندوز طوری طراحی شده است که در آن واحد می توان چند برنامه را در محیط ویندوز بازکرد . وقتی یک برنامه در ویندوز اجرا می شود ، در قسمت نوار کار کلید های کوچکی که نشان دهنده ی برنامه فعال می باشد ، قابل مشاهده است . به این قسمت از نوار کار که برنامه ی فعال را نشان می دهد ، برنامه ی درحال اجرا گفته می شود . ج ـ سینی نوار ابزار   : سینی نوار ابزار شامل : ساعت ، تقویم ، صدا و قسمت های دیگر  می باشد . دـ دکمه شروع    : کاربردهایی که این دکمه می تواند داشته باشد عبارتند از : باز کردن پنجره ها ، بکارگیری ابزار و محیط های کمکی ویندوز و خاموش کردن کامپیوتر . میزکار و قسمت های مختلف آن در شکل ۱ـ۱ ارائه شده است . 

 

                                                                                                                                                                                                  آیکون 
                                                                                نوار ابزارسینی نوار ابزار برنامه ی در حال اجرا نوار ابزار دکمه ی شروع
برای وارد شدن به محیط spss دو راه وجود دارند که عبارتند از :۱ـ در پنجره ی میزکار روی آیکون spss 11.5 for windows  دوبار کلیک می کنیم تا وارد محیط spss شویم . ۲ـ راه دیگر این است که در پنجره ی میزکار ابتدا روی گزینه ی start (در قسمت گوشه نوار کار ) ، سپس روی گزینه ی programs  ( برنامه ها) کلیک می کنیم تالیستی از برنامه های موجود باز شود . در مرحله ی آخر روی گزینه ی spss 11.5 for windows کلیک می کنیم تاوارد محیط spss شویم. مراحل بالا را می توان به طور خلاصه چنین بیان کرد :                           start       programs         spss 11.5 for windows                                     ۱ـ۲ ـ پنجره های spss : spss دارای سه پنجره ی مهم است که عبارتند از :۱ـ پنجره ی صفحه ی متغیر ها ۲ـ پنجره ی صفحه ی کاربرگ برای وارد کردن داده ها ۳ـ پنجره ی نمایش خروجی برای مشاهده ی نتایج محاسبه ها ، جداول ، نمودارها و … ۱ـ۲ـ۱ ـ پنجره ی صفحه ی متغیرها : برای اینکه بتوانیم با spss کار کنیم باید هم متغیرها را تعریف کنیم و هم داده ها را در صفحه ی کاربرگ وارد کنیم . برای اینکه متغیرها را تعریف کنیم ، ابتدا روی منوی view و سپس فرمان variabels کلیک می کنیم تا پنجره ی صفحه ی متغیرها مانند شکل ۱ـ۲ ظاهر شود.

Name Type width Decimal s Label Values Missing Columns Align Measure1 Var00001 Numeric None None Right Scale2 Var00002 Numeric None None Right Scale3 Var00003 Numeric None None Right Scale4 Var00004 Numeric None None Right Scale

پنجره ی صفحه ی متغیرها دارای ده ستون است که عبارتند از :۱ـ ستون name  : در این ستون می توانیم یک نام دلخواه (البته با توجه به ماهیت متغیر ) وارد کنیم . ۲ـ ستون type    : این ستون شامل نوع متغیر است . ۳ـ ستون  width : در این ستون می توانیم تعداد اعداد صحیح متغیر را با کلیک کردن روی آنها افزایش یا کاهش دهیم . ۴ـ ستون  decimals : در این ستون می توانیم تعداد ارقام اعشار را برای یک متغیر مورد بررسی کاهش یا افزایش دهیم . ۵ـ ستون label  :  در این

ستون می توانیم برچسبی برای متغیر وارد کنیم یا ستون را خالی بگذاریم . ۶ـ ستون  values: این ستون مقادیر متغیر را نشان می دهد . برای تعریف مقادیر متغیر مراحل زیر را انجام می دهیم : روی ستون های پایین ستون values کلیک می کنیم تا پنجره ای به شکل ۱ـ۳ ظاهر شود . 

فرض کنید می خواهیم  x43 را تعریف کنیم . برای این کار مراحل زیر را انجام می دهیم :الف- ابتدا دوبار روی x43 کلیک می کنیم، یا اینکه ابتدا روی منوی data و سپس فرمان         define variable کلیک می کنیم . ب – در کادر خالی جلو variable name ، x43  را تایپ کرده ، سپس روی گزینه ی labels کلیک می کنیم . ج-  در کادر خالی جلوی variable label یک نام دلخواه با توجه به ماهیت متغیر تایپ می کنیم . به عنوان مثال ما در اینجا عنوان تحصیلات را انتخاب کرده ایم . د-  درکادر خالی جلو value کد گزینه و در کادر خالی جلوvalue label خود گزینه را تایپ کنیم. بعنوان مثال اگر داشته باشیم :بی سواد    þ ۰       ابتدایی     þ  ۱   راهنمایی   þ  ۲      متوسطه  þ  ۳   دیپلم  þ  ۴        تحصیلات دانشگاه    þ  ۵  حال اگر بخواهیم گزینه ی بی سواد را تعریف کنیم در قسمت کادر خالی جلوی value عدد صفر و در کادر خالی جلو value label عنوان بی سواد را تایپ می کنیم . ت – سپس گزینه add  را کلیک می کنیم . ﻫ – در آخر هم گزینه ی continue و سپس ok را کلیک می کنیم . ۷ـ ستون missing   : این ستون مقادیر غایب را نشان می دهد. ۸ ـ ستون columns  : این ستون عرض ستون ها را نشان می دهد . اگر بخواهید عرض ستون ها را کاهش یا افزایش دهید ، روی خط کناری هر ستون کلیک چپ کنید ، سپس نشانگر ماوس را به طرف راست یا چپ بکشید تا عرض ستون به اندازه دلخواه شود . ۹ـ ستون Align  : این ستون تراز داده ها را نشان می دهد . به سه صورت می توان تراز داده ها را نشان داد، که عبارتند از:الف ـ تراز راست  ب ـ تراز مرکز  ج ـ تراز چپ  (در spss  تراز راست از پیش تعیین شده است).۱۰ ـ ستون measure  : این ستون مقیاس اندازه گیری داده ها را نشان می دهد . این مقیاس می تواند اسمی ، ترتیبی ، فاصله ای یا نسبی باشد . ۱ـ۲ـ۲ـ پنجره ی صفحه کاربرگ   : هنگامی که به محیط spss  وارد می شویم اولین پنجره ای که ظاهر می شود پنجره ی صفحه کاربرگ است . کاری که با این پنجره می توان انجام داد این است که داده های خود را برای تحلیل باید در این پنجره وارد نمود . شکل پنجره ی صفحه ی کاربرگ و قسمت های مختلف آن در شکل ۱ـ۴ ارائه شده است. 

پنجره ی صفحه ی کاربرگ دارای قسمت های مختلفی است که این قسمت ها عبارتند از :۱ـ نوار عنوان : نوار عنوان ، نام نرم افزار و نام فایل جاری را نشان می دهد . ۲ـ نوار منو   :  در نوار منو کلماتی که هرکدام موضوع یک سری منو هستند نوشته شده است. این منوها عبارتند از : ۱ـ منو File ۲ـ منو Edit ۳ـ منو View ۴ـ منوData  ۵ـ منو Transform  ۶ـ منو Analyze  ۷ـ منوGraphs   ۸ـ منو Utilities  ۹ـ منو Window ۱۰ـ منوHelp  زیر اولین حرف هرکدام از این کلمات خطی کشیده شده است که فایده ی این خطوط این است که   می توان با استفاده از کلید ALT  و هر یک از حروفی که در زیر آنها خطی کشیده شده ، آن موضوع را انتخاب نمود . از سوی دیگر ، همچنین می توان با کلیک روی هرکدام از منوها، به محتویات آن منو دسترسی پیدا کرد . ۳ـ نوار ابزار: نو

ار ابزار شامل۱۷ دکمه است که هرکدام از این دکمه هاکاریک فرمان را انجام          می دهند .۴ـ متغیر   :  هر ستون یک متغیر محسوب می شود . نام یک متغیر باید چندین شرط داشته باشد. اولاً می بایست با حرف شروع شود، ثانیاً در انتهای آن نقطه نباشد،  ثالثاً از ۸ کاراکتر بیشتر نباشد و رابعاً نباید شامل فاصله ،  ؟  ، *  و … باشد . ۵ ـ نمونه   : هر سطر یا رکورد یک نمونه مح

سوب می شود . ۶ ـ خانه  : محل ورود داده ها خانه نامیده می شود ،که در واقع محل تلاقی یک سطر و یک ستون است. برای ورود داده ها در خانه ها، ابتدا نشانگر ماوس را در خانه مورد نظر برده، سپس برای فعال شدن خانه روی آن کلیک چپ می کنیم.در مرحله ی بعد، داده ی مورد نظر را در خانه وارد می کنیم.  حال اگر بخواهیم خانه ی بعدی در سطر را فعال کنیم یا کلید          ولی اگر بخواهیم خانه ی بعدی را در ستون فعال کنیم یا کلید                                                       را  می زنیم. ۱ـ۲ـ۳ ـ پنجره ی نمایش خروجی : پنجره ی نمایش خروجی از دو بخش تشکیل شده است که عیارتند از : ۱ـ outline pane   ۲ـ  display pane    این دو قسمت در شکل ۱ـ۵ نمایش داده شده اند .

۱ـoutline pane: این قسمت شامل نمای کلی اجزای خروجی است که شامل چندین آیکون است و هر آیکون نماینده ی بخشی از خروجی است . برای اینکه ببینیم هر آیکون نماینده ی کدام بخش ازخروجی است روی آن کلیک می کنیم. ۲ـ  display pane : در این قسمت خود خروجی نمایش داده می شود . برای کوچک یا بزرگ کردن هر کدام از بخش ها ، روی خط جداکننده دو بخش ، کلیک چپ می کنیم ، سپس نشانگر ماوس را برای کوچک یا بزرگتر کردن بخش مورد نظر به چپ یا راست می کشیم تا بخش مورد نظر به     اندازه ی دلخواه شود. ۱ـ۳ اضافه کردن یک سطر :  برای اضافه کردن یک سطر جدید در پنجره ی صفحه ی کاربرگ مراحل زیر را انجام می دهیم:۱ـ خانه ای که می خواهیم یک سطر جدید بالای آن ایجاد  شود را انتخاب می کنیم . ۲ـ منو data و سپس فرمان insert case را کلیک می کنیم . ۱ـ۴ ـ حذف یک سطر : برای حذف یک سطر در پنجره ی صفحه ی کاربرگ: مراحل زیر را انجام می دهیم :۱ـ با نشانگر ماوس ، روی شماره ی سطری که می خواهیم حذف شود کلیک می کنیم . ۲ـ منو edit و سپس فرمان clear را کلیک می کنیم  . یا اینکه کلید delete در صفحه کلید را     می زنیم .۱ـ۵ ـ اضافه کردن یک ستون : ۱ـ یکی از خانه های سمت راست مکانی را که می خواهیم یک ستون جدید در سمت چپ آن ایجاد شود را، انتخاب می کنیم . ۲ـ منو data و سپس فرمان insert variable را کلیک می کنیم . ۱ـ۶  ـ حذف کردن یک ستون : ۱ـ با نشانگر ماوس روی متغیری که می خواهیم حذف شود کلیک می کنیم . ۲ـ منو editو سپس فرمان clear را کلیک می کنیم . یا اینکه کلید deleteدر صفحه کلید را        می زنیم. ۱ـ۷ ـ مراحل ضبط اطلاعات :برای ضبط اطلاعات ، ابتدا روی منو file کلیک چپ نموده، سپس فرمان save را انتخاب می کنیم تا پنجره ی ضبط اطلاعات نمایان شود . در این پنجره در مقابل save in  کشوهایی وجود دارد ، هرکشویی را که می خواهیم اطلاعات در آن ضبط شود، انتخاب می

کنیم . سپس یک نام برای اطلاعات ، انتخاب کرده و آن نام رادر کادر خالی مقابل file name تایپ نموده و در آخر روی گزینه ی save کلیک چپ می کنیم تا اطلاعات جدید ضبط شود . ۱ـ۸ ـ چاپ اطلاعات : برای چاپ اطلاعات، ابتدا تمام یا قسمتی از اطلاعاتی را که می خواهیم چاپ شود ، انتخاب می کنیم .بعد از منو file فرمان  print   را انتخاب می کنیم تا پنجره ی چاپ شبیه شکل ۱ـ۶ ظاهر شود . 

اگر بخشی از اطلاعات را فعال کرده اید صفحات فعال شده را در قسمت page from      to

      تایپ کنید و سپس گزینه ی ok را کلیک کنید . ولی اگر تمام اطلاعات را فعال کرده اید          گزینه ی All را انتخاب و پس از آن گزینه ی ok را کلیک کنید . ۱ـ۹ ـ خروج ازspss : اگر بعد از چاپ اطلاعات بخواهیم از محیط spss خارج شویم، ابتدا منو file را انتخاب کرده، سپس فرمان exit  را کلیک می کنیم تا از محیط spss خارج و به محیط ویندوز وارد شویم . ۲ـ۱ـ تاریخچه ی آمار : استفاده از آمار به زمان های خیلی دور بر می گردد ،شاید نتوان به طور دقیق مشخص نمود که بشر از چه زمانی از آمار استفاده نموده است ، ولی می توان حدود آن را حدس زد. شاید بتوان گفت تاریخچه ی آمار به زمانی برمی گردد که قبایل ابتدایی برای اینکه از تعداد اسرا و همچنین تعداد مردان جنگی خود برای استفاده از آنها در جنگ آگاه شوند ، به شمارش آنها  می پرداختند. در دورانهای بعد ، وقتی دولتها به وجود آمدند، برای اینکه از وضع اقتصادی (برای مالیات گیری ) ، اجتماعی (برای سربازگیری ) و سایر امور مربوط به کشورداری و سیاست و … آگاهی    یابند ، دست به آمارگیری زدند و استفاده از آمار متداول گشت. از جمله کشورهایی که شاید بتوان گفت ، قبل از سایر کشورها از آمار برای مقاصد دولتشان استفاده کرده اند به هندوستان ، چین و مصر اشاره کرد . در قرن حاضر هم ، علم آمار، یاور سایر علوم شده است، زیرا فنونی که در تحقیقات علمی مورد استفاده قرار می گیرند از علم آمار بدست می آیند . ۲-۲-  تعریف آمار و انواع آن :  لغت آمار در زبان فارسی معادل واژه انگلیسی  statistics است، که از ریشه ی لاتینی state که به معنی دولت می باشد، گرفته شده است  . آمار در لغت به معنی حساب کردن و شمارش کردن است ، ولی تعریف اصطلاحی آمار متفاوت از تعریف لغوی آن است . آمار در اصطلاح عبارت است از علمی که وظایف آن عبارتند از :الف ـ اصول و فنون جمع آوری ، نمایش و گروه بندی داده ها ب ـ تجزیه و تحلیل داده ها  ج ـ توصیف ، تبیین ، نتیجه گیری و تعمیم نتایج . پس هدف آمار توصیف و استنباط است. بنابراین، علم آمار از دو بخش آمار توصیفی و آمار استنباطی تشکیل شده است.۲ـ۲ـ۱  ـ آمار توصیفی   : آمار توصیفی مجموعه روش هایی است که هدف آنها عبارت است از : توصیف اطلاعات بدست آمده ، طبقه بندی و منظم کردن داده ها، تهیه جداول ، رسم نمودار و خلاصه کردن اطلاعات. با توجه به توضیحاتی که گفته شد .    می توان گفت ، مهمترین هدف آمار توصیفی این است که داده را برای اینکه خوانا و قابل فهم شوند ، تقلیل و پالایش دهد . ۲ـ۲ـ۲ ـ آمار استنباطی    : زمانی که یک محقق می خواهد تحقیقی را انجام دهد ، هدفش این نیست که فقط اطلاعاتی درباره ی آن گروه کوچک بدست بیاورد .  بلکه می خواهد اطلاعات مورد نیاز در مورد جامعه ی آماری  را از طریق این نمونه ی آماری بدست آورد. البته در این کار کمی عدم اطمینان وجود خواهد

داشت. در آمار استنباطی بر پایه ی احتمالات ، ویژگی های یک جامعه از روی ویژگی های نمونه ی آماری استنباط می شود . به عبارت دیگر به کمک آمار استنباطی نگاه می کنیم ببینیم آیا می توانیم با اطمینان، نتایج بدست آمده از نمونه ی آماری را به کل جامعه ی آماری تعمیم دهیم یا خیر . پس کار آمار استنباطی نتیجه گیری از شواهد و تعمیم دادن اطلاعات است . ۲-۳- اصطلاحات آماری

:۲-۳-۱-جامعه ی آماری   : جامعه ی آماری، مجموعه ای از اشیا ، افراد ، اعداد و یا چیزهایی است که در یک یا چند صفت مشترک هستند. مثلاً می خواهیم در سال ۱۳۸۴ تحقیقی در زمینه ی سنجش گرایش روستاییان ۶۴ـ۱۵ ساله ی استان همدان به مهاجرت انجام دهیم . در این تحقیق همه ی روستاییان ساکن روستا در استان همدان در سال ۱۳۸۴ که ۶۴ـ ۱۵ سال سن دارند جامعه ی آماری ما را تشکیل می دهند . ۲ـ۳ـ۲ ـ نمونه ی آماری :  نمونه ی آماری، مجموعه ای از اشیا ، افراد ، اعداد یا چیزهایی است که ویژگی ها و صفات جامعه ی آماری را داراست و از جامعه ی آماری با روش های احتمال و شانس انتخاب می شوند . 
۲ـ۳ـ۳‌‌ ـ ثابت و متغیر :۲ـ۳ـ۳ـ۱ ـ ثابت   :  ثابت ویژگی هایی است که نزد افراد ، اعداد یا چیزهایی مختلف ، مقادیر آن یکسان است. مثلاً اگر محققی تعدادی دانشجو دختر را که ۲۵ سال سن دارند، بعنوان نمونه انتخاب کند، در این صورت جنس و سن ثابت نامیده می شوند .۲ـ۳ـ۳ـ۲ ـ متغیر :  متغیر کمیتی است که از یک مشاهده به مشاهده ی دیگر، از واحدی به واحد دیگر و از یک فرد به فرد دیگر، مقادیر مختلفی (حداقل دو ارزش یا دو عدد) را اختیار کند .

به عنوان مثال نمرات حاصله از آزمون آمار ، یک متغیر است چونکه این نمرات از فردی به فرددیگر مختلف است . یا مثلا‌ًَ جنسیت یک متغیر است که مقوله های آن عبارتند از : زن و مرد . ۲ـ۳ـ۴ ـ انواع متغیر : ۲ـ۳ـ۴ـ۱ ـ انواع متغیر از نظر ماهیت مقادیری که می پذیرند : ۲ـ۳ـ۴ـ۱ـ۱ ـ متغیر کیفی یا مقوله ای   : متغیر کیفی یک ویژگی حالت های گوناگونی را شامل می شود ، به این حالت های گوناگون یک ویژگی متغیر کیفی می گویند. یا به عبارت دیگر متغیری استکه نتواند ارزشهای  مثل جنسیت (زن ، مرد )،  مذهب ( مسلمان ، مسیحی ، کلیمی و … ). ما نمی توانیم متغیر کیفی را اندازه گیری کرده و با ارقام ریاضی نشان دهیم ، بنابراین باید از کد و نماد قراردادی استفاده کنیم . متغیر کیفی خود به دو دسته تقسیم می شوند : الف ـ متغیر کیفی قابل رتبه بندی   : در م

تغیر کیفی قابل رتبه بندی، می توانیم مقوله ها را رتبه بندی کنیم. مثل طبقه ی اجتماعی (بالا ، متوسط ، پایین ) .ب‌‌ـ متغیر کیفی غیر قابل رتبه بندی   : در متغیر کیفی غیر قابل  رتبه بندی نمی توانیم مقوله ها را رتبه بندی کنیم. مثل جنسیت (زن ، مرد ) ، نژاد ( سفید ، سیاه ، زرد )، گروه خونی( O , AB , B, A )، رنگ چشم (مشکی ، قهوه ای ، آبی ، سبز و … ). ۲ـ۳ـ۴ـ۱ـ۲ ـ متغیر کمی   : متغیر کمی به متغیری اطلاق می شود که بتواند مقادیر یا ارزشهای عدد گوناگونی را اختیارکند . متغیرکمی دارای واحد اندازه گیری و مبدأ اندازه گیری است و در آن      می توان برطبق قاعده ای معین عدد به ویژگی آزمودنی ها نسبت داد. مانندسن ، قد، وزن ، معدل و … متغیر کمی خود به دو دسته ی پیوسته و گسسته(جدا) تقسیم می شود : الف ـ متغیر کمی پیوسته   : متغیری است که بین هر دو مقدار متوالی آن مقادیر بی شماری (اعشاری ، کسری و … ) می توان پیدا کرد و مقادیری که بین هر دو مقدار متوالی آن وجود دارد دارای معنی و مفهوم است. مانند قد یا وزن. مثلاً بین قد ۱۷۹ و ۱۷۸ می توان مقادیر دیگری را پیدا نمود بعنوان مثال ۷/۱۷۸  یا ۲/۱۷۸  که این مقادیر دارای معنی و مفهوم هستند . ب ـ متغیر کمی گسسته   : متغیری است که بین هر دو مقدار متوالی آن نمی توان مقادیر دیگری را پیدا کرد . بعبارت دیگر مقادیری که بین دومقدار متوالی آن وجود دارد، معنی و مفهومی ندارند. مثلاً وقتی تعداد دانشجویان رشته جامعه شناسی دانشگاه فردوسی ۲۰۰ نفر باشد ، انتخاب عدد ۲/۱۹۰ یا ۷/۱۹۹ دارای هیچ معنی و مفهومی نمی باشد . ۲ـ۳ـ۴ـ۲ ـ انواع متغیرها از نظر نقش آنها در تحقیق : متغیر ها از نظر نقشی که در تحقیق دارند به پنج دسته تقسیم می شوند، که عبارتند از: ا- متغیر مستقل ۲- متغیر وابسته ۳- متغیر تعدیل کننده       ۴- متغیر کنترل ۵- متغیر مداخله گر.۲ـ۳ـ۴ـ۲ـ۱ ـ متغیر مستقل  : متغیری است که در یک تحقیق در رابطه با معلول (متغیر وابسته ) نقش علت احتمالی را دارد و نتایج و مقادیر معلول (متغیر وابسته ) را تحت تأثیر قرار می دهد . محقق از طریق متغیر مستقل به تبیین یا پیش بینیمتغیر وابسته می پردازد . متغیر مستقل به این دلیل مستقل نامیده می شود که مستقل از نتیجه است . زیرا نه به چیزی وابسته است و نه چیزی آن را تعیین می کند. متغیر مستقل خود بردو نوع است : الف ـ متغیر فعال ب ـ متغیر منسوب متغیر مستقلی که پژوهشگر با دخل و تصرف بوجود می آورد و متغیر فعال و متغیر مستقلی که نمونه ها همراه خودشان دارند و پژوهشگر بد

ون دخل و تصرف در آنها ، آنرا می سنجد ، متغیر منسوب نامیده می شود. مثل متغیر طبقه ی اجتماعی یا متغیر هوش . متغیر مستقل گاه متغیر تجربی ، اعمالی ، محرک ، درونداد و پیش بین نیز نامیده می شود .  ۲۰ـ۳ـ۴ـ۲ـ۲ ـ متغیر وابسته   : متغیری است که در یک تحقیق نقش معلول را دارد و تحت تأثیر متغیر مستقل قرار می گیرد و با تغییرات متغیر مستقل تغییر می کند . بنابراین به خاطر اینکه به متغیر های مستقل وابسته است ، متغیر وابسته نامیده می شود . متغیر واب

سته و متغیر مستقل با یکدیگر تفاوتهایی دارند که عبارتند از :۱- متغیر مستقل در تحقیق نقش علت احتمالی، ولی متغیر وابسته نقش معلول را دارد. ۲- متغیر مستقل در اختیار محقق است، بنابراین محقق  می تواند آن را دستکاری کند. ولی متغیر وابسته در اختیار محقق نیست، بنابراین او نمی تواند در متغیر وابسته دستکاری کند.۳- محقق از روی متغیر مستقل پیش بینی یا تبیین می کند، ولی متغیر وابسته مورد  پیش بینی قرار می گیرد. نکته ای که باید به آن توجه داشت این است که یک متغیر در یک تحقیق ممکن است  به عنوان متغیر مستقل عمل کند و در یک تحقیق دیگر نقش متغیر وابسته را ایفا کند . فرضیه ی روبرو را در نظر بگیرید: بین در آمد پاسخگویان و افت تحصیلی آنها رابطه وجود دارد . در این فرضیه در آمد متغیر مستقل و افت تحصیلی متغیر وابسته است . حال ممکن است در یک فرضیه ی دیگر، در آمد نقش متغیر وابسته را ایفا کند . مثلاً : بین شغل پاسخگویان ودر آمد آنها رابطه وجود دارد . متغیر وابسته گاه متغیر ملاک ، تابع یا برونداد نیز نامیده می شود . ۲ـ۳ـ۴ـ۲ـ۳ ـ متغیر تعدیل کننده  : متغیر تعدیل کننده، متغیری است که از سوی محقق انتخاب می شود ، دستکاری می شود و اندازه گیری می شود ، تا بفهمد تغییر آن موجب تغییرهمبستگی بین متغیرهای مورد بررسی می شود یا خیر. بنابراین، متغیر تعدیل کننده یک متغیر ثانویه یا یک متغیر مستقل دوم است، که ممکن است بر جهت و میزان رابطه ای که ممکن

است میان متغیرهای مستقل و متغیر وابسته وجود داشته باشد اثر می گذارد . هنگامی که رابطه ی بین متغیر مستقل و متغیر وابسته کم و بی ثبات باشد ، مثلاً برای یک زیر  مجموعه ی جامعه ی آماری (مثلاً برای مردها ) بین متغیر مستقل و متغیر وابسته رابطه وجود داشته باشد ولی برا

ی زیر مجموعه ی دیگر جامعه ی آماری                  (مثلاً برای زن ها ) بین متغیر مستقل و متغیر وابسته رابطه وجود نداشته باشد، احتمالاً نشانگر وجود متغیر تعدیل کننده در تحقیق است . مثال : محققی می خواهد رابطه ی بین یک متغیر مستقل ، مثلاً سنوات خدمت و متغیر وابسته، مث

لاً درآمد خانوار را مطالعه کند ، اما مشکوک به این است که رابطه ی بین دو متغیر درآمد خانوار و سنوات خدمت بوسیله ی متغیر دیگری ، مثلاً جنسیت تغییر می کند یا خیر .در این صورت متغیر جنسیت یک متغیر تعدیل کننده محسوب می شود. ۲ـ۳ـ۴ـ۲ـ۴  ـ متغیر کنترل   : وقتی یک محقق می خواهد تحقیقی را انجام دهد نمی خواهد یا شاید نمی تواند همزمان اثر همه متغیرها را مطالعه و بررسی کند ، بنابراین ممکن است بخواهد اثر برخی از متغیرها را خنثی کند ( ثابت نگه دارد یا تصادفی کند ). به این متغیرها، متغیر کنترل گفته می شود. مثلاًَ محققی می خواهد رابطه ی بین متغیر مستقل پایگاه اجتماعی و متغیر وابسته ی افت تحصیلی را بررسی کند ، ولی او می داند که هوش و جنسیت بر روی متغیر وابسته ی(افت تحصیلی ) تأثیر دارد ، بنابراین متغیرهای هوش و جنسیت متغیر کنترلی هستند . برای کنترل این متغیرها، محقق باید همه آزمودنی ها را مثلاً پسر انتخاب کند تا متغیر جنسیت کنترل شود و یا آزمودنی هایی را انتخاب کند که دارای هوش یکسانی باشند، تا متغیرهوش کنترل شود . سوالی که ممکن است پیش بیاید این است که ، پس بین متغیر کنترل و متغیر تعدیل کننده چه تفاوتی وجود دارد؟ در پاسخ باید گفت که محقق اثر متغیرهای تعدیل کننده را بررسی می کند ولی اثر متغیرهای کنترلی را ثابت نگه می دارد و مورد مطالعه قرار نمی دهد . متغیر کنترل گاه متغیر سابقه ، گاه متغیر طبقه بندی و گاه متغیر سازمان دهی نیز نامیده می شود . ۲ـ۳ـ۴ـ۲ـ۵ ـ متغیر مداخله گر  : متغیر مداخله گر، متغیری است ذهنی ،که قابل دیدن نیست و باید آن را از طریق رابطه ی بین متغیر مستقل و متغیر وابسته یا از رفتار فرد استنباط کرد. بنابراین، این متغیرها قابل اندازه گیری و دستکاری نیستند. اگر در تحقیقی بین متغیرهای مستقل و وابسته رابطه ی قوی مشاهده شود ، بهتر است اثر متغیرهای مداخله گر بررسی شود . ویژگی های متغیر مداخله گر عبارت اند از : ۱ـ فرضی اند. ۲ـ مستقیماً قابل مشاهده نیستند و فقط در ذهن وجود دارند .۳ـ مستقیماً قابل اندازه گیری نیستند و آنها را باید از روی رفتار استنباط کرد .۴ـ قابل کنترل نیستند . 

متغیرهایی مثل شخصیت ، از خود بیگانگی ، همبستگی گروهی ، هوش ، احساس و ادرا

ک از نوع متغیر های مداخله گر هستند . متغیر مداخله گر ،گاه متغیر مزاحم و گاه متغیر واسطه ای نیز نامیده می شود .انواع متغیر را می توان به صورت شکل ۲ـ۱ نمایش داد :

 

۲ـ۳ـ۵ ـ شاخص متقارن و نامتقارن :۲ـ۳ـ۵ـ۱ ـ شاخص متقارن   : شاخص متقارن ، شاخ

صی است که در آن هیچ فرقی نمی کند که کدام متغیر ، متغیر وابسته و کدام متغیر ، متغیر مستقل باشد . شاخصهای متقارن در متغیرهای اسمی عبارتند از : ۱ـ ضریب فی ۲ـ ضریب وی کرامر ۳ـ ضریب چوپرو ۴ـ ضریب یولس شاخص های متقارن در متغیرهای ترتیبی عبارتند از  :۱ ـ ضریب گاما ۲ـ ضریب تاوآکندال (Ta ) ۳ـ ضریب تاو بی کندال (Tb ) ۴ـ ضریب تاو سی کندال (Tc) شاخص های متقارن در متغیرهای فاصله ای هم عبارتند از :۱ـ ضریب همبستگی پیرسون  ( r ) ۲ـ ضریب تعیین دو متغیری) (r2  (این ضرایب همبستگی در فصل های بعدی توضیح داده می شوند) . ۲ـ۳ـ۵ـ۲ ـ شاخص نا متقارن   :  شاخص نامتقارن ، شاخصی است که در آن به وسیله ی متغیر مستقل ، متغیر وابسته را پیش بینی          می کنیم. شاخص های نامتقارن در متغیرهای اسمی عبارتند از :۱ـ ضریب تاوگودمن وکروسکال ۲ـ مجذوراتا) (η ۲شاخص های نامتقارن در متغیرهای ترتیبی عبارتند از :۱ـ ضریب دی سامرز ۲ـ ضریب همبستگی رواسپیرمن) (rsشاخص های نامتقارن در متغیرهای فاصله ای  عبارتند از :۱ـ ضریب های رگرسیون (B, b ) ۲ـ عرض از مبدأ (a) برخی شاخص ها نیز، هم متقارن و هم نامتقارن  هستند. این شاخص ها عبارتند از : ۱ـ ضریب لامبدا ۲ـ ضریب عدم اطمینان ۲ـ۳ـ۶ ـ آماره و پارامتر :۲ـ۳ـ۶ـ۱ ـ آماره   : آماره، اندازه های عددی است که ویژگی های نمونه ی آماری را توصیف  می کنند . در آماره تعداد افراد مورد بررسی (تعداد مشاهدات ) را با n  ، میانگین را باx  یاm  ، انحراف معیار را با s ، واریانس را با s 2  و همبستگی را با  r نشان می دهند . ۲ـ۳ـ۶ـ۲ ـ پارامتر    : پارامتر یا مقدار واقعی ، اندازه های عددی است که ویژگی های جامعه ی آماری را توصیف می کند . پارامتر ، یک ارزش و مقوله اختیار می کند، برای مثال متوسط سن دانشجویان یک دانشگاه در نمونه ی آماری که انتخاب کرده ایم یک آماره است ، ولی اگر سن تمام دانشجویان یک دانشگاه (جامعه ی آماری ) را یادداشت کنیم و میانگین آن را بگیریم ، میانگین آن را پارامتر جامعه می گویند . درپارامتر تعداد افراد مورد بررسی (تعداد مشاهدات ) را با N ، میانگین را با M ، انحراف معیار را با ۶  (سیگما ) ، واریانس را با ۶ ۲  و همبستگی را با  ρنشان می دهند . ۲ـ۳ـ۷ ـ اندازه گیری    : مشخص کردن ارزش هر متغیر بر حسب قواعد خاص ، به منظور کمی کردن آنها را اندازه گیری می گویند . مهمترین کار در هر تحقیق و پژوهش مخصوصاً در مرحله ی تجزیه و تحلیل داده ها مشخص کردن سطح اندازه گیری متغیرهاست. سطح اندازه گیری متغیرها به رابطه ی بین مقولات هر متغیر با یکدیگر سروکار دارد. بدون مشخص کردن سطح اندازه گیری متغیرها نمی توانیم اندازه ی حقیقی متغیرهای مورد بررسی را بدست آوریم واگر نتوانیم اندازه ی واقعی متغیرهای مورد بررسی را بدست آوریم ، فنون آماری کارآیی نخواهند داشت . چون که هر تکنیک آماری متناسب با سطح اندازه گیری معینی است و

نمی توان آن را با هر سطح اندازه گیری به کاربرد . اولین بار شخصی به نام استیونس(stevens ) در سال ۱۹۴۹ بحث طبقه بندی سطوح مختلف اندازه گیری رامطرح نمود. اوسطوح اندازه گیری را به چهاردسته تقسیم نمودکه عبارتند از : ۱ـ اسمی ۲ـ ترتیبی ۳ـ فاصله ای یا حدودپذیر ۴ـ نسبی یا صفرپذیر ۲ـ۳ـ۷ـ۱ ـ سطح اندازه گیری اسمی    : سطح اندازه گیری به رابطه ی بین مقولات هر متغیر با یکدیگر اشاره دارد . ساده ترین کار در هر علمی ، طبقه بندی ( classification )  است . در سطح سنجش اسمی بود یا نبود متغیر بررسی می شود. یعنی مشاهدات را برحسب اعداد، نمادها، علائم و برچسب ها طبقه بندی می کنیم . سطح اندازه گیری اسمی پائین ترین سطح اندازه گیری متغیرهاست . بعبارت دیگر پائین ترین سطح سنجش است که در آن نمی توان از کم و زیاد بودن ، کوچک و بزرگ بودن و علامت صحبت کرد، زیرا اعداد در این سطح اندازه گیری جنبه ی کیفی دارند نه کمی و برای سهولت در عمل به کار برده  می شوند . اولین کاری که برای سطح سنجش اسمی می توانیم انجام دهیم تناسب است . تناسب برای مقایسه یک توزیع فراوانی با توزیع فراوانی دیگر بکار برده می شود . پس در سطح سنجش اسمی احتیاج به تحلیل جدولی داریم . متغیرهای جنسیت (زن ، مرد ) ، رنگ چشم ( آبی ، سبز ، مشکی و … ) ، وضعیت تأهل ( مجرد ، متأهل و … ) ، مذهب ( کاتولیک ، پروتستان ، ارتدوکس و…) در سطح سنجش اسمی قرار دارند . 
۲ـ۳ـ۷ـ۲ ـ سطح اندازه گیری ترتیبی   : در سطح سنجش ترتیبی اولاً مقولات متغیر طبقه بندی شده اند و طبقات نسبت به هم مرتب شده اند ثانیاً میان مقولات آن متغیر ترتیب معنی داری وجود دارد . ولی فاصله ی دقیق بین این مقولات مشخص نیست . پس یکی از مشکلات سطح اندازه گیری

ترتیبی ، نسبی بودن فاصله ی بین مقادیر آن است . هرگاه بخواهیم شدت یا ضعف صفتی را بسنجیم از مقیاس ترتیبی استفاده می کنیم .مثلاً گویه ی زیر را در نظر بگیرید :           درآمد من کفاف مخارجم را می دهد .کاملاً موافقم   þ      موافقم  þ      بی نظرم  þ        مخالفم  þ         کاملاً مخالفم   þ    در اینجا ما می توانیم بگوییم مثلاً کاملاً موافق بیشتر از موافق است ، ولی نمی توانیم بگوییم چه قدر بیشتر است. یعنی فاصله ی بین این دو گزینه مشخص نیست . همچنین در سطح سنجش ترتیبی ما        نمی توانیم عملیات ریاضی مثل  جمع ، تفریق ، ضرب و تقسیم

انجام دهیم . متأسفانه متغیرهای اجتماعی و روانی ، عموماً در سطح سنجش ترتیبی قرار دارند و اندازه گیری این متغیرها در سطح سنجش ترتیبی صورت می گیرد و به ندرت از این سطح تجاوز می کند . متغیرهای طبقه ی اجتماعی (بالا ، متوسط ، پائین ) و گرایش سیاسی (زیاد ، متوسط ، کم ) در سطح سنجش ترتیبی قرار دارند . ۲ـ۳ـ۷ـ۳ ـ سطح اندازه گیری فاصله ای   :   در سطح سنجش فاصله ای ، علاوه بر داشتن اطلاعات مربوط به متغیرهای اسمی و ترتیبی یعنی طبقه بندی ومرتب بودن طبقات نسبت به هم ، اطلاعاتی هم در مورد تفاوت میان مقولات وجود دارد . بعبارت دیگر فاصله ی دقیق بین مقولات مشخص است . متغیرهای سن ، میزان سواد و درجه ی دما در سطح سنجش فاصله ای قرار دارند . نکته ی قابل ذکر در اینجا این است که در سطح سنجش فاصله ای صفر اختیاری یا قراردادی است . مثلاً دماسنج در اسفند ماه صفر درجه ی سانتی گراد ، در فروردین ماه ۲۰ درجه ی سانتی گراد ودر تیرماه ۴۰ درجه ی سانتی گراد را

نشان دهد، نمی توانیم قضاوت کنیم که دما در تیرماه دقیقا دوبرابر دما در فروردین ماه است یا نمی توانیم قضاوت کنیم که چون دما در اسفند ماه صفر درجه بوده ، پس این نشانه ی عدم وجود گرماست . زیرا رقم صفر به دمای انجماد آب اشاره دارد و در هیچ حالتی ، رقم صفر مبین فقدا

ن دما نیست از چهار عمل اصلی در ریاضی یعنی جمع ، تفریق ، ضرب و تقسیم در سطح سنجش فاصله ای فقط ما قادر به انجام جمع و تفریق هستیم .۲ـ۳ـ۷ـ۴ ـ سطح اندازه گیری نسبی یاکسری  :  متغیری در سطح سنجش نسبی است که اولاً مقولات آن طبقه بندی شده باشد. ثانیاً مقولات آن نسبت به هم مرتب شده باشند. ثالثاً فاصله ی بین مقولات آن برابر باشد. رابعاً دارای صفر مطلق  باشد. متغیرهای وزن ، میزان خودکشی ( صفرنفر ، یک نفر ، دونفر و… ) ، تعداد دانش آموزان کلاس ، قد افراد ، ارتفاع ساختمان (۳۰ متر ، ۵۰ متر و … ) فاصله ی روستا تا شهر   ( ۲۰ کیلومتر ، ۳۰ کیلومتر و …) و میزان در آمد در سطح سنجش نسبی هستند . در اینجا چون صفر مطلق ( صفر حقیقی ) وجود دارد ، اندازه ها دقیقاًَ برابر است . مثلاً ارتفاع یک ساختمان  ۴۰ متری دقیقاً چهار برابر یک ساختمان ۱۰ متری است . در سطح سنجش نسبی ما قادر به انجام هر چهار عمل اصلی ریاضی یعنی  جمع ، تفریق ، ضرب و تقسیم هستیم . عملیات ریاضی قابل انجام صفر حقیقی معلوم بودن  فاصله ی طبقات نسبت به هم مرتب بودن طبقات نسبت    به هم بزرگتر یا کوچکتر برابری طبقه بندی سطح اندازه گیریـــــــــــــ ندارد ندارد ندارد ندارد دارد دارد اسمیــــــــــــــ ندارد ندارد دارد دارد دارد دارد ترتیبیجمع وتفریق ندارد دارد دارد دارد دارد دارد فاصله ایجمع ،تفریق ، ضرب و تقسیم دارد دارد دارد دارد دارد دارد نسبی

 

 

عوامل مؤثر بر سطح اندازه گیری متغیر ها :  مهمترین عاملی که برای سطح اندازه گیری متغیرها تأثیر می گذارد سوالات و فرضیات تحقیق و چگونگی جمله بندی سؤالات پرسشنامه است . مثلاً اگر از پاسخگویان سوال کنیم ، سطح تحصیلات شما چیست ؟ و مقولات پاسخ های ما عبارت باشند از : ابتدایی  þ       راهنمایی þ        دبیرستان   þ           دیپلم   þ            فوق دیپلم   þ   لیسانس þ       دکترا و بالاتر  þ              تحصیلات حوزوی þسطح اندازه گیری متغیر ما اسمی خواهد بود . ولی اگر از پاسخگو سؤال کنیم ، چند کلاس سواد دارید ؟ مثلاً او بگوید ۱۲ کلاس یا ۹ کلاس ، در این صورت سطح اندازه گیری متغیر ما فاصله ای خواهد بود . حال ممکن است این سوال پیش آید که کدام سطح اندازه گیری بهتر است . در پاسخ به این سوال که کدام سطح اندازه گیری بهتر است ، باید گفت که ، هرچه سطح اندازه گیری متغیر بالاتر باشد ( بالاترین سطح سنجش در درجه اول سطح سنجش نسبی است ، در مرحله ی بعد فاصله ای، بعد ترتیبی و سپس اسمی است ) ۱- عملیات ریاضی بیشتری می توان با آن انجام داد . ۲ـ از فنون آماری پیشرفته تر و دارای اعتبار بیشتری می توان برای آن استفاده کرد. ۳ـ دست محقق برای انجام روش های تحلیل بازتر است . ۴ـ متغیری که در سطح سنجش بالاتری قرار دارد اطلاعات به مراتب بیشتری نسبت به متغیری که در سطح سنجش پایین تری قرار دارد در اختیار محقق قرار می دهد . ۵ـ متغیری که درسطح سنجش بالاتری قرار دارد می توان به سطح پایین تر تبدیل کرد و اندازه گیری کرد ، ولی عکس آن مقدور نیست . آماره های سطح سنجش اسمی را می توان برای متغیرهای در سطح سنجش بالاتر بکار برد. مثلاً برای متغیرهای سطح سنجش فاصله ای می توان از نما ، میانه و میانگین استفاده کرد ، ولی عکس آن مقدور نیست. مثلاً برای متغیر اسمی ( جنسیت ) نمی توان از  آماره های سطح سنجش فاصله ای ( مثلاً میانگین ، واریانس و… ) استفاده کرد، زیرا بی معنی است . 

۲ـ۳ـ۸ ـ قابلیت اعتماد و اعتبار : ۲ـ۳ـ۸ـ۱ ـ قابلیت اعتماد   : قابلیت اعتماد یا پایایی از سویی نشان دهنده ی دقت و ثبات و از سویی دیگر نشان دهنده ی میزان اشتباه وسیله ی اندازه گیری است . بعبارت دیگر اگر محققان دیگر همان موضوع را با همان روش بررسی کنند ، یا اینکه یک محقق در مشاهدات مختلفی که از یک موضوع دارد به نتایج مشابهی برسد ، آن آزمون دارای قابلیت اعتماد است . یعنی قابلیت اعتماد همان ثبات اندازه ها در دفعات اندازه گیری است . دامنه ی ضریب قابلیت اعتماد بین صفر تا یک متغیر است. هرچه ضریب قابلیت اعتماد به یک نزدیک تر

باشد، نشان دهنده ی دقت و ثبات وسیله اندازه گیری و به طبع آن  بالا بودن قابلیت اعتماد گویه است و هرچه این ضریب به صفر نزدیک تر باشد ، نشان دهنده ی میزان اشتباه وسیله ی اندازه گیری و پایین بودن قابلیت اعتماد گویه خوا هد بود.  حال ممکن است این سوال پیش

آید که چکار کنیم که قابلیت اعتماد گویه های پرسشنامه بالا رود برای بالا بردن قابلیت اعتماد گویه های پرسشنامه باید به نکات زیر توجه نمود : ۱ـ سوالات پرسشنامه باید روشن و واضح و به دور از هر گونه ابهام باشد.۲ـ باید بجای شاخص های یک گویه ای از شاخص های چند گویه ای استفاده نمود . دقت داشته باشید که هرچه تعداد سوالات یک آزمون بیشتر باشد ، قابلیت اعتماد آن بیشتر است. مثلاًَ آزمونی با ۱۰۰ سوال دارای قابلیت اعتماد بیشتری نسبت به آزمونی با ۵۰ سوال است . در صورتی که کیفیت و ماهیت آزمودنی ها یکسان باشد بااستفاده از فرمول زیر که توسط اسپیرمن ـ براون ارائه شده می توان رابطه ی بین قابلیت اعتماد گویه ها و طول تست را بدست آورد . 
 r tt   = قابلیت اعتماد تست اصلی                                                       n  = ضریب افزایش طول تست rttn = قابلیت اعتماد پس از n برابر شدن تعداد سوالات تست اصلی مثال : قابلیت اعتماد یک تست ۴۰ سوالی برابر با ۷۰ / . است . حال اگر تعداد سوالات را دوبرابر کنیم قابلیت اعتماد چه قدر خواهد شد ؟                                              ۸۲/ . =                                                                            اگر بخواهیم بدانیم چند سوال باید به آزمون اضافه کنیم تا قابلیت اعتماد به میزان دلخواه ما برسد از فرمول زیر استفاده می کنیم :                مثال : قابلیت اعتماد سوالات پرسشنامه ای با ۴۰ سوال برابر با ۷۰/۰ است . حال می خواهیم

قابلیت اعتماد این پرسشنامه را به ۸۵/۰ برسانیم ، چند سوال دیگرباید طرح نماییم ؟ 
                                                                باید تعداد سوالات پرسشنامه به ۸/۹۶( ۸/۹۶= ۴۲/۲× ۴۰ ) برسد تا قابلیت اعتماد این پرسشنامه به ۸۵/۰ برسد .البته باید به این نکته توجه نمود که تعداد سوالات نباید خیلی هم زیاد باشد ( برخی از محققین تعداد سوالات مناسب برای یک پرسشنامه را بین ۸۰ تا ۱۲۰ سوال ذکر کرده اند . البته تعداد سوالات به موضوع تحقیق و متغیرهای مستقل بستگی دارد ) زیرا امکان دارد پاسخگو خسته شود و تعدادی از سوالات را بدون خواندن جواب دهد یا اصلاً جواب ندهد . ۳ـ زمان انجام مصاحبه هم روی قابلیت اعتماد گویه ها مؤثر است . ۴ـ روش کدگذاری یکی دیگراز عوامل مهم در قابلیت اعتماد گویه هاست . مثلاً اگر کدگذاران متعدد به یک سوال واحد ، کدهای متفاوتی بدهند قابلیت اعتماد آن پایین می آید . ۵ـ ماهیت متغیر مورد بررسی هم ، روی قابلیت اعتماد گویه ها تأثیر دارد . شیوه های مختلفی برای محاسبه ی قابلیت اعتماد وجود دارد که مهمترین این روش ها عبارتند از :۱ـ روش دو نیمه کردن ۲ـ روش آلفای کرانباخ ۳ـ روش دوباره آزمایی ۴ـ روش کودر ـ ریچاردسون ۲ـ۳ـ۸ـ۱ـ۱ ـ روش دو نیمه کردن   : در این روش سوالات پرسشنامه را به دو نیمه ی مساوی تقسیم می کنیم. مثلاً سوالات فرد در ی

ک نیمه و سوالات زوج در نیمه ی دیگر و سپس ضریب همبستگی میان دو نیمه را محاسبه می کنیم . هرچه همبستگی دونیمه بیشتر باشد ، دقت اندازه گیری آزمون هم بیشتر است . در آخر هم با استفاده از فرمول زیر قابلیت اعتماد آزمون را محاسبه می کنیم .   ۱۱َ r   = ضریب قابلیت اعتماد در کل آزمون r11 = ضریب همبستگی بین  دونیمه ی سوالات مثال ـ پرسشنامه ای را با ۱۰۰ سوال به ۶۰ پاسخگوارائه کردیم . پس از پاسخگویی به سوالات ضریب همبستگی میان دو نیمه از سوالات پرسشنامه را محاسبه نمودیم . ضریب همبستگی بین این دو نیمه از سوالات برابر با ۸۵/۰ شد . حال قابلیت اعتماد آزمون را محاسبه کنیم . 

اجرای روش دو نیمه کردن :۱ـ ابتدا منو analyze   ، سپس فرمان scale ودر مرحله بعد فرمان Reliability analysis  را کلیک  می کنیم  . ۲ـ متغیرهای نیمه اول سوالات را مشخص کرده، به بخش Item  منتقل می کنیم . ۳ـ متغیرهای نیمه دوم سوالات را مشخص کرده، به بخش Item  بعد از متغیرهای اول منتقل می کنیم .۴ـ در کادر جلو Model گزینه یSplit-half  را کلیک می ک

نیم .  ۵ـ گزینه یstatistics   را کلیک می کنیم . ۶ـ در پنجره ی  statistics  گزینه های Item ، scale و correlations را انتخاب کرده، سپس  برروی گزینه ی continue و سپس ok کلیک می کنیم . ۲ـ۳ـ۸ـ۱ـ۲ ـ روش آلفای کرانباخ   :  آلفای کرانباخ بوسیله ی فرمول زیر محاسبه می شود . 

 

                     = ra= a 
 = مجموع واریانس های تک تک زیر مجموعه ها s2 = واریانس نمره های کل آزمون مقدار آلفای کرانباخ بین صفر تا یک متغیر است . هرچه این مقدار به یک نزدیک تر باشد قابلیت اعتماد مقیاس هم بیشتر است . آلفای کرانباخ باید حداقل ۷۰ /۰ باشد (برخی هم ملاک را ۵۰/۰ گذاشته اند ). مثال : اگر پرسشنامه ای دارای ۱۰۰ سوال و پنج زیر مجموعه سوال باشد ، بطوری که واریانس نمره های کل آزمون ۸۰ و واریانس هر زیر مجموعه به شرح زیر باشد :  ۶                      ۸                    ۴                   ۵                 ۱۰ مقدار ضریب آلفای کرانباخ چه قدر است ؟                                                                 ۷۳/ . =(          -۱  )                                                                                                                                         اجرای روش آلفای کرانباخ :۱ـ ابتدا منو analyze و سپس فرمان  scale را کلیک می کنیم . ۲ـ فرمان reliability analysis را کلیک می کنیم تا پنجره آن باز شود . ۳ـ متغیرهای مورد نظر را انتخاب کرده و سپس آنرا به بخش item   منتقل می کنیم  . ۴ـ در کادر جلو model گزینه ی Alpha را انتخاب کرده و سپس گزینه ی  statistics را کلیک  می کنیم  . ۵ـ در پنجره ی statistics  گزینه های correlations            if Item                 correlation                      deleted                                                                             deleted                                        deleted                 x1         
x2
x3
x4
x5Reliabity coefficienes  N     of  cases =45                              N  of  item =5                                   Alpha =. 839 Reliability 

تفسیر : نتایج بدست آمده نشان می دهد که ضریب آلفای کرانباخ برای همه متغیرهایی که قرار است سازه ی رضایتمندی فرد را اندازه بگیرند ۸۳/۰ است ، که نشان دهنده ی قابلیت اعتماد بالای سوالاتی است که رضایتمندی فرد را اندازه می گیرند . این ضریب به محقق می گوید می توان مطمئن بود که سوالات مطرح شده برای سنجیدن رضایتمندی فرد ، دقیق اندازه می گیرند . از آنجایی که مقدار آلفای کل کمتر از مقدار آلفای x    است می توان برای بالا بردن مقدار آلفا x  را حذف کرد . با حذف x   مقدار آلفای کل به ۹۰/ . خواهد رسید . 
۲ـ۳ـ۸ـ۱ـ۳ ـ روش دوباره آزمایی   : اساس این روش بدین صورت است که ابتدا سوالات آزمون مورد نظر توسط پاسخگویان مورد نظر پاسخ داده می شوند . سپس بعد از گذشت مدتی (حدود ۱۵ الی ۳۰ روز ) در شرایط مشابه همان سوالات توسط همان افراد پاسخ داده می شوند . در مرحله ی بعد ضریب همبستگی میان پاسخ ها را محاسبه می کنیم . این همبستگی نمایانگر قابلیت اعتماد سوالات پرسشنامه است . اگر همبستگی بالایی (حداقل ۷۰/۰ )  بین پاسخ های افراد در در دو زمان وجود داشته باشد ، نتیجه می گیریم که سوالات تحقیق دارای قابلیت اعتماد است . در اینجا چیزی را که می خواهیم بفهمیم دقت اندازه گیری است . یعنی می خواهیم بفهمیم اگر تک تک پاسخگویان را دوباره با روش مورد نظر بیازماییم دقت نتایج تکرار شده چه قدر است . روش دوباره آزمایی دارای نقاط ضعفی است که عبارتند از : ۱ـ ممکن است نتوانیم پاسخگویان قبلی را پیدا کنیم ، یا پاسخگویان حاضر به همکاری دوباره نشوند . ۲ـ ممکن است پاسخگویان از حافظه ی خود کمک گیرند  و پاسخ های قبلی خود را تکرار کنند و این باعث می شود که قابلیت اعتماد سوالات بطور کاذب خیلی بالا رود . ۳ـ روش دوباره آزمایی نیازمند زمان ، هزینه و نیروی انسانی زیادی است . 

۲ـ۳ـ۸ـ۱ـ۴ ـ روش کودرـ ریچاردسون   :کودر و ریچاردسون دوفرمول بنامهای  kR      ,  r      kR                        r برای محاسبه قابلیت اعتماد سوالات پرسشنامه ارائه نمودند . 
الف ـ محاسبه ی قابلیت اعتماد با استفاده از فرمول     kR : p= نسبت افرادی که به هرسوال پاسخ صحیح داده اند (نسبت پاسخ های مثبت ) .q = نسبت افرادی که به هر سوال پاسخ های غلط داده اند (نسبت پاسخ های منفی ) .s2= واریانس کل سوالات n= تعداد سوالات آزمون از این فرمول هنگامی می توان برای محاسبه ی قابلیت اعتمادسوالات استفاده نمود که نمره گذاری سوالات بصورت صفر ویک (یعنی پاسخ درست نمره ی یک وپاسخ غلط نمره ی صفر ) باشد . ب ـ محاسبه قابلیت اعتماد با استفاده از فرمول         kR : 

n= تعداد سوالات آزمون  = میانگین سوالات s2= واریانس کل سوالات از این فرمول هنگامی می توان استفاده کرد که، اولاًواریانس نمرات کل و میانگین نمرات و تعداد سوالات را داشته باشیم . ثانیاً درجه ی دشواری سوالات یکسان باشد . ثا لثاً نمره گذاری سوالات به صورت صفر و یک باشد . مثال ـ پرسشنامه ای با ۵۰ سوال را به تعدادی از آزمودنی ها ارائه نمودیم که نتایج آن در زیر آورده شده است .ضریب قابلیت اعتماداین پرسشنامه رامحاسبه کنید . 
    x =  ۴     σ ۲=  ۸      

سوالات برخی از آزمونها درسطح سنجش اسمی (بلی/خیر،درست /غلط و …) نیست بلکه درسطح سنجش ترتیبی است. برای چنین آزمون هایی کرانباخ با استفاده از فرمول کودر و ریچاردسون برای 
محاسبه ی قابلیت اعتماد فرمول زیر را ارائه نموده است :     = واریانس کل سوالات ۲ـ۳ـ۸ـ۲ ـ اعتبار   : اعتبار  به معنی این است که آیا روش یا وسیله ی اندازه گیری که برای سنجش موضوع انتخاب شده مناسب است و آیا موضوع را بخوبی می سنجد یا خیر. به عبارت دیگر ما همان چیزی را می سنجیم که قصد سنجش آن را داریم یا چیز دیگ

ری را می سنجیم . بطورکلی می توان اعتبار را به دو دسته تقسیم نمود که عبارتند از : الف- اعتبار درونی ب – اعتبار بیرونی 

۲ـ۳ـ۸ـ۲ـ۱ ـ اعتباردرونی   یااعتبارمنطقی  : اعتبار درونی بیانگر میزان کنترل متغیرهای ناخواسته  یا میزان دقت یافته های تحقیق است. هرچه در یک تحقیق متغیرهای ناخواسته ی کمتری وجود داشته باشد و تغییرات متغیروابسته ناشی از متغیرهای مستقل باشند اعتبار درونی یافته های تحقیق بیشتر است . اعتبار درونی خود شامل اعتبار محتوایی ، اعتبار سازه ای و اعتبار تجربی می باشد .   الف  ـ اعتبارمحتوایی   : «اعتبار محتوایی معرف بودن یا کفایت نمونه گیری محتوای ( ماده ، مطلب ، موضوع ) وسیله ی اندازه گیری است . معتبرسازی محتوایی درپاسخ به این پرسش است که آیا مواد یامحتوای  این وسیله ی اندازه گیری معرف محتوی یا مجموعه خصوصیات مورد اندازه گیری     است .»    برای اینکه محقق اعتبار محتوایی پرسشنامه (یا مصاحبه ) راتأمین کند باید سوالات رابراساس اهداف و فرضیات تحقیق مطرح نماید . اعتبارمحتوایی خود شامل اعتبار صوری و اعتبار نمونه گیری می شود . اعتبارصوری   : در اعتبار صوری محقق بطورذهنی ارزیابی می کند وسیله ی اندازه گیری بکاررفته شده چه قدر آن چیزی را که فکر می کرده ، اندازه گیری می کند . اعتبار نمونه گیری  :  اعتبار نمونه گیری عبارت است از اینکه آیا معرف های انتخاب شده توسط محقق ، مفهوم مورد نظر را دقیقاًًَ بررسی می کند یا خیر . ب ـ اعتبار سازه ای    : سازه ها مفاهیمی فرضی اند که از نظریات استنباط می شوند ولی مدعی وصف دقیق واقعیت های مشاهده پذیر نیستند . اعتبار سازه ای هم عبارت است از اینکه آزمون مورد نظر به چه چیزی دلالت می کند و تا چه اندازه صفت مورد نظر را اندازه می گیرد . برای اعتبار سازه ای روش های متعددی وجود دارد که عبارتند از:  ۱ـ همبستگی با سایر آزمون های دارای اعتبار ۲ـ همخوانی درونی ۳ـ تحلیل عامل ۱ـ همبستگی با سایر آزمون های دارای اعتبار : اگر آزمون مورد نظر محقق با آزمونهای

معتبر دیگر دارای همبستگی بالایی باشد پی می بریم که این آزمون  برای سنجش و اندازه گیری سازه ی مورد نظر محقق مناسب خواهد بود . به این نوع اعتبار ، اعتبارهمگرا   می گویند . ۲ـ همخوانی درونی :  در این روش محقق ضریب همبستگی هر سوال با کل تست را محاسبه   می کند .۳ـ تحلیل عامل   : تحلیل عامل روشی است که به کمک آن و با توجه به متغیر های م

ورد بررسی و پاسخ های آزمودنیها ، زیر بنای متغیروابسته و ماهیت عوامل حاصله را شناسایی می کنیم . به عبارت دیگر تحلیل عامل روشی است که با کمک آن بررسی می کنیم که آیا می توان با متغیرهای اساسی کمتری (عاملها ) به تبیین موضوع مورد بررسی پرداخت.؟  پس کار تحلیل عامل کاهش تعداد زیادی متغیر به تعداد کمی متغیر اساسی است . مراحل تحلیل عامل : تحلیل عامل دارای چهار مرحله است که عبارتند از : الف ـ انتخاب متغیرهایی که باید تحلیل شوند و تهیه ماتریس همبستگی : هنگامی که می خواهیم متغیرهایی را برای تحلیل انتخاب کنیم ، باید به دو نکته بسیار مهم توجه داشته باشیم . اول اینکه نباید متغیری علت متغیر دیگر باشد ، یعنی رابطه ی بین هیچ کدام از متغیرها نباید علّی باشد . دوم اینکه متغیرها باید با همدیگر همبستگی قابل قبولی (حداقل ۳۰ /۰  ) داشته باشند تا در تحلیل باقی بمانند ، زیرا در تحلیل عاملی هدف این است که چند متغیر با هم ترکیب شوند و یک عامل ساخته شود . اگر متغیری با متغیرهای دیگر همبستگی قابل قبولی (حداقل ۳۰/۰) نداشته باشد باید آن را از ماتریس همبستگی حذف کرد . همچنین اگر متغیرهایی بایکدیگر همبستگی خیلی بالایی داشته باشند ، آنها نیز باید کنار گذاشته شوند . راههای مختلفی برای اینکه ببینیم مجموعه ای از متغیرها در ماتریس همبستگی برای تحلیل عامل مناسب هستند یا خیر وجود دارد . یکی از راهها استفاده از آماره ی   KMO   است . مقدار این آماره نباید کمتر از ۷۰ /۰ باشد ( البته برخی از صاحبنظران مقدار بالای ۵۰/۰ را نیز با کمی احتیاط کافی دانسته اند ) . اگر مقداراین آماره بیشتر از ۷۰/۰ باشد نتیجه می گیریم که همبستگی های موجود برای تحلیل عامل بسیار مناسب است . بعد از حذف متغیرهای اضافی هنگامی که بخواهیم ماتریس همبستگی را تهیه کنیم ، باید عددی را در قطر اصلی ماتریس قرار دهیم این عدد می تواند عددیک یا عدد صفر یا عددی بین صفر تا یک باشد . به این عدد اشتراک  می گویند . اشتراک همان واریانس مشترک بین هر متغیر و عامل هاست . برای بدست آوردن

ضریب اشتراک باید همبستگی بین هرکدام از متغیرها در عاملها را به توان دو رساند و سپس با هم جمع نمود . مثلاً در جدول ۲ـ۲ ضریب اشتراک برای متغیر معدل دبیرستان عبارت است از :   ۵۳ / . = (۱۵/ . ) +( ۱۴/ . ) + ( ۷۰/ . ) اشتراک را با h نشان می دهند ومقدار آن بین ۰ تا ۱ در نوسان است . هرچه این ضریب به عدد یک نزدیکتر شود ، نشانگر این است که عامل های انتخاب شده واریانس متغیر مورد نظر را بیشتر تبیین        می کند . وقتی ضریب اشتراک صفر باشد ، بدین معنی است که هیچ مقداری از واریانس متغیر مورد نظر، توسط عامل های مشترک تبیین نمی شود . ووقتی ضریب اشتراک یک باشد ، بدین معنی است که عامل های مشترک، همه واریانس مت

غیر مورد نظر را تبیین می کنند . در اینجا باید به یک نکته توجه نمود و آن این است که متغیری که روی تمام عامل ها بار داشته باشد ضریب اشتراک آن پایین می آید . ب ـ استخراج عامل ها : « عامل ، یک سازه ، یک هستی فرضی و یک متغیر نهفته است که فرض  می شود زیر بنای آزمونها ، مقیاس ها ، ماده ها ودر حقیقت تمامی انواع ابزارهای اندازه گیری به شمار می رود .»   یا به عبارت دیگر «عامل  یک متغیرفرضی است که بریک یاچند متغیر موردمشاهده تأثیر میگذارد » .بار عاملی هم همبستگی یک متغیر با یک عامل است که مقدار آن بین منفی یک تا مثبت یک در نوسان است .تعداد عامل هایی که در یک تحلیل عامل ممکن است به وجود آید ، برابر تعداد متغیرهاست . ولی این تعداد عامل کارآیی چندانی ندارد واکثر آنها بی معنی هستند . یکی از راههایی که به کمک آن می توانیم تشخیص دهیم کدامیک از عامل ها را حفظ  کنیم ، مقادیر ویژه  است . مقادیر ویژه آن مقدار از واریانس کل است که بوسیله ی  یک عامل تبیین      می شود .یا به عبارت   دیگر ، مقادیر ویژه مجموع مجذور بارهای عاملی است که مقدار واریانس تبیین شده را نشان می دهد . برای بدست آوردن مقادیر ویژه ، همبستگی هرعامل را با تک تک متغیرها به توان دو می رسانیم ، سپس با هم جمع می کنیم . مثلاً مقدار ویژه برای عامل اول در جدول ۲ـ۲ عبارت است از : 

                                      جدول  ۲-۲- متغیر های مؤثر بر پیشرفت تحصیلی متغیر عامل اول عامل دوم عامل سوم معدل دبیرستان ۷۰/۰ ۱۴/۰- ۱۵/۰طبقه ی اجتماعی ۵۰/۰ ۳۰/۰ ۱۸/۰انگیزه ی تحصیلی ۴۴/۰ ۱۹/۰ ۱۰/۰میزان ساعات مطالعه در روز ۶۰/۰ ۴۲/۰ ۲۷/

۰تعداد دانش آموزان در کلاس ۵۵/۰ ۳۸/۰ ۳۹/۰جنسیت ۳۴/۰ ۲۱/۰ ۲۵/۰تحصیلات پدرومادر ۳۰/۰ ۱۹/۰ ۱۵/۰   
۸۰/۱ = (۳۰ / . ) + ( ۳۴/ . ) + ( ۵۵/ . ) + ( ۶۰/ . ) +( ۴۴/ . ) + ( ۵۰/ . ) + ( ۷۰/ . )معمولاً مقادیر ویژه ی اولین عامل بیشتر از یک می شود . عاملی بهتر است که مقدار ویژه ی آن بیشتر باشد . باید تنها عامل هایی را نگه داریم که مقدار ویژه ی آن حداقل یک باشد . عام

ل اول ، عاملی است که بیشترین واریانس متغیر وابسته را تبیین می کند . عامل دوم ، عاملی است که بعد از عامل اول بیشترین واریانس متغیر وابسته را تبیین می کند و همین طور عامل های بعدی بعد از عامل های قبل از خود بیشترین واریانس متغیر وابسته را تبیین می کنند . این کار تا جایی ادامه می یابد که تعداد      عامل های استخراج شده با تعداد متغیرها برابر گردد . بعد از استخراج عامل ها ، نوبت به چرخش آنها می رسد . ج ـ چرخش   عامل ها : اهداف محقق در تحلیل عاملی از چرخش عبارتند از : الف ـ در استخراج اولیه ی عامل ها قبل از چرخش  مشخص نیست کدام متغیر متعلق به کدام عامل است، ولی چرخش باعث می شود که بفهمیم کدام متغیر به کدام عامل تعلق دارد . ب ـ چرخش باعث می شود ساختار عاملی ساده شود . یک ساختار ساده ساختاری است که در آن تعداد آزمون ها زیاد ، ولی تعداد عامل ها کم باشد . وقتی تعداد عامل ها کم باشد تفسیرشان آسان تر     می شود . ج ـ با چرخش پیچیدگی متغیرها کم می شود . د ـ قبل از چرخش بخوبی نمی توان معنی هر عامل را درک کرد ، ولی بعد از چرخش معنی هر عامل کاملاً قابل درک می شود . روش های متعددی برای چرخش عامل ها وجود دارد که عبارتند از :۱ـ چرخش متعامد  ۲- چرخش مایل  . چرخش متعامد، چرخش است که در آن زاویه ی بین محورها ۹۰ درجه باقی  می ماند . از مهمترین روش های چرخش متعامد می توان به چرخش اپتیمال و چرخش واریماکس اشاره کرد . چرخش مایل نیز چرخشی است که در آن هرکدام از محورها  بصورت منفرد و بدون حفظ درجه ی اولیه می چرخند . از مهمترین روش های چرخش مایل         می توان به روش ابلیمین اشاره کرد . تفاوت دیگر بین این دو روش این است که در چرخش متعامد، عامل ها با یکدیگر همبستگی ندارند ، ولی در چرخش مایل عامل ها با یکدیگر همبست

گی دارند . مایل بودن هم به همین معناست . یعنی همبستگی داشتن عامل ها با یکدیگر . در اینجا ذکر دو نکته لازم است ، اول اینکه گاهی اوقات پیش می آید که یک متغیر روی چند عامل

 باردارد . در چنین مواقعی یا باید روش چرخش را تغییر دهیم ، یا متغیررا کنار بگذاریم. دومین نکته این است که علامت بار عاملی ، فقط نوع رابطه ی بین متغیر و عامل را نشان می دهد ، نه شدت رابطه ی بین متغیر و عامل . اگر بار عاملی دارای علامت منفی باشد ، معنی آن این است که متغیر با عامل رابطه ی معکوس دارد و اگر علامت بار عاملی مثبت باشد ، نشانگر این است که متغیر و عامل با همدیگر رابطه ی مستقیم دارد .  د ـ تفسیر نتایج و ساختن مقیاسی برای

استفاده در تحلیل های بعدی: برای ساختن مقیاس باید ببینیم زیر بنای متغیر وابسته مارا چند

عامل تشکیل داده و عوامل حاصل شده دارای چه ماهیتی هستند . 
روش اجرای تحلیل عامل :۱ـ ابتدا منوی analyze و سپس فرمان data reduction  را کلیک می کنیم . ۲ـ در مرحله ی بعد فرمان  factor را کلیک می کنیم تا پنجره ی factor analysis باز شود . در این پنجره متغیرها رابه بخش variables منتقل می کنیم . ۳ـ بر روی گزینه ی descriptives کلیک می کنیم تا پنجره ی factor analysis : descriptive باز شود . در این پنجره گزینه های زیر را انتخاب  می کنیم : ( برای ارائه ی آمار توصیفی )univariate descriptive                                                  ( برای ارائه مقادیر ویژه ، اشتراکها ودرصدواریانس تبیین شده ) initial  solution                 ( برای ارائه ماتریس همبستگی ) coefficients                                                          reproduced                                                                                                   KMO and Bartlett,s  test of sphericity                                                          ۴ـ روی گزینه یcontinue کلیک  می کنیم ، تا به پنجره ی  factor analysis برگردیم . در این پنجره بر روی گزینه extraction کلیک می کنیم تا پنجره ی factor analysis : extraction  باز شود . ۵ ـ بر روی گزینه ی scree plot کلیک می کنیم ( نمودار scree برای نمایش اهمیت نسبی عامل های استخراج شده بکار می رود ) . ۶ ـ بر روی گزینه ی continue کلیک می کنیم تا به پ

نجره ی factor analysis  برگردیم . در این پنجره بر روی گزینه ی rotation کلیک می کنیم تا پنجره ی آن باز شود . ۷ ـ در پنجره ی rotation  factor analysis: بر روی روش چرخشی که مد نظر داریم کلیک  می کنیم . ۸ ـ بر روی گزینه ی continue و سپس ok کلیک می کنیم . ج ـ اعتبار تجربی  یا اعتبار عینی :  اعتبار تجربی به رابطه بین ابزار اندازه گیری ونتایج مربوط می شود . اعتبار تجربی (  که گاه اعتبار عینی ، گاه پیوسته با معیار و گاه اعتبار وابسته به ملاک نامیده می شود ) بر دو نوع است : الف ـ اعتبار همزمان ب ـ اعتبار ناهمزمان اعتبار همزمان   : « اعتبار همزمان نوعی روایی وابسته به ملاک است که از همبستگی بین نمره های آزمون و ملاک در شرایطی که

هر دو اندازه در یک زمان بدست آمده باشند، استفاده می کند . بعبارت دیگر این نوع اعتبار ، حالتی از اعتبار پیش بین می باشد که در آن به جای تعیین رابطه ی بین دو آزمون پس از یک فاصله ی زمانی ، رابطه ی بین دو آزمون بطور همزمان تعیین می شود . برای مثال ، آزمون چند وجه   ) شخسیت مینه سوتا یک آزمون تقریباً بلند شخصیت است که اغلب تا  ۶۰۰ سوال دارد . … حال فرض کنید یک پژوهشگر آزمون جدیدی برای سنجش شخصیت تهیه کرده است که نسبت به آزمون فوق کوتاه تر می باشد . او می تواند در مواردی که نمرات افراد استثنایی است برای اطمینان از  آزمون MMPI  استفاده نماید . در این حالت آزمون کوتاه یک پیشبینی کننده و MMPIبه عنوان یک ملاک دارای اعتبار همزمان می باشد . در مواردی که نتایج هر دو آزمون شبیه به یکدیگر باشد ، محقق     می تواند آزمون کوتاه را جایگزین آزمون بلند نماید . بنابراین می توان گفت یکی از اهداف تعیین اعتبار همزمان بین دو آزمون ، جایگزینی یکی به جای دیگری می باشد . بدیهی است

چنین جانشین سازی هنگامی مفید خواهد بود که بین نمرات هردو آزمون رابطه بالایی وجود داشته باشد و دیگر اینکه استفاده از آزمون جدید نسبت به آزمون قدیمی دارای مزایای قابل توجهی باشد ».       اعتبار ناهمزمان یا اعتبار پیش بین   : «اعتبار پیش بین عبارت از بررسی رابطه ی نمرا

ت و نتایج حاصل از مقیاس آزمون با عملکرد و رفتار افراد در آینده است . در این حالت این سوال وجود دارد که آیا ابزار اندازه گیری قادر است آنچه را که ادعا می کند پیش بینی کند. بعنوان مثال ، یکی از دلایل اجرای کنکور برای داوطلبان شرکت در دانشگاه ، گزینش دانشجویان در رشته هایی است که بتوانند با توجه به استعدادشان ، دوره آموزشی مورد نظر را با موفقیت طی نمایند . بنابراین اگر بین نمرات قبولی کنکور در یک رشته خاص و شاخص پیشرفت تحصیلی دانشجویان آن رشته ( که معمولا از معدل استفاده می شود ) همبستگی وجود داشته باشد می توان گفت آزمون فوق اعتبار پیش بین بالایی دارد  » عوامل مؤثر بر اعتبار درونی : ۱ـ تاریخ   : هنگامی که محققی می خواهد تحقیقی انجام دهد ، اگر در طول اجرای این تحقیق یک رویداد    مشابه ای با طرح تحقیق در حال جریان باشد ، علاوه بر متغیرهای مستقل ، این رویداد نیز بر روی متغیر وابسته تأثیر خواهد گذاشت . در نتیجه ، نتایج حاصله خدشه دار خواهد شد . بعنوان مثال محققی می خواهد در زمان حمله ی آمریکا به عراق ، نگرش مردم ایران را نسبت به دفاع از مملکت بسنجد. مطمئناً در این تحقیق علاوه بر متغیر های مستقل ، این عامل خارجی ( حمله آمریکا به عراق ) روی متغیر وابسته ( نگرش مردم ) تأثیر خواهد گذاشت . ۲ـ گزینش   :گزینش هنگامی به وجود می آید که محقق خواسته یا ناخواسته افرادی را که در یک یا چند صفت کاملا شبیه به هم اند را برای گروه آزمایش انتخاب کند . در این صورت نتایج خدشه دار می شود . ۳ـ آزمون مقدماتی   :

در خیلی از تحقیقات برای بدست آوردن برآورد واریانس جامعه و تعیین قابلیت اعتماد و اعتبار سوالات پرسشنامه قبل از انجام تحقیق اصلی ، سوالات پرسشنامه را روی تعداد معدودی از آزمودنی ها اجرا می کنند . تجربه ای که آزمودنیها از این پیش آزمون بدست     می آورند ، موجب می شود آزمودنی ها برخی پاسخ ها را در پرسشنامه اصلی تغییر دهند . ۴ ـ بازگشت آماری   : هنگامی که محقق آزمودنی هایی را که در یک صفت ( مثلاً طبقه ی اجتماعی ، هوش ) قوی یا ضعیف هستند ، در یک گروه ( مثلاً در گروه کنترل یا گروه آزمایش ) قرار می دهد ، در این صورت افرادی انتخاب میشوند که در انتهای طیف اندازه گیری قرار دارند . حال اگر محقق یک پیش آزمون و پس آزمون انجام دهد ، بعلت تمایل نمرات بسوی میانگین، عامل رگرسیون نمرات را در پس آزمون تحت تأثیر قرار می دهد . ۵ ـ رشد   : رشد به هرگونه تغییراتی اطلاق می شود که در طول اجرای یک طرح در آزمودنیها ایجاد شود، مثل تغیرات جسمانی، افزایش اطلاعات، تغیرات روانی، افزایش تجربه و. . . این عوامل بر روی اعتبار درونی تأثیر می گذارد .۶ ـ ابزار اندازه گیری   : ابزار اندازه گیری اولاً باید دارای قابلیت اعتماد و اعتبار باشد . ثانیاً این ابزار اندازه گیری در زمان اجرای طرح نباید تغییر کنند ، در غیر این صورت نتایج دچار تحریف می شوند .۷ ـ افت آزمودنی ها  : افت آزمودنی ها هنگامی بوجود می آید که تعدادی از آزمودنی ها در طول تحقیق از ادامه ی همکاری با محقق منصرف شوند و یا اینکه تعدادی از آزمودنی ها در طول تحقیق از مطالعه حذف شوند . ۸ ـ سوگیری محقق : این مسأله هنگامی به وجود می آید که محقق افکار خود را خواسته یا ناخواسته به آزمودنی ها تلقین کند ، یا اینکه محقق به خاطر ارزشگذاری اعضای جامعه نسبت به افراد یا گروه های خاص ، یا برای جلوگیری از بوجود آمدن رفتاری علیه افراد یا گروه های خاص ، به گروه کنترل در تحقیق نمره ای برابر با گروه آزمایش بدهد . ۹ ـ سرایت اعمال آزمایشی  : اگر آزمودنیها در گروه

کنترل و گروه آزمایش با هم ارتباط برقرار کنند ، از شرایط یکدیگر با خبر می شوند . در این هنگام برای اینکه برتری خود را نشان دهند سعی می کنند اعمال خود را بهتر از واقع جلوه دهند . بنابراین شرایط متغیر وابسته در گروه ها ( گروه کنترل و گروه آزمایش )‌به هم سرایت می کند ، در نتیجه تفاوت بین گروهها یا کم می شود یا اینکه از بین می رود . ۱۰ ـ استفاده از روش های آماری

نامناسب : ۱۱ ـ ابهام در جهت تأثیر علّی بین متغیرها: این مسأله هنگامی به وجود می آیدکه جهت 

تأثیر علّی بین متغیرها مشخص نباشد . مثلاً دو متغیر افت تحصیلی و فرار از مدرسه را در نظر

بگیرید مشخص نیست افت تحصیلی عامل فرار از مدرسه است ، یا فرار از مدرسه عامل افت تحصیلی     است .۲ـ۳ـ۸ـ۲ـ۲ ـ اعتبار بیرونی  :اعتبار بیرونی بااین امر سروکار دارد که نتایج  بدست آمده  قابل تعمیم به گروهی مشابه گروه مورد مطالعه یا گروهی بزرگتر از گروه مورد مطالعه هست یا خیر . ممکن است اعتبار درونی یک تحقیق در حد مطلوبی باشد ، ولی این لزوماً به این معنی نیست که این تحقیق دارای اعتبار بیرونی خوبی هم هست . اعتبار بیرونی شامل اعتبار آماری و اعتبار محیطی می باشد. الف ـ اعتبار آماری   : اعتبار آماری به نسبت حجم نمونه به حجم جامعه مربوط می شود . ب ـ اعتبار محیطی یا اکولوژیک   : به مسأله ی تجانس یا عدم تجانس جامعه آماری مربوط می شود .  عوامل مؤثربراعتباربیرونی : عواملی که اعتبار بیرونی را پایین می آورند عبارتند از :۱ـ عدم تعریف دقیق متغیر مستقل و متغیر وابسته بر روی اعتبار بیرونی تحقیق تأثیر منفی می گذارد . ۲ ـ عدم اندازه گیری دقیق متغیر وابسته اعتبار بیرونی را خدشه دار می کند . ۳ ـ اگر نمونه ی آماری نماینده ی یک جامعه ی آماری نباشد اعتبار بیرونی دچار خدشه می شود . ۴ ـ زمان : یک تحقیق ممکن است در یک زمان بخصوصی انجام پذیرفته باشد ، مثلاً بحران اقتصادی یا در زمان جنگ . بنابراین نتایج یک تحقیق در یک زمان خاص را نمی توان به زمان های دیگر تعمیم داد .۵ ـ موقعیت : نتایج یک تحقیق ممکن است در یک موقعیت دیگر کاربرد نداشته باشد . ۶ ـ استفاده از آزمونهایی که قدرت اکتشافی کمی دارند ، اعتبار بیرونی را خدشه دار می کند . ۷ ـ نقص در فرضیات بر اعتبار بیرونی تحقیق اثر منفی دارد . ۸ ـ بالا گرفتن مقدار خطا   اعتبار بیرونی تحقیق را کاهش می دهد . ۹ ـ اعتبار پایین مقیاس مورد استفاده ، بر روی اعتبار بیرونی تأثیر منفی دارد . ۱۰ـ عدم کنترل متغیرهای خارجی (مداخله گر ) نیز بر روی اعتبار بیرونی تأثیر منفی می گذا

رد . ۱۱ ـ معرف نبودن جامعه ، باعث کاهش اعتبار بیرونی تحقیق می شود .  ۱۲ ـ اثر تعاملی زمان ، نوع و دفعات اندازه گیری متغیر وابسته : «در برخی از طرح های آزمایشی ، پژوهشگر به دو یا چند اندازه گیری از متغیر وابسته در فاصله ی زمانی کوتاهی بسنده می کند . این امر می

تواند تعمیم نتایج را از نظر اعتبار برونی در طویل المدت تحت تاثیر قرار دهد  » ۱۳ ـ اثر نو بودن محیط آزمایشی : «حالت نو بودن وضعیت جدید آزمایشی ممکن است آزمودنی ها را تحت تاثیر قرار دهد . بعبارت دیگر اگر در نتیجه نهایی ، میان گروه آزمایشی و گواه تفاوتی مشاهده شود این تفاوت ممکن است بعلت نو بودن شرایط آزمایشی و اثری که بر آزمودنی ها گذارده است باشد و نه به واسطه عمل آزمایشی . بنابراین ، این امر بر اعتبار برونی اثر می گذارد . این اثر را اثر هاثورن    نیز می گویند  ».  خلاصه انواع اعتبار در شکل ۲ـ۳ ارائه شده است .

 

۲ـ۳ـ ۹ ـ آزمون های پارامتری و ناپارامتری ۲ـ۳ـ۹ـ۱ ـ آزمون های پارامتری   : آزمون های پارامتری آزمونهایی هستند که به فرض نرمال بودن توزیع جامعه استوار هستند و می توان با استفاده از آنها پارامتر های جامعه را برآورد کرد . به همین دلیل آنها را آزمون های پارامتری یا وابسته به توزیع  می نامند . آزمونهای پارامتری دارای پیش فرض هایی هستد که این پیش فرض ها عبارتند از : ۱ـ توزیع جامعه نرمال باشد یا حجم نمونه به اندازه کافی بزرگ باشد تا عدم نرمال بودن را جبران کند. ۲ـ مشاهدات استقلال داشته باشند . ۳ـ واریانس ها برابر باشند. ۴ـ متغیر مورد اندازه گیری در سطح سنجش فاصله ای یا نسبی باشد. ۵ـ مقادیر پرت در توزیع  زیاد نباشد ،  زیرا این مقادیر میانگین ودر نتیجه نتایج را شدیداً تحت تأثیر قرار خواهند داد . از آزمون های پارامتری می توان به ضریب

همبستگی پیرسون ، تحلیل واریانس            و… اشاره نمود . ۲ـ۳ـ۹ـ۲ ـ آزمون های ناپارامتری   : آزمونهای ناپارامتری ، آزمون هایی هستند که به فرض نرمال بودن توزیع جامعه متکی نیستند  ، به همین علت گاهی آزمونهای بدون توزیع یا توزیع آزاد نیز خوانده می شوند . گرچه تاریخ آمار ناپارامتری به اوایل قرن هجدهم میلادی برمی گردد ، ولی اصطلاح «ناپارامتری » برای اولین بار در سال ۱۹۴۲ در رساله ی دکترای یک آماردان به اسم ولفویتز بکار رفته است . بعد از آن یک شیمی دان به نام ویلکاکسون در سال ۱۹۴۵ و سپس آماردانی بنام من وسپس آماردان دیگری بنام

ویتنی در سال ۱۹۴۷ از آمار ناپارامتری استفاده نمودند . آزمون های ناپارامتری برای متغیرهای اسمی شامل آزمون های کی دو ، مک نمار ، فی ، یولس ، لامبدا،                 تاوگودمن

وکروسکال ، وی کرامر ، توافق پیرسون ، ضریب عدم اطمینان ، ضریب کاپای کوهن و … و برای متغیرهای ترتیبی شامل : آزمون ویلکاکسون ، من ـ ویتنی ، کروسکال – والیس ، کندال ، رواسپیرمن ، گاما ، دی سامرز و… می باشد . آزمون های ناپارامتری هنگامی بکار برده می شوند که:۱ـ متغیر مورد بررسی در سطح سنجش اسمی یا ترتیبی باشد ، یا اینکه متغیر فاصله ای باشد ولی توزیع آن در جامعه، طبیعی ( نرمال ) نباشد . ۲ـ حجم نمونه در تحقیق کوچک باشد. ۳ـ در داده ها مقادیر پرت زیاد باشد ، در این حالت استفاده از آزمون های نا پارامتری نتایج را خیلی تحت تأثیر قرار نمی دهد ،  زیرا اکثر آزمون های ناپارامتری نسبت به مقادیر پرت وچولگی مقاوم هستند زیرا از شاخص هایی مثل میانه استفاده می کنند . ۴ـ مشاهدات استقلال نداشته باشند. ۵ـ واریانس ها برابر نباشند . مقایسه ی روش های پارامتری و ناپارامتری : نقاط ضعف آزمونهای ناپارامتری در مقابل آزمون های پارامتری :۱ـ کارایی آزمون های ناپارامتری به علت اینکه بخشی از اطلاعات را نادیده می گیرند کمتر از    آزمون های پارامتری است. بعنوان مثال آزمون های ناپارامتری فقط ترتیب رتبه داده ها را بحساب می آورند ولی از مقادیر اطلاعات استفاده نمی کنند . به عنوان نمونه برای اینکه با استفاده از ضریب همبستگی اسپیرمن یا کندال به نتایج مشابه ای که با یک نمونه ی ۹۱ نفری با استفاده از ضریب همبستگی پیرسون بدست آمده برسیم ، نیاز به یک نمونه ۱۰۰ نفری هست . در جدول ۲ـ۳ کارایی آزمون های ناپارامتری در مقایسه با آزمونهای پارامتری ارائه  شده است . ۲ـ آزمون های ناپارامتری در مقایسه با آزمون های پارامتری نسبت به نابرابریها حساسیت کمتری دارند. برای جبران این حساسیت باید حجم نمونه را بالا برد . ۳ـ احتمال یافتن اختلاف های واقعی ، یعنی تفاوت هایی که در جامعه وجود دارد در آزمون های ناپارامتری کمتر از آزمون های

پارامتری است . ۴ـ آزمونهای ناپارامتری برای متغیرهای اسمی و ترتیبی که درسطح سنجش پایین تری قرار دارند بکاربرده می شوند ، ولی آزمون های پارامتری برای متغیرهای فاصله ای و نسبی که در سطح سنجش بالاتری قرار دارند بکار برده می شوند . 

 

مزایای آزمون های ناپارامتری بر آزمون های پارامتری :  ۱ـ استفاده از آزمونهای ناپارامتری راحت تر از استفاده از آزمونهای پارامتری است . ۲ـ آزمون های ناپارامتری نسبت به آزمون های پارامتری ، راحت تر فهمیده می شوند.                            ۳ـ آزمونهای ناپارامتری پیش فرضی درباره ی شکل توضیح متغیر ها ندارند و بطور کلی به فرضیات کمتری احتیاج دارند . ۴ـ آزمون های

ناپارامتری پیش فرضی درباره ی شکل توزیع متغیرها ندارند .  

کارآیی آزمون ناپارامتری در مقایسه با آزمون پارامتری معادل آن آزمون ناپارامتری آزمون پارامتری ۶۳%۹۵%۶۳% ( اگر ۶ = D + A باشد کارایی آن تا ۹۵/ . افزایش می یابد .) ۱ـ آزمون علامت ۲ـ آزمون ویلکاکسون ۳ـ آزمون مک نمار آزمون تی  با نمونه های جفت ( وابسته )
۹۵/ . ۱ـ آزمون من ـ ویتنی آزمون تی با نمونه های مستقل  ۹۵% ۱ـ آزمون کروسکاضریب همبستگی پیرسون  

 ۳-‌۱- نمونه گیری  : وقتی می خواهیم اطلاعاتی را درباره ی جامعه ی آماری جمع آوری کنیم ، دوراه پیش رو داریم :۱ ـ استفاده از روش سرشماری                  ۲ ـ استفاده از روش نمونه گیری سرشماری یعنی اندازه گیری همه افراد جامعه آماری. از روش سرشماری هنگامی استفاده می شود که جامعه ی آماری محدود و قابل شمارش باشد .ولی در جوامعی که نامحدود وغیرقابل شمارش اند، باید از روش نمونه گیری استفاده کرد . نمونه گیری یعنی درصدی از یک جامعه ی را بعنوان   نماینده ی آن جامعه انتخاب کنیم . هدفی را که در نمونه گیری دنبال می کنیم این است که از روی نمونه ی آماری پارامتر یا پارامترهای جامعه ی آماری را برآورد کنیم . حال ممکن است این سوال پیش آید که چرا نمونه گیری می کنیم و از سرشماری استفاده نمی کنیم ؟ درپاسخ باید گفت که نمونه گیری در مقایسه با روش سرشماری دارای مزایایی است که این مزایا عبارتند از : ۱ـ جمع آوری اطلاعات از تمام جامعه ی آماری زمان زیادی را می طلبد ، درحالی که با نمونه گیری در زمان صرفه جویی می شود . ۲ـ با استفاده از روش نمونه گیری امکان جمع آوری اطلاعات کامل و بیشتری درمورد جامعه ی آماری نسبت به روش سرشماری وجود دارد . ۳ـ گاهی پیش می آید که به اطلاعات نیاز فوری داریم ، در این هنگام روش نمونه گیری بر روش سرشماری برتری دارد .۴ـ استفاده از روش سرشماری به نیروی انسانی مخصوصاً نیروی انسانی متخصص زیادتری نیازمند است . درحالی که روش نمونه گیری به نیروی متخصص کمتری نیازمند است . ۵ـ در روش سرشماری به علت نیاز به نیروی انسانی متخصص و محدود بدون امکان بکارگیری نیروهای متخصص ، دقت و کیفیت کار نسبت به روش نمونه گیری کمتر است . ۶ـ استفاده از روش نمونه گیری نیازمند هزینه ی کمتری نسبت به هزینه ی سرشماری است . البته استفاده از روش نمونه گیری معایبی نیز دارد . یکی ازاین معایب این است که ، دقت نتایج بدست آمده از روش نمونه گیری، صددرصد نیست ودقت آن به دقت نمونه گیری بستگی دارد . اگر جامعه ی آماری نامتجانس باشد، نیاز به دقت بالا و استفاده از نیروی ماهر بیشتر می شود، زیرا باید نمونه هایی انتخاب شوند که معرف جامعه آماری باشند ، در غیر این صورت نتایج قابل تعمیم به جامعه آماری نخواهد بود . ۳ـ۲ ـ روش های نمونه گیری : روش های نمونه گیری به دو دسته تقسیم می شوند : ۱ ـ روش نمونه گیری احتمالی                            ۲ ـ روش نمونه گیری غیر احتمالی ۳-۲ـ۱ـ نمونه گیری غیر احتمالی   : در این روش انتخاب نمونه ها براساس قوانین احتمالات صورت نمی گیرد و نمونه ها براساس قضاوت شخصی محقق انتخاب می شوند . بنابراین تعمیم پذیری نتایج در این نوع نمونه گیری کم و نامشخص می باشد،  زیرا شانس انتخاب شدن هریک از اعضای جامعه ی آماری نامعلوم است . بنابراین از روش های نمونه گیری غیر احتمالی در موارد زیر استفاده می شود : ۱ـ هنگامی که نخواهیم نتایج نمونه را به جامعه تعمیم دهیم . ۲ـ زمانی که چارچوب نمونه گیر

ی موجود نباشد ، یا اینکه تهیه ی آن غیر ممکن باشد ، یا هزینه و زمان زیادی بطلبد . ۳ـ در هنگام انجام پیش آزمون  ، زیرا در چنین مواقعی هدف اصلاح کاستی های پرسشنام

ه ، تعیین واریانس صفت موردنظر درجامعه ی آماری برای تعیین حجم نمونه ، محاسبه ی قابلیت اعتماد گویه ها و … می باشد . نمونه گیری غیر احتمالی شامل روش نمونه گیری سهمیه ای، تصادفی، زنجیره ای و گروهی می باشد .۳ـ ۲ـ۱ـ ۱ ـ نمونه گیری سهمیه ای   : از روش نمونه گیری سهمیه ای وقتی استفاده    می شود که ساخت جامعه ی آماری مشخص باشد و تحقیق کمتر جنبه علمی داشه باشد . اساس این روش نمونه گیری بدین صورت است که ، محقق جامعه ی آماری رابه چندین طبقه تقسیم می کند . سپس سهم هر طبقه را مشخص می کند ودر مرحله ی آخر ، آن قدر از نمونه هایی که در دسترس هستند انتخاب می کند که از اندازه ی مورد نظر برای هر طبقه کامل شود . ۳ـ۲ـ۱ـ۲ـ نمونه گیری تصادفی   : در نمونه گیری تصادفی به اندازه ی حجم نمونه هر فردی از جامعه ی آماری که به طور تصادفی در دسترس بود ، بعنوان نمونه انتخاب می شود . در نمونه گیری تصادفی انتخاب نمونه ها براساس ضابطه ی کنترل شده ای صورت نمی گیرد . مثلاً هنگامی که خبرنگاران در خیابان بر طبق نظر خود با هرکسی که می خواهند مصاحبه می کنند از این روش استفاده می کنند . ۳ـ۲ـ۱ـ۳ـ نمونه گیری زنجیره ای : در این روش ابتدا محقق چند نفر را که دارای خصوصیات مورد نظر او هستند ، پیدا کرده و بعد از انجام مصاحبه یا پرکردن پرسشنامه با آنها ، ازآنها می خواهد افراد دیگری را که دارای همان خصوصیات هستند، به محقق معرفی کند . از این روش هنگامی استفاده  می شود که : الف ـ چارچوب نمونه گیری وجود نداشته باشد. ب ـ نمونه ها به آسانی قابل شناسایی نباشد ، مثل معتادان و بیماران ایدزی .ج ـ نمونه ها از یکدیگر شناخت داشته باشند و با یکدیگر در ارتباط باشند . ۱۳-۳ـ ۲ـ۱ـ۴ – نمونه گیری گروهی   : در این روش ابتدا گروه مشخصی که معرف جامعه آماری باشند تعیین می شود ،

سپس اطلاعات مورد نیاز از این گروه اخذ می گردد. در نمونه گیری هایی که به روش غیر احتمالی صورت می گیرند بعلت اینکه نمونه ها معرف جامعه مورد تحقیق نیستند ، نتایج قابلیت تعمیم کمی دارند و نمی توان با اطمینان بالایی نتایج بدست آمده را به جامعه تعمیم داد ، لذا نتایج جنبه علمی ندارند .  ۳ـ۲ـ۲ ـ نمونه گیری احتمالی    : از آنجاییکه شیوه های درست نمونه گیری ، یکی از ا

صول شیوه ی تحقیقات درست است و شرایط جامعه های آماری با یکدیگر تفاوت دارند ، محققین شیوه های گوناگونی را برای نمونه گیری احتمالی ذکر کرده اند که این شیوه ها عبارتند از :۱ـ نمونه گیری اتفاقی ساده ۲ ـ نمونه گیری طبقه ای ۳ـ نمونه گیری منظم یا سیستماتیک ۴ ـ نمونه گی

ری چندمرحله ای ۵ ـ نمونه گیری خوشه ای ۳ـ۲ـ۲ـ۱ ـ نمونه گیری اتفاقی ساده   : در نمونه گیری اتفاقی ساده برای همه ی افراد جامعه ی آماری شانس مساوی برای انتخاب شدن در نظر گرفته می شود . این روش نمونه گیری به دو صورت انجام می گیرد : الف ـ وقتی که افراد جامعه میان آنها به تعداد نمونه ی مورد نیاز انتخاب می کنیم . ب ـ وقتی که تعداد افراد جامعه آماری زیاد باشد روش بالا مشکل است ، بنابراین باید از جدول اعداد تصادفی استفاده کنیم . نمونه گیری اتفاقی ساده بر دو نوع است که عبارتند از : الف ـ با جایگزینی                        ب ـ بدون جایگزینی اگر بعد از انتخاب هر نمونه ، آن نمونه را در داخل جامعه ی آماری قرار داده و سپس نمونه ی دیگر را انتخاب کنیم ، از نمونه گیری اتفاقی با جایگزینی   استفاده کرده ایم . در این روش ممکن است یک نمونه چند بار انتخاب شود . ولی اگر بعد از انتخاب هر نمونه، آن نمونه را به داخل جامعه ی آماری بر نگردانیم، از نمونه گیری اتفاقی بدون جایگزینی  استفاده کرده ایم. وقتی می توان از روش نمونه گیری اتفاقی استفاده کردکه ، اولاً همه ی افراد جامعه ی آماری شانس مساوی برای انتخاب شدن داشته باشند . ثانیاً ، فهرست همه ی افراد جامعه ی آماری را داشته باشیم و این فهرست کامل افراد جامعه آماری اریب نباشد ، زیرا اگر این فهرست اریب باشد ، نمونه ی آماری انتخاب شده نیز اریب خواهد بود . ثالثاً ، تغییرات صفت متغیر درجامعه آماری باید کم باشد تا نمونه ای که انتخاب می شود ، معرف جامعه ی مورد مطالعه باشد . رابعاً ، جمعیت از لحاظ جغرافیایی متمرکز باشد . برای افزایش دقت نمونه گیری اتفاقی ساده دو راه وجود دارد که عبارتند از:الف ـ افزایش حجم نمونه                  ب ـ استفاده از روش نمونه گیری طبقه ای ۳ـ۲ـ۲ـ۲ـ نمونه گیری طبقه ای   : نمونه گیری طبقه ای هنگامی مناسب است که بتوانیم جامعه  آماری را نسبت به صفت مربوطه طوری تقسیم کنیم که افراد در داخل طبقات از نظر صفت مربوطه شبیه به هم باشند . یعنی واریانس صفت مورد مطالعه در داخل هر طبقه کم ، ولی بین طبقات زیاد باشد . بعبارت دیگر  نمونه گیری طبقه ای هنگامی به کار برده می شود که ، جامعه ی آماری مورد مطالعه دارای اجزاء گوناگونی باشد ، یعنی متجانس نباشد . بنابراین برای اینکه تغییرات آنها در درون گروه ها کم شود ، جامعه ی آماری را به طبقاتی که همگن تر باشد ، یعنی دارای ویژگی های مشابهی باشند

تقسیم می کنیم ، بطوری که هر طبقه همچون یک جامعه ی آماری خاص باشد . در مرحله ی بعد از هریک از طبقات تعدادی نمونه انتخاب می کنیم . مشکلی که ممکن است د

ر نمونه گیری طبقه ای بوجود آید این است که امکان دارد که  ، جمعیت طبقات با هم برابر نباشد . برای رفع این مشکل دو کار می توان انجام داد : الف ـ نسبت هر طبقه به کل جامعه ی آماری را مشخص کنیم و تعداد نمونه ای که از این طبقه انتخاب می کنیم ، به اندازه ی این نسبت باش

د . به این نوع نمونه گیری ، نمونه گیری طبقه ای   متناسب   گفته می شود . ب ـ یا اینکه به نسبت هر طبقه نسبت به کل جامعه ی آماری توجهی نکنیم و از همه ی طبقات به            یک اندازه نمونه انتخاب کنیم . در این صورت با نمونه گیری طبقه ای نامتناسب                                                     سرو کار خواهیم داشت . مثلاً وقتی که  می خواهیم در یک دانشگاه تحقیقی در زمینه ی گرایش دانشجویان نسبت به مواد مخدر انجام دهیم ، چون هر دانشکده دارای ساخت متجانسی است ، کاری که می کنیم این است که، هر دانشکده را در یک طبقه قرار می دهیم ، سپس از هریک از طبقه ها تعدادی نمونه انتخاب می کنیم . نمونه گیری طبقه ای نسبت به نمونه گیری اتفاقی ساده دارای مزایایی است . مزیتی که نمونه گیری طبقه ای بر نمونه گیری اتفاقی ساده دارد این است که ، اولاً در نمونه گیری طبقه ای نحوه ی گزینش نمونه ها ساده تر است . ثانیاً دقت آن بیشتر از روش           نمونه گیری اتفاقی ساده است ، زیرا همان طور که می دانید کل تغییرات یک متغیر شامل تغییرا ت بین طبقات و تغییرات درون طبقات می شود . در نمونه گیری طبقه ای فقط تغییرات درون طبقات در اشتباه معیار تأثیر دارد ولی تغییرات بین طبقات هیچ تأثیری در اشتباه معیار ندارد . ولی در نمونه گیری اتفاقی ساده تغییرات در درون طبقات و

تغییرات بین طبقات در اشتباه معیار تأثیر می گذارند . همچنین تفاوت نمونه گیری طبقه ای با نمونه گیری سهمیه ای این است که ، در نمونه گیری طبقه ای چارچوب نمونه گیری موجود است ، ولی در نمونه گیری سهمیه ای چارچوب نمونه گیری موجود نمی باشد . نمونه گیری طبقه ای دارای معایبی است که عبارتند از : ۱ـ در اغلب اوقات در مورد متغیری که طبقه بندی بر اساس آن انجام می دهیم اطلاعات وجود ندارد. ۲ ـ شیوه ی انجام آن مشکل است . ۳ـ وقتی ک

ه جمعیت پراکنده باشد و هیچ فهرست نمونه گیری نداشته باشیم فاقد کارآیی است . ۴ ـ برای داشتن یک نمونه ی نمایا، باید نسبت گروه های مختلف در جامعه و نمونه، تقریباً مشابه باشد، ولی به خاطر خطای نمونه گیری همیشه چنین نیست . ۳ـ۲ـ۲ـ۳ـ نمونه گیری منظم یا سیستماتیک   : نمونه گیری سیستماتیک با نمونه گیری اتفاقی ساده دارای وجه اشتراک و وجه اختلاف است . وجه اشتراک نمونه گیری سیستماتیک با نمونه گیری اتفاقی ساده این است که، اولاً در هردو باید لیست کامل افراد جامعه مورد مطالعه را داشته باشیم . ثانیاً ، در هر دو نوع نمونه گیری تغییرات صفتی که مورد مطالعه است نباید شدید باشد . وجه اختلاف آنها این است که ، اولاً در نمونه گیری اتفاقی ساده انتخاب هر عضومستقل از انتخاب سایر اعضای جامعه است ، ولی در نمونه گیری منظم عکس آن صادق است . ثانیاً ، انجام نمونه گیری اتفاقی ساده مشکل تر از انجام نمونه گیری سیستماتیک است .نکته ای که باید به آن توجه داشت این است که اگر صفتی در جامعه بصورت تناوبی توزیع شده باشد، نباید از روش نمونه گیری سیستماتیک استفاده نمود.  طریقه ی انجام نمونه گیری سیستماتیک به شرح زیر است : ۱ـ در ابتدا حجم نمونه (n) و حجم جامعه آماری  (N) را تعیین می کنیم . ۲ـ سپس فاصله ی نمونه گیری را طبق فرمول روبه رو تعیین می کنیم     مثلاً اگر حجم    جامعه ی آماری برابر با ۲۰۰۰۰ و حجم نمونه برابر با ۵۰۰ باشد ، در این صورت فاصله ی نمونه گیری عبارت خواهد بود از :    این فاصله ی نمونه گیری نشانگر این است که باید از روی اسامی جامعه ی آماری چهل تا چهل تا افراد را انتخاب کنیم . ۳ـ در مرحله سوم باید مبدأ شمارش را برای جلوگیری از دخل و تصرف در نمونه تعیین می کنیم . برای این کار ، اعداد ۱ تا ۴۰ را روی کاغذ نوشته ، سپس از میان آنها یک عددرا به صورت قرعه کشی انتخاب می کنیم ( فرض کنید عدد ۸ شود ) . ۴ ـ در مرحله ی چهارم اعداد دیگر را به اندازه ی فاصله ی نمونه گیری ، چهل تا چهل تا انتخاب می کنیم . در این صورت نمونه های ما عبارت خواهند بود از :  …                                                                          ،۱۲۸ ، ۸۸، ۴۸ ، ۸

   ۳ـ۲ـ۲ـ۴ ـ نمونه گیری خوشه ای   : هنگامی از نمونه گیری خوشه ای استفاده       می کنیم که ،  اولاً چارچوب نمونه گیری یعنی فهرست کامل جامعه ی آماری را نداشته باشیم ، یا تهیه آن هزینه و زمان زیادی بخواهد یا غیر ممکن باشد . ثانیاً ، جامعه ی آماری دارای گروه های همگن ومتجانس نباشد. ثالثاً ، جامعه ی آماری وسیع و گسترده باشد .

در روش نمونه گیری خوشه ای ابتدا از خوشه ها ودر مرحله ی بعد از واحدهای درون خوشه ها نمونه گیری می کنیم . پس واحد نمونه گیری دراین روش نمونه گیری گروهی، از اعضای جامعه ( بخش ، شهرستان ، واحد مسکونی و… ) است . در نمونه گیری خوشه ای لازم نیست حتماً تعدا

د نمونه ها در هر خوشه برابر باشند بلکه چیزی که لازم است این است که تشابه نمونه های هر خوشه بیشتر از تشابه آن نمونه ها با نمونه های دیگر در سایر خوشه ها باشد . یعنی اولاً ، واریانس هر خوشه ماکزیمم باشد . ثانیا ، تعداد نمونه ها در هر خوشه کم ولی تعداد خود خوشه ها زیاد باشد تا دقت نمونه گیری زیاد شود . ولی اگر حجم خوشه ها زیاد باشد ولی خود خوشه ها کم باشد افراد هر خوشه تشابه زیادتری با هم خواهند داشت و دقت نمونه گیری کم خواهد داشت . نمونه گیری خوشه ای با نمونه گیری طبقه ای و نمونه گیری اتفاقی ساده تفاوت هایی دارد که عبارتند از : الف ـ تفاوت نمونه گیری خوشه ای با نمونه گیری طبقه ای در این است که ، در نمونه گیری طبقه ای هر طبقه شامل گروه های متجانسی است ، ولی در نمونه گیری خوشه ای هر خوشه شامل گروه های  غیر متجانس پابرجایی است که قبلاً شکل گرفته اند . ب ـ تفاوت نمونه گیری خوشه ای و نمونه گیری اتفاقی ساده در این است که ، در نمونه گیری خوشه ای ما فهرست کامل افراد جامعه را نداریم ، در حالی که در نمونه گیری اتفاقی ساده فهرست کامل افراد جامعه را داریم . برتری که نمونه گیری خوشه ای با نمونه گیری اتفاقی ساده دارد ، یکسان بودن توزیع صفت در خوشه هاست . یعنی افراد درون خوشه ها همگن هستند و مزیتی که نمونه گی

ری اتفاقی ساده بر نمونه گیری خوشه ای دارد ، دقت آن است . یعنی دقت نمونه گیری

اتفاقی ساده بیشتر از نمونه گیری خوشه ای است ، زیرا در نمونه گیری خوشه ای واریانس ص

فت مورد نظر در درون گروهها ( خوشه ها)  معمولاً کم است . البته در نمونه گیری خوشه ای . ثالثاً ، قرارگرفتن افراد در داخل یک خوشه مستقل از هم باشد و رابعاً ،واریانس هر خوشه زیاد باشد بطوری که هر خوشه تا حد ممکن معرف کل جامعه آماری باشد و واریانس هر خوشه با خوشه های دیگر کم باشد ، دقت آن در برآورد میانگین جامعه برابر دقت نمونه گیری اتفاقی ساده بدون جایگزینی خواهد بود. بنابراین برخلاف نمونه گیری طبقه ای که باید واریانس هر طبقه کم ،

ولی واریانس بین طبقات زیاد باشد ، در نمونه گیری خوشه ای باید واریانس هر خوشه زیاد و واریانس هر خوشه با خوشه های دیگر کم باشد . نمونه گیری خوشه ای دارای معایبی است که عبارتند از : ۱ ـ به علت زیاد بودن مراحل نمونه گیری ، احتمال خطا زیاد است . ۲ـ دقت نمونه گیری خوشه ای، کمتر از دقت سایر روش های نمونه گیری احتمالی است . زیرا، اولاًمناطق از نظر مسائل اجتماعی و ساخت جغرافیایی متفاوتند . ثانیاً ، تغییرات مورد بررسی در       نمونه ها، معرف تغییرات مورد مطالعه در جامعه نیست . ۳ـ وقت گیر و پرهزینه است . ۳ـ۲ـ۲ـ۵ ـ نمونه گیری چند مرحله   : « در نمونه گیری چند مرحله ای ، افراد جامعه با توجه به سلسله مراتبی ( از واحدهای بزرگتر به کوچکتر ) از انواع واحدهای جامعه انتخاب می شوند. برای مثال در برآورد توانایی ریاضی دانش آموزان پایه پنجم ابتدایی در یک منطقه ی آموزش و پرورش ، می توان دانش آموزان را در سه مرحله با استفاده از واحدهای نمونه گیری مختلف زیر به صورت زیر انتخاب کرد : واحد مرحله ی اول :       دبستان                  دبستان ۱                      دبستان۲ و . . .          دبستان۱۰ واحد مرحله ی دوم :      کلاس               کلاس ۱و۲                کلاس ۳و۴ و . . .     کلاس ۱۹و ۲۰ واحد مرحله ی سوم : دانش آموز ۱، ۲، ۳ ،۴ ،۵، ۶ ،۷ ، ۸ ، ۹ ، ۱۰ و . . .۵۵، ۵۶ ، ۵۷ ، ۵۸ ، ۵۹ ، ۶۰    در مثال فوق ، ابتدا جامعه ی دانش آموزان ابتدایی پایه پنجم ، به دبستان ها تقسیم شده اند .         در این مرحله که مرحله اول نمونه گیری است ، از میان دبستان های انتخاب شده دو کلاس       (واحد مرحله ی دوم =n2 ) انتخاب می شود . در اینجا از دبستان شماره ی یک ، کلاس های ۱و۲ پایه ی پنجم و از دبستان شماره ی دوم کلاس های ۳و۴ پایه ی پنجم و بالاخره از دبستان دهم کلاس های ۱۹ و۲۰ پایه ی پنجم بطور تصادفی انتخاب شده اند . در مجموع ۶۰ دانش آموز    از ۲۰ کلاس و ۱۰ دبستان انتخاب شده است  . »  …« نمونه گیری چند مرحله ای در مقایسه با نمونه گیری خوشه ای از دقت بیشتری برخوردار است ، زیرا در نمونه گیری چند مرحله ای واحدهای نمونه ی مرحله ی نهایی در سطح جامعه پراکنده شده و تغییرات متغیر مورد بررسی در نمونه ، معرف تغییرات مورد مطالعه در جامعه است . در حالی که در           نمونه گیری خوشه ای چنین امری میسر نمی باشد  .» 

۳ـ۳ ـ تعیین حجم نمونه   : برای تعیین حجم نمونه چند را پیش رو داریم که عبارتند از

:۱ـ استفاده ازمحاسبات آماری ۲ـ  استفاده ازجدول تعین حجم نمونه ۳ـ استفاده از نظر محقق ۳ـ۳ـ۱ ـ تعیین حجم نمونه براساس محاسبات آماری :متداولترین روش محاسبه ی حجم نمونه ، استفاده از محاسبات آماری است . در این روش پژوهشگر ابتدا توسط یک آزمون مقدماتی ، پارامترهای جامعه ی آماری را مشخص می کند . پس از آن با استفاده از فرم

ول هایی که جهت تعیین حجم نمونه وجود دارد ، مقدار حجم نمونه را بدست          می آورد. مراحل این روش به شرح زیر است :  الف ـ برآورد واریانس : برای تعیین نمونه  باید واریانس جامعه معلوم باشد . ولی از آنجایی که واریانس جامعه  مشخص نیست ، یا آنرا از طریق آزمون مقدماتی  برآورد می کنیم ، یا اینکه از واریانس برآورد شده در تحقیقات قبلی استفاده می نماییم .ب ـ سطح معنی داری یا سطح اطمینان : میزان سطح اطمینانی که در تحقیق برای تعمیم نتایج از  نمونه ی آماری به جامعه ی آماری تعیین می کنیم ، بر روی تعیین حجم نمونه ی ما تأثیر بسزایی دارد . در علوم رفتاری حداقل سطح اطمینان ۹۵% پذیرفته شده است ، ولی تا ۹/۹۹% قابل افزایش است . هرچه این سطح اطمینان را بالاتر ببریم ، مثلاً به جای سطح اطمینان ۹۵% از سطح اطمینان ۹۹% استفاده کنیم ، احتمال صحت گفتار ما (فرضیه ی ما ) کمتر می شود ، ولی دقت و اطمینان ما به نتایج و همچنین میزان حجم نمونه بیشتر می شود و در نتیجه میانگین نمونه ی آماری ما به میانگین جامعه ی آماری  نزدیک تر می شود . ج ـ پیدا کردن فرمولی برای تعیین حجم نمونه : اگرروش نمونه گیری مورد استفاده ، روش نمونه گیری طبقه ای باشد ، برای تعیین حجم نمونه باید از فرمول زیر استفاده کرد :  sh = انحراف معیار هر طبقه                                                              v = واریانس مطلوب t = اندازه ی متغیر در توزیع نرمال است .که با توجه به سطح معنی داری معین می شود . N= کل جمعیت NH = جمعیت هر طبقهWH= نسبت هر طبقه به کلحجم هر یک از طبقات هم از فرمول زیر به دست می آید:ni = (wH) (n) اگر روش نمونه گیری سایر روشها ( بجز طبقه ای ) باشد ، باید برای تعیین حجم نمونه از فرمول های زیر استفاده نمود : 

 t= اندازه ی متغیر در توزیع نرمال است که با توجه به سطح معنی داری تعیین می شود .p= احتمال وجود صفت در نمونه (یا نسبتی از جامعه که دارای صفت مورد نظر است ). q = احتمال عدم وجود صفت در نمونه ( یا نسبتی از جامعه که فاقد صفت مورد نظر است ).                                                            d= فاصله ی اطمینان یعنی فاصله ای که میانگین با این احتمال در آن قرار می گیرد . یعنی اندازه ی  dبه اندازه ی فاصله ی بین میانگین نمونه ومیانگین جامعه است . s = انحراف معیار نمونه                                                 n= حجم نمونه s = اشتباه استاندارد در نمونه از دو فرمول فوق هنگامی استفاده می شود که نسبت حجم نمونه به حجم جامعه   مساوی یا کمتر از پنج درصد باشد . ولی هنگامی که نسبت حجم نمونه به حجم جامعه   بیشتر از پنج درصد باشد ، از فرمول های زیر استفاده می شود :                                                                                                                                                                                                                                                                                                                         

 

s2= واریانس نمونه                                                                          

e = مقدار اشتباه برآورد                                                  

دـ تعیین حجم نمونه و ارزیابی آن برای مشخص کردن اینکه ، آیا این تعداد نمونه در پرتو امکانات هست یا خیر ؟وقتی که مقدار حجم نمونه مشخص شد ، باید ببینیم برای این تعداد نمونه ، نیروی انسانی متخصص و کافی ، زمان کافی و هزینه ی لازم مثل هزینه ی رفت و آمد ، هزینه ی پرسشگران ، هزینه ی پیدا کردن نمونه ها ، هزینه ی تکثیر ، هزینه ی رفت و آمد و … را دارا هستیم یا خیر . اگر حجم نمونه بیش از امکانات محقق باشد ، می توان حجم نمونه را با افزایش خطای مجاز پایین آورد .  ۳ـ۳ـ۲ ـ تعیین حجم نمونه بر اساس جدول : یکی دیگر از راههای تعیین حجم نمونه استفاده از جداولی است که برای همین منظور تهیه شده است . در این جداول با توجه به حجم جامعه ، حجم نمونه تعیین شده است . یک نمونه از این جداول به وسیله کرجسی و مورگان تهیه شده است که در جدول ۳ـ۱ ارائه شده است . جدول ۳ـ۱  جدول تعیین حجم نمونه از یک جامعهحجم جامعه ی آماری حجم نمونه ی آماری حجم جامعه ی آماری حجم نمونه ی آماری حجم نمونه ی آماری حجم جامعه ی آماری۱۲۰۰                               ۲۹۱ ۲۲۰                                 ۱۴۰ ۱۰                                 ۱۰۱۳۰۰                               ۲۹۷ ۲۳۰                                   ۱۴۴ ۱۵                                 ۱۴۱۴۰۰                               ۳۰۲ ۲۴۰                                   ۱۴۸ ۲۰                                   ۹۱۵۰۰                              ۳۰۶ ۲۵۰                                  ۱۵۲       ۲۵                                 ۲۴۱۶۰۰                              ۳۱۰ ۲۶۰                                    ۱۵۵ ۳۰                                  ۲۸۱۷۰۰                              ۳۱۳ ۲۷۰                                   ۱۵۹ ۳۵                                  ۳۲۱۸۰۰                             ۳۱۷ ۲۸۰                                   ۱۶۲ ۴۰                                 ۳۶۱۹۰۰                             ۳۲۰ ۲۹۰                                  ۱۶۵ ۴۵                                ۴۰۲۰۰۰                             ۳۲۲ ۳۰۰                                  ۱۶۹   ۵۰                                ۴۴۲۲۰۰              

              ۳۲۷ ۳۲۰                                  ۱۷۵     ۵۵                                ۴۸۲۴۰۰                            ۳۳۱ ۳۴۰                                 ۱۸۱ ۶۰                                 ۵۲                                ۲۶۰۰                            ۳۳۵ ۳۶۰                                 ۱۸۶ ۶۵                                 ۵۶۲۸۰۰    

 

 

                       ۳۳۸ ۳۸۰                                 ۱۹۱ ۷۰                                ۵۹۳۰۰۰                          ۳۴۱ ۴۰۰                                ۱۹۶ ۷۵                                ۶۳ ۳۵۰۰                          ۳۴۶ ۴۲۰                                ۲۰۱ ۸۰                               ۶۶۴۰۰۰                         ۳۵۱ ۴۴۰                                ۲۰۵ ۸۵                              ۷۰  ۴۵۰۰                          ۳۵۴ ۴۶۰                               ۲۱۰     ۹۰                               ۷۳۵۰۰۰                         ۳۵۷ ۴۸۰                               ۲۱۴ ۹۵                              ۷۶۶۰۰۰                        ۳۶۱ ۵۰۰                               ۲۱۷ ۱۰۰                            ۸۰۷۰۰۰                        ۳۶۴ ۵۵۰                               ۲۲۶ ۱۱۰                             ۸۶۸۰۰۰                            ۳۶۷ ۶۰۰                             ۲۳۴ ۱۲۰                            ۹۲۹۰۰۰                            ۳۶۸ ۶۵۰                             ۲۴۲ ۱۳۰                            ۹۷۱۰۰۰۰                         ۳۷۰ ۷۰۰                             ۲۴۸   ۱۴۰                           ۱۰۳۱۵۰۰۰                         ۳۷۵ ۷۵۰                             ۲۵۴ ۱۵۰                          ۱۰۸۲۰۰۰۰                         ۳۷۷ ۸۰۰                           ۲۶۰ ۱۶۰                          ۱۱۳ ۳۰۰۰۰                         ۳۷۹ ۸۵۰                            ۲۶۵ ۱۷۰                          ۱۱۸  ۴۰۰۰۰                        ۳۸۰ ۹۰۰                             ۲۶۹ ۱۸۰                          ۱۲۳۵۰۰۰۰                         ۳۸۱ ۹۵۰                             ۲۷۴   ۱۹۰                         ۱۲۷۷۵۰۰۰                         ۳۸۲ ۱۰۰۰                          ۲۷۸ ۲۰۰                         ۱۳۲  ۱۰۰۰۰۰                      ۳۸۴ ۱۱۰۰                         ۲۸۵ ۲۱۰                        ۱۳۶   » . ۳ـ۳ـ۳ـ براساس نظر محقق : در این روش محقق با در نظر گرفتن عواملی مثل بودجه ، زمان ، نیرویانسانی ماهر ، امکانات و  … درصدی از جامعه را بعنوان نمونه انتخاب می کند . برخی از محققین حداقل نمونه را ۱۰ درصد جامعه ذکر می کنند . ۳ـ۴ـ عوامل مؤثر برحجم نمونه : مهمترین عوامل مؤثر بر حجم نمونه عبارتند از : ۱ـ سطح معنی داری : هرچه محقق سطح معنی داری ( احتمال مرتکب شدن خطای نوع اول ) را بالاتر در نظر بگیریم به حجم نمونه بیشتری نیاز دارد . ۲ـ تعداد متغیرهای مورد بررسی : با افزایش تعداد متغیرهای مورد بررسی ، حجم نمونه نیز افزایش    می یابد . ۳ـ سطح سنجش متغیرهای مورد بررسی : هرچه سنجش متغیرهای مورد بررسی پایین تر باشد ، به نمونه های بیشتری نیاز است . مثلاً هنگامی که متغیرهای مورد بررسی در سطح سنجش اسمی باشد، نسبت به زمانی که متغیرها در سطح سنجش فاصله ای یا نسبی باشند ، نیاز به نمونه بیشتری است . ۴ـ نحوه ی کنترل متغیرهای ناخواسته : هرچه تعداد متغیرهای ناخواسته ای که محقق قادر به کنترل آنها نباشد ، در یک تحقیق بیشتر باشد ، نیاز به حجم نمونه بیشتری است ، تامقداری خطا در تحقیق کاهش یابد . ۵ـ میزان پراکندگی متغیر مورد بررسی : هرچه جامعه ی آماری مورد تحقیق از نظر صفت مورد بررسی متجانس تر باشند ، نیاز به نمونه ی کمتری است . ولی هرچه جامعه ی آماری نامتناجس تر باشد برای اینکه نمونه  مورد نظر معرف جامعه باشد ، نیاز به نمونه های بیشتری است . ۶ ـ حجم جامعه ی آماری : بطور معمول با افزایش حجم جامعه ی آماری ، حجم نمونه ی آماری نیز افزایش می یابد . ( البته نه به نسبت حجم جامعه به نمونه) . ۳ـ۵ـ خطای نمونه گیری  : در نمونه گیری همیشه خطایی به نام نمونه گیری وجود دارد که علت این خطا ، یا اختلاف میان آزمودنیها ، یا اشتباه نمونه گیری است . خطای نمونه گیری با تعداد نمونه رابطه ی معکوس دارد ، زیرا با افزایش حجم نمونه ، خطای نمونه گیری کاهش می یابد و با ناهمگونی افراد رابطه ی مستقیم دارد . زیرا هرچه افراد نمونه ، ناهمگونی تر باشند ، خطای نمونه گیری هم بیشتر است .  اگر از یک جامعه به طور تصادفی نمونه های زیادی را انتخاب کنیم ، بعلت خطای نمونه گیری همگی دارای ویژگی های یکسانی نیستند و میانگین آنها با هم متفاوت است .  اگر یک جامعه دارای پراکندگی زیادی باشد ، میانگین هایی که از روی این جامعه بدست می آید، بیشتر از میانگین هایی که از یک جامعه با پراکندگی کم بدست می آید ، با هم تفاوت دارند . اگر میانگین نمونه هایی را که از یک جامعه می گیریم ، محاسبه کنیم ، توزیع این میانگین یک توزیع طبیعی خواهد شده ، میانگین ، میانگین های نمونه های انتخاب شده ، برابربا میانگین جامعه خواهد بود . طبق ویژگی های توزیع طبیعی میانگین یک نمونه با ۲۶/۶۸ درصد اطمینان ، نمره ها بین ۱±  انحراف معیار از میانگین جامعه قرار دارند . این بدان معنی است که ۲۶/۶۸ درصد شانس وجود دارد ، میانگین جمعیت نمونه به اندازه ی یک واحد خطای معیار کمتر یا بیشتر از میانگین جمعیت آماری باشد . طبق ویژگی های توزیع طبیعی ، میانگین های یک نمونه با ۹۵ درصد اطمینان ،  بین ۹۶/۱± انحراف معیار میانگین جامعه ،  با ۵/۹۵ درصد اطمینان بین ۲± انحراف معیار از میانگین جامعه ، با ۹۹ درصد اطمینان بین ۵۸/۲±  انحراف معیار از میانگین جامعه ، با ۷۳/۹۹ درصد اطمینان بین ۳ ± انحراف معیار میانگین جامعه ، با ۹/۹۹ درصد اطمینان بین ۲۹/۳±  انحراف معیار از میانگین جامعه قرار دارند . رابطه ی بینt ( اندازه ی متغیر در توزیع نرمال که همیشه نسبت به سطح اطمینان مشخص     می شود ) و سطح اطمینان در جدول ۳ـ۲ ارائه شده است. 

                                  سطح اطمینان اندازه z یا t ( اندازه متغیر در توزیع نرمال )                        ۲۶/۶۸% ۱                                                               ۹۵% ۹۶/۱                         ۵/۹۵% ۲                            ۹۹% ۵۸/۲                       ۷۳/۹۹% ۳                         ۹ /۹۹%   ۲۹/۳
 توزیع نرمال دارای انواع مختلفی است که تفاوت آنها فقط در انحراف معیار و میانگین آنهاست . توزیع نرمال استاندارد یکی از انواع توزیع نرمال است . توزیعی که میانگین آن صفر و انحراف معیار یک باشد توزیع نرمال استانداردنامیده می شود.منحنی نرمال دارای ویژگی هایی است که عبارتند از : ۱ـ متقارن است ، یعنی مشاهدات سمت چپ و راست میانگین قرینه یکدیگر هستند . توزیع نرمال به دلیل ویژگی متقارن بودن ، نسبت نمره های بین   تا z3+ با نسبت نمره هایی که بین    تا z3ـ قرار دارند ، برابر است . ۲ـ شکل توزیع نرمال به میانگین و انحراف معیاربستگی دارد . تغییر در مقدار میانگین سبب می شود که منحنی به سمت راست یا چپ کشیده شود و تغییر در مقدار انحراف معیار سبب تغییر در شکل منحنی (پخی ، کشیدگی یا نرمال بودن ) می شود . ۳ـ مساحت زیر منحنی نرمال مساوی با یک است ، که نیمی کمتر از میانگین و نیمی بیشتر از میانگین است . بعبارت دیگر منحنی نرمال از ناحیه ی میانگین به دو نیمه مساوی تقسیم می شود که سهم هر نیمه برابر با ۵/ . است . ۴ـ دنباله ی منحنی نرمال در هر دوسو ، موازی محور  x هاست . ۵ـ منحنی نرمال از دیدگاه تئوریکی شامل ± ∞ است ، ولی در عمل شامل  ۳±  انحراف معیار است . ۶-در توزیع نرمال هر سه معیار مرکز گرایی یعنی میانه ، نما و میانگین با هم برابر هستند بیشترین تمرکز نمره ها در نقطه میانگین است .۴ـ۱ رسم نمودار    : اطلاعات جدول فراوانی را می توان بصورت نمودار نشان داد . نمایش داده ها به صورت نمودار دارای مزیت هایی بر نمایش داده ها به صورت جدول فراوانی است که عبارتند از : ۱ـ اطلاعات آن سریعتر درک می شود. ۲ـ مقایسه نمودارها با یکدیگر راحت تر و آسان تر از مقایسه جداول فراوانی با یکدیگر است . ۳ـ نمودار تصویر روشن تری از داده ها ارائه می دهند . ۴ـ نمودار نسبت به جدول فراوانی ویژگی داده ها را آسانتر توصیف می کنند . نمودار ابزاری است برای نمایش و توصیف داده ها ، که از دو محور تشکیل شده است :الف ـ محور عمودی یا محور y ها ب ـ محور افقی (عرضها) یا محور x ها . به محل تقاطع دو محور x و y مبدأ مختصات گفته می شود و با o  نشان داده می شود . طول نقاط واقع در سمت راست مبدأ مختصات و عرض نقاط بالای مبدأ مختصات مثبت و طول نقاط واقع در سمت چپ مبدأ مختصات و عرض نقاط پایین مبدأ مختصات منفی است . spss  دارای ۱۷ نوع نمودار است که مهمترین آنها عبارتند از : ۱ـ نمودار هیستوگرام ۲ـ نمودار ستونی ۳ـ نمودار دایره ای ۴ـ نمودار جعبه ای ۵ـ نمودار چند ضلعی ۶ـ نمودار فراوانی تراکمی یا اُجیو ۷ـ نمودار سریهای زمانی ۸ـ نمودار شاخه و برگ ۴ـ۲ انواع نمودار برای متغیرهای اسمی و ترتیبی : نمودارهایی که می توان برای متغیرهای اسمی و ترتیبی رسم کرد عبارتند از : الف ـ نمودار میله ای ( ستونی )                   ب ـ نمودار دایره ای ۴ـ۲ـ۱ ـ نمودار میله ای یا ستونی   : نمودار میله ای را می توان برای متغیرهای اسمی ترتیبی رسم نمود . برای رسم نمودار میله ای باید مراحل زیر را انجام داد : ۱ـ نموداری شامل یک محور عمودی و یک محور افقی رسم کنید بطوری که محور عمود    محور افقی باشد . ۲ـ محور عمودی را y و محور افقی را x نامگذاری کنید . ۳ ـ اگر با تحلیل یک متغیری سرو کار داشتید ، گروه هارا درمحور افقی (محور x ها) و فراوانی درصدها یا نسبت ها را در محور عمودی (محور y ها ) قرار دهید . ولی اگر با تحلیل دو متغیری سروکارداشتید متغیر مستقل را در محور افقی ( محور x ها ) و متغیر وابسته را در محور عمودی ( محور y ها ) قرار دهید . ۴ ـ ارتفاع هر میله هم به اندازه فراوانی هر طبقه از متغیر است .  در نمودار میله ای پهنای هر ستون را می توان به اندازه ی دلخواه تعیین کرد زیرا در مقیاس های اسمی و ترتیبی مساحت دقیقی برای متغیرهای گسسته وجود ندارد . ولی بلندی هرستون باید حتماً به اندازه ی فراوانی هرکدام از مقوله ها باشد . مثال ـ توزیع فراوانی ۵۰ نفر از دانشجویان رشته جامعه شناسی در جدول ۴ـ۱ ارائه شده است ، نمودار میله ای آن را رسم نمایید .جدول ۴ـ۱ ـ جنسیت دانشجویان : فراوانی ، درصدهاجنسیت فراوانی درصد مرد ۳۰ ۶۰ زن ۲۰ ۴۰ 

سوال ـ آیا می توان برای متغیر سن نمودار میله ای رسم کرد ؟ خیر چون متغیر سن یک متغیر فاصله ای است ، ولی نمودار میله ای برای متغیر های اسمی یا ترتیبی مناسب است . اگر برای متغیر سن نمودار ستونی رسم کنیم تعداد زیادی ستون ایجاد می شود که کارایی چندانی نخواهد داشت . همچنین از سویی دیگر ، اگر سن خاصی مثلاً ۲۹ـ۲۵ ساله نداشته باشیم ، در spss محل خالی برای این گروه سنی ایجاد نخواهد شد و چونکه فاصله بین ستون ها ایجاد نمی شود ، ما متوجه عدم وجود گروه سنی ۲۹ـ۲۵ ساله نخواهیم شد .

روش اجرای نمودار میله ای : ۱ـ ابتدا منو analyze و سپس فرمان descriptive statistics را کلیک می کنیم . ۲ـ فرمان frequencies را کلیک کرده و متغیر مورد نظر را به بخش variable منتقل می کنیم. ۳ـ گزینه ی charts و سپس bar charts را کلیک می کنیم. ۴ـ در آخر هم گزینه یcontinue و سپس ok را کلیک می کنیم . اگر بخواهیم فراوانی هر ستون در بالای آن درج شود ابتدا دوبار نشانگر ماوس را روی نمودار کلیک می کنیم ، سپس                   گزینه یformat را کلیک می کنیم . سپس گزینه یbar label styles  وبعد گزینه ی framed را کلیک کرده و در آخر گزینه ی apply all و بعد close را کلیک می کنیم. ۵ ـ در آخر هم پنجره ی جدید باز شده رامی بندیم.  ۴ـ۲ـ۲ ـ نمودار دایره ای   یا قطاعی : نمودار دایره ای ، نموداری است که درصد فراوانی ها را به صورت قطعاتی از سطح دایره و متناسب با درصدهای مذکور نشان می دهد . در این نمودار اندازه ی هر قطعه تحت تأثیر تعداد نمونه ی حالت های مربوط به آن است . در نمودار دایره ای ، بزرگ یا کوچک کردن فراوانی ها به یک نسبت ، تغییری در شکل نمودار بوجود نمی آورد.از این نمودار هنگامی استفاده می کنیم که تعداد حالت های متغیر کم باشد و متغیر مورد بررسی در سطح سنجش اسمی یا ترتیبی باشد . مراحل رسم نمودار دایره ای : ۱ـ یک دایره رسم کنید . ۲ـ برای اینکه بدانیم هرقطعه چه سطحی از دایره را اشغال می کند ، ابتدا ۳۶۰ یعنی درجات محیط دایره رابر کل فراوانی ها تقسیم ، سپس نتیجه ی بدست آمده را در فراوانی هر طبقه ضرب می کنیم . 

مثال : مذهب تعدادی از پاسخگویان در یک تحقیق در جدول ۴ـ۲ ارائه شده است                          با توجه به این اطلاعات نمودار دایره ای پاسخگویان بر حسب نوع مذهب را رسم کنید . جدول ۴ـ۲ـ جدول توزیع پاسخگویان بر حسب  نوع مذهب برحسب نوعنوع مذهب فراوانی ارتدوکس ۱۵پروتستان ۱۵ کاتولیک ۳۰ جمع ۶۰ 

 

روش اجرای نمودار دایره ای : ۱ـ منو graphs و سپس فرمان  pie را کلیک می کنیم . ۲ـ گزینه ی summaries for groups of cases و سپس گزینه ی   define را کلیک        می کنیم. ۳ـ متغیر مورد نظر را به بخش define slices منتقل کرده و، گزینه ی ok را کلیک می کنیم . اگر بخواهیم درصدها به نمودار اضافه شود، ابتدا دوبار نشانگر ماوس را روی نمودار کلیک           می کنیم ، سپس گزینه ی  chart را کلیک می کنیم وبعد بر روی گزینه ی options کلیک      می کنیم . ۴ـ گزینه ی  percents را کلیک می کنیم . ۵- لیست مربوط به position  را باز می کنیم و گزینه های test outside  و number inside را کلیک می کنیم.۶ـ بر روی گزینه ی ok کلیک می کنیم و سپس پنجره ی جدید باز شده را می بندیم .  ۴ـ۳ ـ انواع نمودار برای متغیرهای فاصله ای و نسبی : مهمترین نمودارهایی که می توان برای متغیرهای فاصله ای و نسبی رسم نمود عبارتند از : ۱ـ نمودار هیستوگرام ۲ـ نمودار فراوانی تراکمی ۳ـ نمودار چند ضلعی ۴ـ نمودار شاخه و برگ ۵ـ نمودار جعبه ای ۴ـ۳ـ۱ـ نمودار هیستوگرام     : نمودار هیستوگرام ، نموداری است شامل ستون های چسبیده به هم ،که نحوه ی توزیع مقادیر داده ها را نشان می دهد . در این نمودار عرض هر مستطیل برابر با     فاصله ی طبقات ، مساحت مستطیل ها متناسب با فراوانی طبقه و وسط هر مستطیل منطبق بر نماینده ی طبقه است . مراحل رسم نمودار هیستوگرام به شرح زیر است : ۱ـ محورهای مختصات را رسم کنید .۲ـ محور افقی (محور x ها ) را به فواصل مساوی و به اندازه ی بیشترین عدد رسم نمایید . فاصله ی بین اعداد روی این محور برابر فاصله ی طبقات (I) است،  بنابراین روی این محور با فواصل مساوی حد پایین و حد بالای حدود واقعی طبقات را بنویسید . اگر داده ها گروه بندی شدهبودند، محور افقی به  حد وسط طبقات اختصاص دهید .در این نمودار عرض ستون ها برابر با عرض طبقات           ( فاصله ی بین حدبالای دوطبقه ) و طول ستون ها برابر با فراوانی گروهها یا مقادیر است . ۳ـ محور عمودی (محور y ها ) را به فواصل مساوی و به اندازه ی بیشترین فراوانی رسم کنید . مثال ۵ ـ نمرات در س ۳۰ نفر از دانشجویان یک کلاس در درس آمار در جدول ۴ـ۳ ارائه شده است . نمودار هیستوگرام نمرات دانشجویان در درس آمار را رسم نمایید . 

نمرات حدواقعی طبقات حدوسط طبقات فراوانی۱۱ـ۸ ۵/۱ـ۵/۷ ۵/۹ ۶۱۵ـ۱۲ ۵/۱۵ ۵/۱۳ ۱۵۱۹ـ۱۶ ۵/۱۹ـ۵/۱۵ ۵/۱۷ ۹     
   

روش اجرای نمودار هیستوگرام : برای اجرای نمودار هیستوگرام هم می توان از منو analyze استفاده کرد وهم از منو graphs .الف ـ روش اجرا از منو analyze   : ۱ـ ابتدا بر روی منو analyze کلیک می کنیم  . ۲ـ فرمانdescriptive statistics   وسپس فرمان   frequencies   را کلیک کرده و بعد متغیر مورد نظر را به بخش variable منتقل می کنیم  . ۳ـ گزینه یcharts و سپس histograms  را کلیک می کنیم. ۴ـ در آخر هم گزینه ی continueو سپس ok را کلیک می کنیم. اگر  بخواهیم مقادیر فراوانی بر روی نمودار ظاهر شوند، اقدامات زیر را انجام می دهیم:۱- بر روی نمودار دو بار کلیک می کنیم.۲- بر روی گزینه ی Format و سپس Bar Label Style  کلیک می کنیم.۳- در پنجره ی Bar Label Style  بر روی گزینه ی Framed  سپس گزینه ی Apply All کلیک می کنیم.۴- سپس پنجره ی باز شده را می ببندیم.ب ـ روش اجرا از منو graphs  : ۱ـ ابتدا منو graphs و سپس گزینه ی histogram  را کلیک می کنیم  . ۲ـ متغیر مورد نظر را به بخش variable منتقل می کنیم. ۳ـ گزینه ی display normal curve را انتخاب کرده و سپس بر روی گزینه ی ok            کلیک می کنیم. ۴ـ۳ـ۲ ـنمودار چند ضلعی یا پلیگون   : نمودار چند ضلعی روش دیگری برای به نمایش در آوردن اطلاعات است. این نمودار از تعدادی نقاط که توسط خطوط راست به یکدیگر وصل می شوند تشکیل شده است . 
مراحل رسم نمودار چند ضلعی : ۱ـ محور های مختصات را رسم می کنیم. ۲ـ در محور افقی (محور xها) اگر متغیر مورد بررسی  گروه بندی شده نبود، مقادیر متغیر و اگر متغیر گروه بندی شده بود ، حد وسط طبقات (نماینده ی طبقات ) را قرار می دهیم . روش محاسبه ی حد وسط طبقات بدین صورت است که، حد پایین و حد بالای هر طبقه را باهم جمع و سپس حاصل جمع را بر عدد ۲ تقسیم می کنیم. مثلاً در جدول ۴ـ۴ حد وسط طبقه اول عبارت است از :  هنگامی که حد وسط طبقه ی اول را محاسبه کردیم برای محاسبه ی حدوسط طبقه ی دوم ، حد وسط طبقه ی اول را با فاصله ی طبقات جمع کنیم تاحد وسط طبقه ی دوم بدست آید . در مثال ما حد وسط طبقه ی دوم عبارت است از :    . حدوسط طبقه ی سوم هم عبارتند از: حد وسط طبقه ی دوم بعلاوه فاصله ی طبقات . به همین ترتیب حد وسط سایر طبقات را محاسبه         می کنیم  . در محور افقی دو طبقه ی اضافی با فراوانی صفر برای ختم شدن نمودار به محور x ها در نظر         می گیریم . ۳ـ در محور  عمودی ( محور yها) مقادیر فراوانی رامی نویسیم .۴ـ اولین طبقه را در نظر بگیرید ، حد وسط طبقه ی آن عدد۱۵۲ و فراوانی آن عدد ۹ است . ازحدوسط طبقه ی اول یعنی عدد ۱۵۲ موازی با محور عمودی y ها خط چین به سمت بالا رسم       می کنیم  تا به فراوانی ۹ برسیم .سپس از محور عمودی در فراوانی ۹ موازی با  محور افقی  خط چینی رسم می کنیم تا همدیگر را در یک نقطه قطع کنند. آنگاه محل تقاطع این دوخط را با نقطه پر رنگ مشخص می کنیم. به همین ترتیب برای سایر طبقات محل تلاقی حد وسط طبقات و فراوانی ها را مشخص می کنیم. پس از آن همه ی طبقاتی را که بدین صورت مشخص کرده ایم، را به وسیله ی خطی به یکدیگر وصل می کنیم.

جدول ۴ـ۴ توزیع قد پاسخگویانطبقات F حدوسط طبقات ۱۵۴-۱۵۰ ۹ ۱۵۲۱۵۹-۱۵۵ ۱۱ ۱۵۷۱۶۴-۱۶۰ ۱۵ ۱۶۲۱۶۹-۱۶۵ ۱۳ ۱۶۷۱۷۴-۱۷۰ ۱۱ ۱۷۲۱۷۹-۱۷۵ ۸ ۱۷۷۱۸۴-۱۸۰ ۱۱ ۱۸۲۱۸۹-۱۸۵۱۳ ۱۸۷۱۹۴-۱۹۰ ۹ ۱۹۲

 

۴ـ۳ـ۳ـ نمودار فراوانی تراکمی    : نمودار فراوانی تراکمی گا هی نمودار طاق رومی ogiveنیز نامیده می شود. زیرا شکل منحنی که از تراکم فراوانی ها بدست می آید به شکل طاق است . از نمودار فراوانی تراکمی هنگامی استفاده می کنیم که بخواهیم موقعیت آزمودنیها را در توزیع فراوانی داده ها بدانیم . مراحل رسم نمودار فراوانی تراکمی : ۱ـ نموداری شامل یک محور عمودی و یک محور افقی رسم کنید بطوری که نسبت محور افقی به عمودی ۴ به ۳ باشد . ۲ـ در محورعمودی (محور y ها) فراوانی تراکمیfci  یا درصد فراوانی تراکمی داده را می نویسیم . فراوانی تراکمی هر طبقه بدین صورت بدست می آید که فراوانی همان طبقه ، با مجموع فراوانی های طبقات پایین تر از آن جمع را جمع می کنیم . محور عمودی باید حداقل به اندازه ی فراوانی انتخاب شود و فاصله ی نسبت ها هم باید مساوی باشد . ۳ـ در محور افقی (محور x ها)، اگر داده ها گروه بندی شده باشد، حد بالای حدود واقعی  طبقات را قرار می دهیم . البته در روی این محور حدپایین حدود واقعی طبقه ی اول با فراوانی صفر را نیز مشخص می کنیم تا از طریق آن منحنی را به محور افقی وصل کنیم . واگر داده ها گروه بندی نشده باشند در روی محور افقی مقادیر متغیر را می نویسیم . ۴ـ اولین طبقه را در نظر می گیریم حد بالای این طبقه عدد۱۵۴ است . از عدد ۱۵۴  خطی بصورت خط چین موازی با محور عمودی به طرف بالا رسم می کنیم و آنرا تاجایی ادامه می دهیم که به فراوانی تراکمی متناظر با آن  یعنی ۹ برسیم . سپس از محور عمودی در فراوانی موازی با محور افقی خط چین رسم می کنیم تا این دو خط چین همدیگر را در یک نقطه قطع کنند . ۵ـ محل تلاقی این نقاط را مشخص می کنیم. سپس همه ی نقاطی را که بدین صورت مشخص کرده ایم را بوسیله خطی به یکدیگر وصل می کنیم. 

طبقات حدود واقعی طبقات فراوانی فراوانی تراکمی fci درصدفراوانی تراکمی ۱۵۴-۱۵۰ ۵/۱۵۴-۵/۱۴۹ ۹ ۹ ۹%۱۵۹-۱۵۵ ۵/۱۵۹-۵/۱۵۴ ۱۱ ۲۰ ۲۰%۱۶۴-۱۶۰ ۵/۱۶۴-۵/۱۵۹ ۱۵ ۳۵ ۳۵%۱۶۹-۱۶۵ ۵/۱۶۹-۵/۱۶۴ ۱۳ ۴۸ ۴۸%۱۷۴-۱۷۰ ۵/۱۷۴-۵/۱۶۹ ۱۱ ۵۹ ۵۹%۱۷۹-۱۷۵ ۵/۱۷۹-۵/۱۷۴ ۸ ۶۷ ۶۷%۱۸۴-۱۸۰ ۵/۱۸۴-۵/۱۷۹ ۱۱ ۷۸ ۷۸%۱۸۹-۱۸۵ ۵/۱۸۹-۵/۱۸۴ ۱۳ ۹۱ ۹۱%۱۹۴-۱۹۰ ۵/۱۹۴-۵/۱۸۹ ۹ ۱۰۰ ۱۰۰%

۴ـ۳ـ۴ ـ نمودار جعبه ای   :  نمودار جعبه ای برای خلاصه کردن مجموعه ی بزرگی از داده ها بکار برده می شود . از طریق این نمودار می توان به تغییرپذیری داده ها، تقارن یا عدم تقارن داده ها، میانه (چارک دوم )، چارک اول و سوم ، دامنه ی بین چارکی ، حداکثر و حداقل داده ها ، نقاط پرت و انتهایی داده ها پی برد . در این نمودار خود مستطیل نشان دهنده ی دامنه ی بین چارکی یعنی فاصله ی بین چارک سوم و چارک اول و خط داخل جعبه نشان دهنده ی میانه (محل تجمع داده ها ) است . اگر خط میانه در وسط مستطیل باشد پی می بریم که داده ها قرینه اند. ولی اگر خط میانه در طرف پایین مستطیل باشد ، داده ها دارای چولگی مثبت و اگر در طرف بالای مستطیل باشد داده ها دارای چولگی منفی اند . نقاط دو سوی جعبه هم حداقل و حداکثر داده ها را نشان می دهند . همچنین در این نمودار مقادیر پرت بوسیله ی o(که حرف اول outlierاست )نمایش داده می شود و اعداد کنار آن هم شماره ی آن مورد است . مقدار پرت در این نمودار ، مقداری است که فاصله ی آن تا جعبه حداقل ۵/۱ برابر طول جعبه باشد . همچنین در این نمودار مقادیر انتهایی به وسیله   نشان داده  می شوند . مقادیر انتهایی هم مقادیری هستند که، فاصله ی آنها تا جعبه حداقل ۳ برابر طول جعبه باشد . (مانند شکل ۴ـ۷ ) 

مثال ـ وزن ۳۰ نفر از دانش آموزان یک کلاس ثبت شده است که اطلاعات آن در زیر آورده       شده است . 
حال نمودار جعبه ای آن را رسم می کنیم . 

روش اجرای نمودار جعبه ای : ۱ـ ابتدا منو graphs  وسپس فرمان boxplot  را کلیک می کنیم تا پنجره ی آن باز شود . ۲ـ در پنجره ی boxplotگزینه هایsimple و summaries of separate variablesرا      کلیک می کنیم. ۳ـ بر روی گزینه ی defineکلیک می کنیم. ۴ـ متغیری را که می خواهیم در محور عمودی ظاهر شود را به بخش variableو متغیری که          می خواهیم در محور افقی ظاهر شود را به بخش category axis منتقل کرده و سپس بر روی گزینه ی ok کلیک می کنیم. ۴ـ۳ـ۵ ـ نمودار شاخه و برگ   : نمودار شاخه و برگ مناسب مجموعه کوچکی از داده ها است . برای رسم این نمودار بایدداده ها را به دو قسمت تقسیم نمود . قسمت اول شاخه است، که معمولاً اولین رقم است و می تواند یک رقم یا بیش از یک رقم باشد . همچنین شاخه را می توان بصورت صعودی یا نزولی مرتب کرد . قسمت دوم برگ است، که آخرین رقم یا یکان  عدد است و همیشه یک رقمی است . تعداد ارقام مربوط به برگها به اندازه ی تعداد فراوانی هاست . برای جدانمودن شاخه و برگ از یکدیگر  خطی عمودی در سمت چپ برگ و سمت راست شاخه بین شاخه ها و برگ ها کشیده می شود . در سمت راست این خط برگها از چپ به راست بصورت صعودی مرتب می شود . (در spssبجای خط از نقطه برای جدا کردن شاخه و برگ از یکدیگر استفاده می شود.) گاهی اوقات پیش می آید که فاصله ی داده ها در برگ خیلی زیاد است و داده هارا بخوبی نشان   نمی دهد . در چنین مواقعی برای رفع این مشکل ، فاصله ی داده ها را به دو قسمت ۴ـ۱ و ۹ـ۵ تقسیم کرده و برای قسمت اول (۴-۱) علامت * و برای قسمت دوم (۹ـ۵ )     علامت ● به کار برده می شود . مثلاً فاصله بین ۸۹ـ۸۰ زیاد می باشد ، برای رفع این مشکل برای فاصله ۸۴ـ۸۰  در شاخه علامت   *۸  و برای فاصله ۸۹ـ۸۵ در شاخه علامت  ● ۸  بکار برده می شود . مثال ـ وزن ۳۰ نفر از دانشجویان یک کلاس به شرح زیر است : ۸۲ ، ۸۰، ۷۹ ،  ۷۷، ۷۶ ، ۷۵ ، ۷۲، ۶۹  ،  ۶۸،   ۶۷، ۶۳  ، ۶۲  ، ۶۱ ، ۵۹ ، ۵۸  ،  ۵۷،   ۵۵، ۵۴  ، ۵۲، ۵۰                                             ۹۸، ۹۶  ، ۹۳، ۹۱،۹۰ ،۸۹ ، ۸۸، ۸۷  ،  ۸۵، ۸۳،نمودار شاخه و برگ این داده ها را رسم نمایید . از روی این نمودار می توان نقاط پرت ، شکل توزیع و مرکز توزیع داده ها را به خوبی نشان داد . 

روش اجرای نمودار شاخه و برگ : ۱ـ ابتدا منو ی analyze و سپس فرمان descriptive statistics  را کلیک می کنیم. ۲ـ فرمان explore را کلیک کنید تا پنجره ی آن باز شود. ۳ـ متغیر مورد نظر را به بخش dependet list منتقل کرده و در بخش display گزینه ی plot  را انتخاب می کنیم.۴ـ سپس گزینه ی plot  در قسمت پایین پنجره explore را کلیک کرده تا پنجره ی plots باز شده و سپس در بخش descriptive گزینه ی stem- and-leaf را انتخاب می کنیم. ۵ـ در بخش boxplot   بر روی گزینه ی none   کلیک می کنیم. ۶ـ بر روی گزینه ی continue و سپس ok کلیک می کنیم. ۵ـ۱ فرضیه چیست : فرضیه حدس وگمان محقق است درباره ارتباط بین متغیرهای مورد بررسی که بتوان درستی آن را بررسی کرد . ۵ـ۲ ـ انواع فرضیه های آماری : فرضیه های آماری به دسته تقسیم می شوند : ۱ـ فرضیه صفر (یا فرض صفر ) ۲ـ فرضیه مخالف (یا فرض مخالف ) ۵ـ۲ـ۱ ـ فرض صفر  : فرض صفر یا فرض اولیه را با H0 نشان می دهند . فرض صفر اصل را براین قرار می دهد که هیچ ارتباط یا هیچ اختلافی بین متغیرهای مورد بررسی وجود ندارد و اگر رابطه یا اختلافی هم هست، ناشی از اتفاق یا خطای نمونه گیری است . ما همواره در آزمون فرض آماری ، فرض صفر را آزمون می کنیم . فرض صفر همواره صحیح فرض می شود، مگر اینکه شواهد و مدارک ، خلاف آن را ثابت کند . ما به راحتی می توانیم نادرستی فرضیه ای را اثبات کنیم. به این صورت که اگر نتایجی را که بدست آورده ایم، موافق فرضیه ی مورد نظر  نبود ، فرض صفر را رد می کنیم، ولی اثبات درستی فرضیه خیلی سخت است  . اگر نتایج بدست آمده موافق فرضیه ی ما باشد ، تنها معنایی که دارد این است که فرضیه ی ما رد نشده است ،. ولی اثبات هم نشده است ، زیرا ممکن است یک ساعت یا یک سال یا … دیگر فرضیه ی ما رد شود یا رد نشود . بنابراین هیچ وقت نمی توانیم یا نباید بگوییم فرض صفر را پذیرفته ایم، بلکه باید بگوییم فرض صفر را  رد نکرده ایم، زیرا شواهد موجود به اندازه ی کافی قوی نیستند . وقتی فرض صفر را رد نمی کنیم معنی آن این است که، مدارک وشواهد و کافی برای نتیجه گیری نداریم، یا شواهد کافی برای اینکه بگوییم این فرضیه غلط است، در دست نداریم . هنگامی که فرض صفررا رد نمی کنیم، باید در نتیجه گیریمان دقت کافی را مبذول داریم. مخصوصاً زمانی که حجم نمونه ی آماری ما کم باشد ، زیرا هنگامی که حجم نمونه ی آماری کم است توان کافی برای پیدا کردن اختلاف ها را نداریم . ولی هنگامی که حجم نمونه زیاد  است توان زیادی را برای تشخیص اختلاف ها و حتی اختلاف های کوچک داریم . فرض صفر در آمار شبیه اصل برائت درمجامع قضایی است، بدین صورت که ممکن است شخص را به اتهام قتل بازداشت کنند، ولی نتوانند دلایل و شواهد کافی برای محکوم کردن شخص پیدا کنند، ولی این پیدا نکردن شواهد دلیل بر بی گناهی شخص نیست، بلکه فقط نتوانسته اند شواهد کافی برای اثبات گناه کاربودن شخص پیدا کنند . پس فرض صفر همان فرض بی گناهی متهم است .  ۵ـ۲ـ۲ ـ فرضیه جانشین یا مخالف    : فرض مخالف را با H1 یا  A   H نشان می دهند . فرض مخالف همان فرضیه ی تحقیق است . اگر فرض صفر را رد کنیم، دلیلی برای رد فرضیه ی تحقیق نداریم و این بدین معنی است که  فرضیه ی ما رد نگشته است، ولی اثبات هم نشده است، چون ممکن است در آینده رد شود یا رد نشود . فرض مخالف همان فرضیه ی مجرم بودن متهم است . ۵ـ۳ـ آزمون معنی داری :   آزمون معنی داری به ما می گوید، آیا رابطه ای که بین متغیرهای مورد بررسی در نمونه ی آماری وجود دارد، در جامعه ی آماری هم همین را بطه وجود دارد یا خیر ، این رابطه ی مشاهده شده ناشی از تصادف و شانس  یا خطای نمونه گیری است . گاهی ممکن است که روش های همبستگی ، همبستگی بالایی را بین متغیرهای مورد بررسی نشان دهد، ولی آزمون های معنی داری ، این همبستگی را ناشی از شانس یا خطای نمونه گیری بداند.حال سوال  این است که چه کار باید کرد ؟ پاسخ ساده است، اولویت با آزمون های معنی داری است. حتی اگر همبستگی بالایی بین متغیرهای مورد بررسی هم وجود داشته باشد، ولی آزمون معنی داری این همبستگی را ناشی از شانس یا خطای نمونه گیری بداند ، باید از آزمونهای معنی داری پیروی کرد و به همبستگی بین متغیرها توجه زیادی نکرد . 

۵ـ۴ ـ انواع خطا : خطا بر دو نوع است که عبارتند از :الف ـ خطای نوع اول                     ب ـ خطای نوع دوم  ۵ـ۴ـ۱ـ خطای نوع اول   :  خطای نوع اول، خطای رد کردن است.  بدین معنی که      H0¬¬¬¬¬¬¬¬ ( مبنی بر عدم تفاوت یا ارتباط ) را نباید رد کنیم ، ولی ما آنرا رد می کنیم . آلفا(α)علامتی است که برای نشان دادن احتمال خطای نوع اول به کار می رود، به همین دلیل گاهی خطای نوع اول را خطای آلفا(a) هم می نامند. احتمال خطای نوع اول بستگی به نظر پژوهشگر و موضوع تحقیق دارد. به عبارت دیگر احتمال خطای نوع اول بستگی به سطح معنی داری (a) دارد ، بدین صورت که، وقتی پژوهشگر سطح معنی داری را ۰۵/۰تعیین می کند ، احتمال خطای نوع اول هم ۵ درصد است. یعنی در پنج درصد مواقع فرضیه ی صفر را که را نباید رد کنیم ، به اشتباه  رد می کنیم . هرچه سطح معنی داری را کوچکتر در نظر بگیریم احتمال خطای نوع اول هم کمتر می شود. پس هنگامی که سطح معنی داری را یک درصددر نظر بگیریم، احتمال خطای نوع اول کمتر از زمانی است که معنی داری را پنج درصد در نظر بگیریم . خطای نوع اول این است که متهم بی گناه ، محکوم به گناهکار بودن شود . برای کم کردن احتمال بروز خطای نوع اول باید حجم نمونه را افزایش داد .۵ـ۴ـ ۲ ـ خطای نوع دوم    : خطای نوع دوم، خطای پذیرفتن است. بدین معنی که ، هنگامی که فرض صفر غلط است و باید رد شود فرض صفر را رد نمی کنیم. یعنی درحالی که تفاوتی بین داده ها وجود دارد(رد فرض صفر )، ما به غلط نتیجه می گیریم که تفاوتی در داده ها وجود ندارد (پذیرش فرض صفر ) .  علامتی که برای نشان دادن احتمال خطای نوع دوم بکار می رود بتا (β) است ، به همین دلیل گاهی خطای نوع دوم را خطای بتا  می نامند . هرچه سطح معنی داری را کوچکتر در نظر بگیریم احتمال خطای نوع اول کاهش، ولی احتمال خطای نوع دوم افزایش          می یابد(البته در صورتی که حجم نمونه ثابت باشد. پس هنگامی که حجم نمونه ثابت باشد بین خطای نوع اول و نوع دوم رابطه ی معکوس وجود دارد ، یعنی افزایش احتمال خطای نوع اول باعث کاهش احتمال خطای نوع دوم وکاهش احتمال خطای نوع اول باعث افزایش احتمال خطای نوع دوم می شود . احتمال ارتکاب خطای نوع دوم به عواملی بستگی دارد که این عوامل عبارتند از :۱ـ حجم نمونه : هرچه حجم نمونه کمتر باشد احتمال ارتکاب خطای نوع دوم بیشتر است ، بنابراین برای اینکه احتمال ارتکاب خطای نوع دوم را کم کنیم، باید حجم نمونه راافزایش دهیم .زیرا با افزایش حجم نمونه، دقت تحقق افزایش می یابد و با افزایش دقت، مقدار خطا کاهش می یابد. ۲ـ سطح معنی داری : هرچه سطح معنی داری افزایش یابد، احتمال ارتکاب خطای نوع دوم کاهش می یابد زیرا بین احتمال ارتکاب خطای نوع اول و خطای نوع دوم را بطه ی معکوس وجود دارد(البته در صورتی که حجم نمونه ثابت باشد) و از آنجایی که احتمال ارتکاب خطای نوع اول برابر سطح معنی داری است، بنابراین هرچه سطح معنی داری را بزرگتر در نظر بگیریم احتمال ارتکاب خطای نوع دوم کاهش می یابد . ۳ـ  میزان تأثیر متغیرهای مستقل و میزان پراکندگی متغیر وابسته : هرچه تأثیر متغیرهای مستقل بیشتر باشد و متغیر وابسته پراکندگی (واریانس ) بیشتری داشته باشد احتمال ارتکاب خطای نوع دوم کاهش می یابد . ۴ـ اعتبار و قابلیت اعتماد ابزار اندازه گیری تحقیق : هرچه اعتبار و قابلیت اعتماد ابزار اندازه گیری تحقیق بیشتر باشد ، انحراف معیار کاهش می یابد و هرچه انحراف معیار متغیر مورد بررسی کوچکتر باشد ، توان آزمون بیشتر و احتمال ارتکاب خطای نوع دوم کمتر می شود . احتمال مرتکب شدن خطای نوع دوم آزمون های ناپارامتری بیشتر از آزمون های پارامتری است . توان یک آزمون احتمال قبول فرض مخالف ((H1است ، هنگامی که این فرض واقعاً درست است یا احتمال رد کردن فرض صفر است ، هنگامی که فرض صفر غلط است و مقداری آن بین صفر تا یک متغیر است . هرچه توان بیشتر باشد احتمال  رد کردن فرض صفری که غلط است بیشتر می شود . β  ـ  ۱  = توان آزمون  پس توان آزمون همان میزان قابلیت ممکن برای دور ماندن از خطای نوع دوم است . هر عاملی که موجب کاهش خطای نوع دوم شود ، توان آزمون را بالا می برد .هرچه توان یک آزمون بیشتر باشد احتمال ارتکاب خطای نوع دوم کمتر می شود و از آنجایی که توان آزمون های یک دامنه بیشتر از آزمونهای دو دامنه است بنابراین احتمال ارتکاب خطای نوع دوم ، آزمون های یک دامنه کمتر از آزمون های دو دامنه است .۵ـ نوع آزمون : رابطه ی بین فرض صحیح و فرضی که محقق پذیرفته در جدول ۵ـ۱ ارائه شده است . جدول ۵-۱-جدول رابطه ی بین فرض صحیح و فرض پذیرفته شده توسط محقق

۵ـ۵ ـ سطح معنی داری   : احتمال مرتکب شدن خطای نوع اول را سطح معنی می نامند و آنرا با a نشان می دهند . بنابراین سطح معنی داری برابر است با، احتمال خطای نوع اول . بدین معنی که اگر ۰۵/۰ =a باشد، احتمال خطای نوع اول هم ۵ درصد است . هرچند که سطح معنی داری اختیاری است و به نظر محقق بستگی دارد ، ولی معمولا در علوم رفتاری سطح معنی داری قابل قبول را ۰۵/۰ یا ۰۱/۰ در نظر می گیرند . اگر سطح معنی داری ۰۵/۰ باشد معنی آن این است که در ۹۵ مورد از ۱۰۰ مورد نمونه ما ، رابطه ی مشاهده شده واقعی است ودر ۵ مورد از ۱۰۰ مورد رابطه ی مشاهده شده ناشی از شانس و تصادف است.  به عبارت دیگر پنج درصد از پیامدها منجر به رد فرضیه صفر (H0)می شود. در نرم افزارهای آماری برای اینکه در مورد نتیجه ی بدست آمده نتیجه گیری شود، علاوه بر محاسبه و ارائه ی آماره ی آزمون ، عددی تحت عنوان sig ( یا p-value) ارائه می شود .به کمک این sig دیگر احتیاجی به مراجعه به جداول آماری نیست . این sig ( یا p-value ) کمترین مقدار a است که می توان فرضیه ی صفر را رد کرد . هرچه مقدار sig کمتر باشد ، شواهد قوی تری علیه فرضیه ی صفر وجود دارد و اطمینان  ما به درست بودن فرضیه ی مخالف و در نتیجه رابطه ی مشاهده شده بین متغیرها بیشتر است. مثلاً، هنگامی که در سطح معنی داری ۰۱/۰ رابطه ی بین دومتغیر تأیید شود و در مورد دومتغیر دیگر رابطه ی بین آنها در سطح ۰۵/۰ تأیید شود، اطمینان به وجود رابطه ی بین دو متغیر اول بیشتر از رابطه ی بین دو متغیر دوم است . هنگامی کهsig مساوی یا کمتر از سطح معنی داری (۰۵/۰ یا ۰۱/۰ یا … ) باشد، فرض صفر رد می شود و نتیجه می گیریم که با احتمال ۹۵( یا ۹۹) درصد اطمینان بین متغیرها رابطه ی معنی دار وجود دارد . ولی اگر مقدار عددی sig بیشتر از سطح معنی داری باشد ، فرض صفر را نمی توانیم رد کنیم بنابر این نتیجه می گیریم که با ۹۵( یا ۹۹) درصد اطمینان رابطه ی ( یا همبستگی ) بین متغیرها معنی دار نیست پس دلیلی بر درست بودن فرضیه ی تحقیق نداریم . سطح معنی داری راگاهی سطح اطمینان  ، سطح اعتماد یا مرز اهمیت نیز می نامند .  ۵ـ۶ ـ ناحیه ی بحرانی    : ناحیه ای است که اگر پیامدها در آن قرار گیرند، باید فرضیه صفر  (H0)را رد کنیم به همین علت گاهی ناحیه رد(rejection  region )نامیده می شود . ناحیه بحرانی به وسیله ی سطح معنی داری  (a)مشخص می شود. مثلاً اگر سطح معنی داری برابر با یک در صد (α=%۱)  باشد ، معنی آن این است که فقط یک درصد پیامدها منجر به رد فرض صفر        می شود . ۵ـ۷ ـ آزمون یک دامنه و دو دامنه : ۵ـ۷ـ۱ ـ آزمون یک دامنه  : فرضیه ای مستلزم آزمون یک دامنه است که، در آن جهت رابطه یا اختلاف صفت مانند افزایش یا کاهش ، کمتر یا بیشتر ، مثبت یا منفی بودن و … مورد نظر باشد مانند فرضیه های زیر :  ۱ـ مردان بیشتر از زنان گرایش به انحراف دارند . ۲ـ بین میزان تحصیلات پاسخگویان و گرایش آنان به انحراف رابطه ی منفی و معنی دار وجود دارد . در آزمون یک دامنه چون یک ناحیه برای رد فرض صفر وجود دارد و ناحیه ی بحرانی از یک بخش تشکیل شده است، جهت داراست . معنی جهت دار بودن این است که مثبت یا منفی بودن             رابطه ی، تغییرات مقدارهای بین دو متغیر را نشان می دهد . آزمون یک دامنه شامل آزمون چپ دامنه و آزمون راست دامنه است . آزمون راست دامنه آزمونی است که ناحیه ی بحرانی در منتهی الیه سمت راست منحنی قرار دارد (مانند ۵ـ۲ و ۵ـ۴ ) آزمون کروسکال ـ والیس یک آزمون راست دامنه است . آزمون چپ دامنه ، آزمونی است که ناحیه بحرانی در منتهی الیه سمت چپ منحنی قرار دارد        (مانند ۵ـ۱ و ۵ـ۳ ) .احتمال یک آزمون یک دامنه، دو برابر احتمال یک آزمون دو دامنه است. یعنی اگر با اندازه ی  t یک درصد  در یک آزمون یک دامنه قضاوت کنیم باید از اندازه ی tدو درصد  استفاده کنیم ویا اگر با اندازه ی  tپنج درصد در یک آزمون یک دامنه قضاوت کنیم باید از اندازه  یt   ده درصد استفاده کنیم . 

۵ـ۷ـ۲ ـ آزمون دو دامنه  :اگر هدف یک آزمون مشخص کردن رابطه یا تفاوت بین دومقدار ( مساوی یا عدم مساوی بودن ) ، بدو ن توجه به جهت تغییرات آنها باشد ، مستلزم آزمون دو دامنه است . آزمون دو دامنه غیر جهت دار است . معنی غیر جهت دار بودن این است که، میزان رابطه یا تغییرات بین متغیرها را بدون نشان دادن جهت آنها ( مثبت یا منفی بوده ) نشان می دهد . مثل فرضیه ی ، هوش افراد ورزشکار و افراد غیر ورزشکار تفاوت معنی داری وجود دارد . زمانی از فرضیات غیر جهت دار استفاده می شود که، محقق از جهت رابطه یا تفاوت بین متغیر مستقل و متغیر وابسته آگاه نباشد و جهت رابطه ی متغیرها در تحقیقات قبلی متناقض هم باشند. یعنی در یک تحقیق رابطه ی بین متغیرها مثبت و در تحقیق دیگر منفی بدست آمده باشد . در آزمون دو دامنه ، ناحیه ی بحرانی از دو بخش تشکیل شده است، که یکی در منتهی الیه سمت راست منحنی و دیگری در منتهی الیه سمت چپ منحنی قرار دارد  . بعبارت دیگر در آزمون دو دامنه دو، ناحیه ی برای فرض صفر وجود دارد . ناحیه بحرانی برای آزمون دو دامنه به ازای ۰۱/۰a =   و ۰۵/۰a = در شکل ۵ـ۵ و ۵ـ۶ ارائه شده است . 

۶ـ ۱ ـ آزمون نرمال بودن متغیرها : برای اینکه ببینیم توزیع متغیر مورد بررسی در جامعه نرمال است یا خیر ، دو راه پیش رو داریم : الف ـ استفاده از تجربه ی دیگران و تحقیقات قبلی. ب ـ با استفاده از یک آزمون مقدماتی  در جامعه ی آماری ، آزمون نرمال بودن متغیرها را انجام دهیم . آزمون نرمال بودن باتوجه به سطح سنجش متغیرهای مورد بررسی متفاوت است .این آزمونها عبارتند از : الف ـ آزمون نرمال بودن برای متغیرهای اسمی ، آزمون مربع خای (x2) است . ب ـ آزمون نرمال بودن برای متغیرهای ترتیبی ، آزمون کلموگوروف ـ اسمیرنوف است . ج ـ آزمون نرمال بودن برای متغیرهای فاصله ای و نسبی ، آزمون های خطای استاندارد میانگین و آزمون T استیودنت است . ۶ـ۲ ـ آزمون نرمال بودن متغیرهای اسمی : آزمون نرمال بودن متغیرهای اسمی ، آزمون مربع خای است که توسط یک آماردان انگلیسی بنام سرکارل پیرسون  در سال ۱۹۰۰ میلادی بکاربرده شده است . (این آزمون را در قسمت آمار استنباطی مناسب برای متغیرهای اسمی توضیح خواهیم داد .) ۶ـ۳ ـ آزمون نرمال بودن متغیرهای ترتیبی : آزمون نرمال بودن متغیرهای ترتیبی ، آزمون کلموگوروف ـ اسمیرنوف است که توسط یک ریاضی دان روسی بنام کلموگوروف   در سال ۱۹۳۳ پیشنهاد شده است .  این آزمون بر دو نوع است :الف ـ آزمون یک نمونه ای کلموگوروف ـ اسمیرنوف .ب ـ آزمون دو نمونه ای کلموگوروف ـ اسمیرنوف .۶ـ۳ـ۱ـ آزمون یک نمونه ای کلموگوروف ـاسمیرنوف : در متغیرهای ترتیبی، هنگامی که حجم نمونه کمتر از ۴۰ باشد، امکان اینکه فراوانی های مورد انتظار کوچکتر از ۵ باشد زیاد است. درچنین مواقعی بجای استفاده از آزمون کی دو، از آزمون یک نمونه ای کلموگوروف ـ اسمیرنوف استفاده می شود .فرمول آزمون یک نمونه ای کلموگوروف ـ اسمیرنوف عبارت است از : 
  =Dc مقدار محاسبه شده .  فراوانی تجمعی نسبی محاسبه شده            =فراوانی تجمعی نسبی مورد انتظار اگر مقدار محاسبه  (مقدار جدول ) باشد، فرض صفر را ردمی کنیمو اگر   باشدفرض صفر را می پذیریم . مقدار Dt  هم با استفاده از حجم نمونه و سطح معنی داری و به روش زیر بدست می آید :  برای پیدا کردن این مقادیر از جدول شماره ی یک استفاده می شود. در این جدول ، مقادیر D برای حجم تا ۳۵ نمونه آورده شده است . اگر حجم نمونه ۳۵ یا کمتر ۳۵ باشد، مقادیر جدول را با مقدار محاسبه شده مقایسه می کنیم، ولی اگر حجم نمونه ی بیشتر از ۳۵ موردباشد از سطر over 35   و با استفاده از فرمولهای ارائه شده در این سطر مقادیر جدول را محاسبه می کنیم . مثلاً با ۹۵ درصد اطمینان و حجم نمونه ی ۲۰۰ مقدار Dt  عبارت است از :   فرض صفر در آزمون یک نمونه ای کلموگوروف ـاسمیرنوف این است که، بین فراوانی های مشاهده شده و فراوانی های مورد انتظار تفاوتی وجود ندارد. به عبارت دیگر توزیع جامعه نرمال است. و فرض مخالف در این آزمون این است که که بین فراوانی های مورد مشاهده و فراوانی های مورد انتظار تفاوت وجود دارد. بعبارت دیگر توزیع جامعه نرمال نیست . توان آزمون یک نمونه ای کلموگوروف ـ اسمیرنوف بعلت اینکه در آن فراوانی های مشاهده شده به صورت جداگانه بکاربرده می شوند ، بیشتر از آزمون کی دو است . مثال ـ از ۲۰۰ دانشجو راجع به میزان  رضایت از درآمدخانواده سوال شده است که نتایج آن در زیرارائه شده است .  سوال این است که آیا میزان رضایت دانشجویان از درآمد خانواده یکسان است یاخیر ؟ 

میزان رضایت از درآمدخانواده فراوانی مشاهده شده (ni)   فراوانی مورد انتظار (nith)    Dخیلی کم 
کم 
تاحدودیزیاد 
خیلی زیاد ۵۰
۴۰
۷۰۲۰
۲۰ ۴۰
۴۰
۴۰۴۰
۴۰ ۵۰
۹۰
۱۶۰۱۸۰
۲۰۰ ۴۰
۸۰
۱۲۰۱۶۰
۲۰۰        
جمع ۲۰۰
                           تفسیر : با توجه به نتایج بدست آمده نتیجه می گیریم که با ۹۵ درصد اطمینان یکسان بودن رضایت دانشجویان از درآمدخانواده رد می شود . (رد فرض صفر ) بعبارت دیگر توزیع نرمال نمی باشد . 

روش اجرای آزمون یک نمونه ای کلموگوروف ـ اسمیرنوف  : ۱ـ منو analyze و سپس فرمان nonparametric test را کلیک می کنیم . ۲ـ فرمان۱-sample k-sراانتخاب می کنیم تاپنجره ی one-sample kolmogorov-smirnov test برای اجرای آزمون باز شود .۳ـ در این پنجره متغیر مورد نظر را به قسمتtest variable list : منتقل کرده و سپس روی گزینه ی   norml در قسمت   test distribution کلیک می کنیم . ۴ـ گزینه ی continue و سپس ok را کلیک می کنیم. روش تفسیرخروجی :الف  ـ راه اول این است که به مقدار kolmogorov- smirnov z در جدول نگاه می کنیم ، اگر مقدار آن کوچکتر از ۹۶/۱ + و بزرگتر از ۹۶/۱- بود (بین ۹۶/۱ ± ) نتیجه می گیریم، با ۹۵ درصد اطمینان بین فراوانی های مشاده شده و مورد انتظار تفاوتی وجود ندارد. به عبارت دیگر توزیع جامعه نرمال است. ولی اگر مقدار آن کوچکتر از ۹۶/۱ – و یا بزرگتر از ۹۶/۱+ بود نتیجه می گیریم، با ۹۵ درصد اطمینان بین فراوانی های مشاهده شده و مورد انتظار تفاوت وجود دارد ، بعبارت دیگر توزیع جامعه نرمال نیست . ب ـ راه دوم این است که به مقدار Asymp.sig.(2 tailed) نگاه کنیم اگر مقدار آن کمتر از ۵٫/ . بود ، نتیجه می گیریم توزیع جامعه نرمال نیست . ولی اگر مقدار آن بیشتر از ۵٫/ . بود ، نتیجه          می گیریم، توزیع جامعه نرمال است .  ۶ـ۳ـ۲ ـ آزمون دو نمونه ای کلموگوروف ـ اسمیرنوف :آزمون دو نمونه ای کا – اس    (k-s)  برای متغیرهای ترتیبی که بین ۷ـ۳ مقوله داشته باشند و حجم نمونه (n) برای هرعضوآن بیشتر از ۴۰ نمونه باشد، مورد استفاده قرار می گیرد . اگر حجم نمونه ها کمتر از ۴۰ باشد، باید حتماً حجم نمونه ها با هم برابر باشند  .این آزمون هم در فرضیه های یک دامنه وهم دو دامنه مورد استفاده  قرار می گیرد وکارایی آن در این آزمون ۹۰-۸۵ درصد آزمون تی استیودنت است . در این آزمون احتمال وقوع آماره ی Dدر مورد فرضیه های یک دامنه (جهت دار ) با درجه آزادی    از روی توزیع مربع خای (جدول شماره ی ۳) و بر اساس فرمول زیر محاسبه می شود .  ولی در این آزمون احتمال وقوع آماره ی D درمورد فرضیه های دو باله از روی توزیع مقدارهای D (جدول شماره ۲ ) محاسبه می شود . مراحل اجرای این آزمون در فرضیه های دودامنه به صورت زیر انجام می گیرد . ۱ـ ابتدا فراوانی تراکمی هرگروه را محاسبه می کنیم. فراوانی تراکمی با جمع زدن فراوانی هر طبقه، با طبقات ماقبل آن طبقه بدست می آید . ۲ـ سپس درصدفراوانی تراکمی هر کدام از گروه ها را محاسبه می کنیم. درصدفراوانی تراکمی به صورت زیر  محاسبه می شود:                                                                    فراوانی تراکمی هر طبقه                                                          ۱۰۰×                                                 درصد فراوانی تراکمی                                                                             تعداد کل ۳ـ در مرحله ی بعد درصد فراوانی تراکمی گروه اول را از درصد فراوانی تراکمی گروه دوم           تفریق می کنیم. ۴ـ قدر مطلق بیشترین تفاوت (صرف نظر از علانت منفی یا مثبب آن )را مشخص می کنیم. سپس مقدار حداکثر تفاوت مشاهده شده بین گروه ها را از فرمول زیر مشخص می کنیم.
  
DC=حداکثر تفاوت مشاهده شده بین گروهها =Cpn1 درصد فراوانی نسبی تراکمی گروه اول Cpn2 = درصد فراوانی نسبی تراکمی گروه دوم ۵ـ مقدار حداکثر تفاوت مشاهده شده بین گروهها (DC) را با عددجدول K-S دو نمونه ای مقایسه می کنیم. مقدار بحرانی برای D در سطح معنی داری ۰۵/۰ از فرمول  ودر سطح ۰۱/۰ از فرمول   بدست می آید . n1= حجم نمونه ی گروه اول n2=حجم نمونه ی گروه دوم Dt= مقدار بحرانی جدول مقدار بحرانی به ما می گوید که، تا مقدار بحرانی را می توان ناشی از تصادفی بودن دانست . اگر حداکثر تفاوت مشاهده شده بین گروه های مورد مطالعه (DC)،  کوچکتر از مقدار بحرانی جدول (Dt) باشد، فرض صفر پذیرفته می شود و نتیجه می گیریم تفاوت بین گروهها وجود ندارد . ولی اگر حداکثر تفاوت مشاهده شده بین گروهها (DC) بیشتر از مقدار بحرانی جدول (Dt) باشد، فرض صفر را رد می کنیم و نتیجه می گیریم تفاوت بین گرو هها وجود دارد .مثال ـ از ۱۶۰ دانشجو دختر و پسر راجع به میزان رضایت از رشته تحصیلی شان سوال شده است که نتیجه ی آن در زیر ارائه شده است .  گروه اول (دختران ) گروه دوم (پسران ) خیلی زیاد ۲۰ ۱۵زیاد ۲۵ ۲۰تاحدودی ۱۰ ۲۵کم ۱۵ ۱۰خیلی کم ۱۰ ۰حال این است که آیا میزان رضایت این دوگروه از رشته تحصیلی شان یکسان است ؟ 

جدول ۶ـ۲ ـ جدول میزان رضایت پسران و دختران از رشته تحصیلی خود CPn1                           cf            F1   دختران (درصدفراوانی     (فراوانی              فراوانیتراکمی)             تراکمی )           گروه دوم   CPn2                                cf               F2     پسراندرصدفراوانی)   (فراوانی            فراوانی                                                                                                                             تراکمی)             تراکمی)            گرو ه دوم     CPn1-CPn2 DC           خیلی زیادزیادتاحدودیکم خیلی کم   ۲۵/۰                       ۲۰                     ۲۰  ۵۶/۰                        ۴۵                    ۲۵۶۸/۰                       ۵۵                     ۱۰۸۷/۰                      ۷۰                      ۱۵۱                               ۸۰                    ۱۰         ۱۸/۰                     ۱۵                        ۱۵۴۳/۰                     ۳۵                        ۲۰۷۵/۰                    ۶۰                         ۲۵۸۷/۰                    ۷۰                         ۱۰  ۱                          ۸۰                         ۱۰ ۰۷/۰۱۳/۰۰۷/۰-۰۰/۰۰۰/۰
۱۳/۰                                                        ۸۰                                                         ۸۰                
مقدار بحرانی D به ازای a=0.05  عبارت است از :  این عدد به ما می گوید تا اختلاف ۲۱/۰ ناشی از تصادف و شناس است . چون     است، با این شواهد و مدارک دلیلی بر درست بودن فرضیه ی تحقیق (تفاوت به میزان رضایت پسران و دختران نسبت به رشته تحصیلی) نداریم، بنابراین فرض صفر را     نمی توانیم رد کنیم . پس نتیجه می گیریم، بین میزان رضایت از رشته تحصیلی در بین پسران و دختران تفاوتی وجود ندارد . حال فرضیه ی یک دامنه (میزان رضایت ازرشته تحصیلی در پسران بیشتر از دختران است ) را با احتمال۰۵/۰ a=  آزمون می کنیم .                                               چون فرضیه ی یک دامنه را می خواهیم آزمون کنیم و جدول شماره ی سه در مورد فرضیه های دو دامنه به کار می رود ، بنابراین باید احتمال ۱۰/۰ را مورد استفاده قرار دهیم، زیرا احتمال یک آزمون یک دامنه ، دو برابر احتمال یک آزمون دو دامنه است . از آنجا که مقدار جدول (۶۰/۴) بزرگتر از مقدار x2 محاسبه شده (۷۰/۲)است، فرضیه ی جهت دار، که طبق آن پسرها رضایت بیشتری از رشته تحصیلی شان نسبت به دخترها دارند، رد می شود . روش اجرای آزمون دو نمونه ای کلموگوروف ـ اسمیرنوف :۱ـ منو analyze و سپس فرمان nonparametric را کلیک می کنیم . ۲ـ فرمان ۲- independent samples  را کلیک می کنیم تا پنجره آن باز شود . ۳ـ در این پنجره متغیر وابسته را به بخش test variable list : منتقل کرده و سپس در قسمت  test type گزینه ی kolmogorov -smirnov z  را کلیک می کنیم. ۴ـ متغیر مستقل را به بخش  grouping variableمنتقل کرده و سپس روی گزینه ی         define groups کلیک می کنیم. ۵ـ دراین پنجره ، کدهای مربوط به هرکدام از گروه ها را وارد می کنیم. ۶ـ روی گزینه ی continue و سپس ok کلیک می کنیم. نحوه ی تفسیر خروجی : به قسمت Asymp.sig(2-tailed)  نگاه کنید اگر مقدار آن از ۰۵/۰ کمتر بود با ۹۵ درصد اطمینان تفاوت بین گروهها را نتیجه بگیرید ولی اگر مقدار عددی آن از ۰۵/۰ بیشتر بود با ۹۵ درصد اطمینان برابری گروهها را نتیجه بگیرید . ۶ـ۴ـ آزمون نرمال بودن متغیرهای فاصله ای و نسبی : آزمون نرمال بودن متغیرهای فاصله ای و نسبی آزمون تی استیودنت و آزمون اشتباه استاندارد میانگین است .(آزمون تی استیودنت در قسمت آمار استنباطی مناسب برای یک متغیر اسمی و یک متغیر فاصله ای توضیح داده         خواهد شد .) ۶ـ۴ـ ۱ ـ آزمون اشتباه استاندارد میانگین  یا خطای معیار میانگین :  برای اینکه ببینیم آیا میانگین برآورد شده ی نمونه ی ما، با میانگین جامعه ای که نمونه را از آن انتخاب        کرده ایم، تفاوت دارد یا خیر، از آزمون اشتباه استاندارد میانگین استفاده  می کنیم . ما نمی توانیم اشتباه استاندارد میانگین جامعه را بدست آوریم ، بنابراین سعی می کنیم با مقداری خطا آن را از طریق اشتباه استاندارد میانگین نمونه برآورد کنیم . هرچه حجم نمونه ی ما بیشتر باشد ، اشتباه استاندارد میانگین کوچکتر می شود و میانگین نمونه ی آماری بامیانگین جامعه ی آماری با اطمینان بیشتری مطابقت خواهد کرد .میانگین نمونه را با    و میانگین جامعه را با μ و اشتباه استاندارد میانگین در نمونه را با s    ودر جامعه را با    σنمایش می دهند . روش محاسبه ی اشتباه استاندارد میانگین بستگی به حجم نمونه و جامعه آماری دارد . این روش ها عبارتند از : الف ـ روش محاسبه اشتباه استاندارد میانگین هنگامی که نسبت حجم نمونه به حجم جامعه کمتر از پنج درصد  باشد عبارت است از :                                                            ( اشتباه استاندارد میانگین در نمونه ) n = حجم نمونه                   s = انحراف معیار نمونه 
                                        = σ    ( اشتباه استاندارد میانگین در جامعه )                                                  =(میانگین جامعه آماری )      = میانگین نمونه آماری d   = فاصله اطمینان       فاصله اطمینان در نمونه    فاصله اطمینان در جامعه ب ـ روش محاسبه اشتباه استاندارد میانگین هنگامی که نسبت حجم نمونه به جامعه پنج درصد یا بیشتر باشد : N                                                        = حجم جامعه آماری                                                                                                                                                                                                                          روش های محاسبه ی اشتباه استاندارد میانگین در جدول ۶ـ۳ ارایه شده است . جدول ۶ـ۳ جدول محاسبه ی اشتباه استاندارد میانگین در نمونه و جامعه هنگامی که  هنگامی که  
  
   
مثال ـ از یک دانشگاه تعداد ۸۱ دانشجو بصورت تصادفی انتخاب شد که میانگین قد آنها ۱۷۰ سانتیمتر و انحراف استاندارد قد آنها ۱۸ سانتیمتر بود . حال می خواهیم ببینیم قد این ۸۱ نفر در چه فاصله ای از میانگین قد کلیه دانشجویان این دانشگاه قرار دارد .  
با ۲۶/۶۸  در صد اطمینان میانگین جامعه بین  ۱۷۲< μ< 168قرار دارد یعنی (۲)(۱)  ±۱۷۰ با ۹۵ در صداطمینان میانگین جام بین ۹۲/۱۷۳< μ < 08/166  قراردارد یعنی (۲)(۹۶/۱) ±۱۷۰با ۵/۹۵  در صد اطمینان میانگین جامعه بین  ۱۷۴< μ < 166قرار دارد یعنی (۲)(۲)± ۱۷۰با۹۹  در صداطمینان میانگین جامعه بین ۱۶/۱۷۵< μ < 84/164قرار دارد یعنی (۲)(۵۸/۲)± ۱۷۰با۷۳/۹۹  در صد اطمینان میانگین جامعه بین  ۱۷۶< μ < 164قرار دارد یعنی (۲)(۳)± ۱۷۰با۹/۹۹ در صداطمینان میانگین جامعه بین ۵۸/۱۷۶< μ <42/163 قرار داردیعنی (۲)(۲۹/۳)±۱۷۰یعنی با یک دهم درصد اطمینان، میانگین جامعه در فاصله ی بیشتر یا کمتر از ۵۸/۶                 (۵۸/۶±= ۲× ۲۹/۳) از میانگین نمونه ی( ۱۷۰)ما خواهد بود . روش اجرای آزمون اشتباه استاندارد میانگین : ۱ـ بر روی منو analyze  وسپس فرمان descriptive statistics  کلیک می کنیم . ۲ـ بر روی فرمان frequencies کلیک کنید تا پنجره آن باز شود . در این پنجره متغیر مورد نظر را به بخش variable(s)  منتقل می کنیم. ۳ـ گزینه ی statistics را کلیک می کنیم تا پنجره ی آن باز شود . ۴ـ گزینه ی S.E.mean در قسمت dispersion را کلیک می کنیم. ۵ـ گزینه ی continue و سپس  ok را کلیک می کنیم. 

۷ـ۱ تحلیل یک متغیری  : اگر بخواهیم ویژگی های یک متغیر مثل سن یا تحصیلات را توصیف کنیم از تحلیل یک متغیری استفاده می کنیم . کارهایی را که می توان در تحلیل یک متغیری انجام داد در زیر ارائه شده است . متغیر فاصله ای و نسبی متغیر ترتیبی متغیر اسمی جدول توزیع فراوانی جدول توزیع فراوانی جدول  توزیع فراوانی روش تحلیل ۱ـ انحراف معیار ۲ـ واریانس ۳ـ انحراف متوسط ۴ـ کشیدگی ۴ـ کجی ۶ـ چارک ۷- دامنه تغییرات           ۸- نمره های استاندارد
 میانگین ۱ـ دامنه دهکی یا دهدهی 

 میانه ۱ـ ضریب تغییرات ۲ـ شاخص تغییر پذیری کیفی (I.Q.V)  

۱ـ نما 

۱ـ هیستوگرام ۲ـ فراوانی تراکمی۳ـ چندضلعی۴ـ شاخه وبرگ ۵ـ جعبه ای ۱ـ میله ای ۲ـ دایره ای ۱- ۱- میله ای۲- ۲- دایره ای

۷ـ۲ ـ روش تحلیل مناسب برای یک متغیراسمی : روش تحلیل مناسب برای یک متغیر اسمی،جدول توزیع فراوانی است . ۷ـ۲ـ۱ ـ جدول توزیع فراوانی   : جدولی است که برای خلاصه کردن ، سازمان دادن و کاهش داده های یک متغیر بکار برده می شود . از طریق جدول توزیع فراوانی می توانیم تشخیص دهیم که پاسخ های جمعیت نمونه چگونه میان مقولات هر متغیر توزیع شده است . همچنین از جدول توزیع فراوانی برای یافتن اشتباهات در داده های اطلاعاتی استفاده  می شود. مثلاً، اگر کد غلطی را وارد کرده باشیم، با مطالعه ی جدول توزیع فراوانی به راحتی می توان به وجود این کد غلط پی برد و قبل از تحلیل داده ها این کد غلط را اصلاح نمود .جدول توزیع فراوانی گرچه می تواند یک متغیری، دو متغیری یا چند متغیری  باشد و برای هر نوع متغیری ( اسمی ، ترتیبی ، فاصله ای و نسبی )  بکار برده شود، ولی اگر تعداد مقولات پاسخ ها زیاد باشد ، این جدول کارایی کمی خواهد داشت . ۷ـ۲ـ۱ـ۱ـ جدول توزیع فراوانی برای متغیرهای اسمی و ترتیبی : هنگاهی که متغیر مورد بررسی اسمی یا ترتیبی است ،  جدول توزیع فراوانی از چهار ستون تشکیل می شود که عبارتند از : الف ـ ستون اول شامل متغیر و مقوله های آن ب ـ ستون دوم شامل فراوانی هر مقوله ج ـ ستون سوم شامل  نسبت هر مقوله د ـ ستون چهارم شامل درصد هر مقوله مثال ـ فرض کنید در  یک تحقیق جنسیت بعنوان یک متغیر ( سوال ) مورد مطالعه قرار گرفته است . در این تحقیق تعداد نمونه ها شامل چهل زن و شصت مرد بوده اند .جدول توزیع فراوانی این متغیر در جدول زیر ارائه شده است .

                                  جدول ۷ـ۱ جدول توزیع پاسخگویان بر حسب جنسیت            جنسیت   فراوانی) (fi نسبت)    (pi درصد (p%)                   زن              ۴۰               ۴/۰                  ۴۰                 مرد            ۶۰               ۶/۰                  ۶۰                    جمع           ۱۰۰                ۱                 ۱۰۰                                                                               هنگام نوشتن جدول توزیع فراوانی باید نکات زیر را رعایت کرد: ۱ـ شماره ی جدول ذکر شود .۲ ـ عنوان جدول ذکر شود .۳ ـ عنوان ستونهای جدول ذکر شود.۴ ـ در صورتی که داده ها از جایی اخذ شده است،  مأخذ داده ها حتماً ذکر شود .۵ ـ مقوله های هر متغیر به طور کامل شرح داده شود .۶ ـ تعداد کل ذکر شود .همچنین هنگام بررسی جدول توزیع فروانی باید به نکات زیرتوجه نمود :۱ـ مواردی که هنگام نوشتن جدول توزیع فراوانی باید رعایت گردد، تماماً رعایت شده باشد .۲ـ به شکل توزیع نگاه کنید ،ببینید  آیا توزیع چولگی دارد یا خیر و اگر توزیع دارای چولگی است ، چولگی آن منفی است یا مثبت . اگر اکثر پاسخگویان در قسمت بالای جدول متمرکز باشند، توزیع دارای چولگی منفی است، ولی اگر اکثر پاسخگویان در پایین جدول جمع شده باشند، توزیع دارای چولگی مثبت است . ۳ـ نگاه کنید ، ببینید پاسخ ها در یک مقوله تمرکز دارند یا در چند مقوله و آن مقوله یا               مقوله هاکدامند .۷ ـ ۲ ـ ۱ ـ ۲ ـ جدول توزیع فراوانی برای متغیر های فاصله ای و نسبی : جدول توزیع فراوانی برای متغیر ها فاصله ای و نسبی شامل جدول توزیع فراوانی طبقه بندی نشده و جدول توزیع فراوانی طبق بندی شده می باشد .۷ ـ ۲ ـ ۱ ـ ۲ ـ ۱ ـ جدول توزیع فراوانی ساده یا طبقه بندی نشده : هنگامی باید از جدول توزیع فراوانی ساده استفاده کرد که داده ها دارای دو شرط زیر باشند : الف ـ تعداد اعداد ( داده ها ) متغیر مورد بررسی کم باشد .ب ـ تفاضل بین بزرگترین و کوچکترین عدد کمتر از ۲۰ باشد .

مراحل ترسیم جدول توزیع فراوانی ساده : ۱ ـ تهیه ی جدول : ابتدا جدولی با چند ستون شامل ستون متغیر ، ستون خط نشان ،  ستون فراوانی مطلق ، ستون فراوانی نسبی ، ستون درصد فراوانی نسبی ، ستون فراوانی تراکمی و ستون درصد فراوانی تراکمی رسم می کنیم .در ستون متغیر ، نام متغیر و در خانه های آن به ترتیب از بالا رو به پایین اعداد متغیر را بصورت صعودی یا نزولی می نویسیم. ۲ – ستون خط نشان   : در زیر ستون خط نشان و در مقابل هر عدد به اندازه ی تعداد دفعاتی که اعداد طبقه ( یا هر عدد ) تکرار شده، خط نشان می کنیم.ستون خط نشان اختیاری است و می  توان آن را  در جدول توزیع فراوانی ارائه نکرد.۳ ـ ستون فراوانی مطلق : فراوانی مطلق تعداد مشاهدات هر متغیر را نشان می دهد و آنرا با F ( مخفف frequency) نشان می دهند .در این ستون به تعداد خط نشان های هر طبقه در مقابل همان طبقه عدد قرارمی دهیم. حاصل جمع این ستون برابربا تعداد کل نمره هاست .    .۴ـ ستون فراوانی نسبی : فراوانی نسبی ، نسبت فراوانی مطلق هر طبقه به کل فراوانی هاست، که با f نشان داده می شود . ۵ـ ستون درصد فراوانی نسبی : برای بدست آوردن درصد فراوانی نسبی ، فراوانی نسبی هر طبقه را بر کل فراوانی ها تقسیم می کنیم ، سپس نتیجه ی بدست آمده را در عدد ۱۰۰ ضرب         می نماییم . ۶ـ ستون فراوانی تراکمی : فراوانی تراکمی هر طبقه عبارت است از: مجموع فراوانی های آن طبقه با تمام طبقات قبل از آن . ۷ـ ستون درصد فراوانی تراکمی : برای بدست آوردن درصد فراوانی تراکمی ، فراوانی تراکمی هر طبقه را، بر کل فراوانی ها تقسیم می کنیم، سپس نتیجه ی بدست آمده را در عدد ۱۰۰ ضرب می نماییم . 

از درصد فراوانی تراکمی می توان برای مقایسه ی توزیع فراوانی تراکمی با حجم های نامساوی استفاده کرد . مثال ـ نمرات آمار ۲۵ دانشجو در زیر ارائه شده است . ،۹ ، ۱۷، ۱۵، ۱۳،۱۶، ۱۲ ، ۱۵ ، ۲۰ ، ۱۲ ، ۱۹ ، ۲۰ ، ۱۲ ، ۱۶  ، ۱۴ ، ۸ ، ۱۱ ، ۱۶ ، ۱۲ ، ۱۰ ، ۱۸ ، ۱۵                                                                                                                            ۱۳، ۱۳ ، ۱۷ ، ۱۵ جدول  توزیع فراوانی این نمرات در جدول ۷ـ۲ ارائه شده است . 

جدول۷ـ۲ جدول توزیع نمرات درس آمار دانشجویاننمرات آمار خط نشان فراوانی مطلق (F) فراوانی نسبی  P درصد فراوانی نسبی  Pدرصد فراوانی تراکمی  (fci)   درصد فراوانی تراکمی Pدرصد۸ ۱ ۰۴/۰ ۴% ۱ ۴%
۹ ۱ ۰۴/۰ ۴% ۲ ۸%
۱۰ ۱ ۰۴/۰ ۴% ۳ ۱۲%
۱۱ ۱ ۰۴/۰ ۴% ۴ ۱۶%
۱۲ ۴ ۱۶/۰ ۱۶% ۸ ۳۲%
۱۳ ۳ ۱۲/۰ ۱۲% ۱۱ ۴۴%
۱۴ ۱ ۰۴/۰ ۴% ۱۲ ۴۸%
۱۵ ۴ ۱۶/۰ ۱۶% ۱۶ ۶۴%
۱۶ ۳ ۱۲/۰ ۱۲% ۱۹ ۷۶%
۱۷ ۲ ۰۸/۰ ۸% ۲۱ ۸۴%
۱۸ ۱ ۰۴/۰ ۴% ۲۲ ۸۸%
۱۹ ۱ ۰۴/۰ ۴% ۲۳ ۹۲%
۲۰ ۲ ۰۸/۰ ۸% ۲۵ ۱۰۰%
۷ـ۲ـ۱ـ۲ـ۲ ـ جدول توزیع فراوانی طبقه بندی شده : هنگامی که تعداد داده ها زیاد باشد و تفاضل بین بزرگترین و کوچکترین عدد بیشتر از ۲۰ واحد باشد، باید از جدول توزیع فراوانی طبقه بندی شده استفاده کنیم . 

مراحل ترسیم جدول توزیع فراوانی طبقه بندی شده : ۱ـ تهیه جدول : ابتدا جدولی با چند ستون با عنوان های ستون طبقات ، ستون خط نشان ، ستون حدود واقعی طبقات ، ستون نقطه میانی طبقات ، ستون فراوانی مطلق ، ستون فراوانی نسبی ، ستون درصد  فراوانی نسبی  ، ستون فراوانی تراکمی و ستون در صد فراوانی تراکمی رسم می کنیم.۲ – مرتب کردن اعداد : اعداد را از بزرگ به کوچک ( یا از کوچک به بزرگ ) مرتب        می کنیم.۳ ـ محاسبه ی دامنه ی تغییرات : دامنه ی تغییرات عبارت است از: تفاضل بین بزرگترین و کوچکترین اعداد به اضافه ی یک. ۴ ـ تعیین تعداد طبقات : برای تعیین طبقات که با C( مخفف   class)  نمایش داده می شود، چند پیشنهاد وجود دارد که عبارتند از : الف ـ استفاده از قاعده ی استورجس  n = تعداد مشاهدات ب ـ پیشنهاد دوم عبارت است از :  ج ـ پیشنهاد سوم این است که تعداد طبقات را بین پنج تا بیست طبقه یا ده تا بیست طبقه در نظر بگیریم . اگر تعداد طبقات کمتر از ۵ طبقه در نظر گرفته شود ، طبقات خیلی بزرگ می شوند و این باعث کاسته شدن از دقت محاسبات و از بین رفتن بخش زیادی از اطلاعات می شود و در صورتی که تعداد طبقات بیشتر از ۲۰ طبقه در نظر گرفته شود، اولاً وقت گیر است و ثانیاً انجام محاسبات        دشوار می شود .اگر چه در بالا سه پیشنهاد برای تعیین تعداد طبقات گفته شد، ولی آنچه مسلم است این است که تعیین تعداد طبقات به سه عامل زیر بستگی دارد : الف ـ تعداد داده ها                                  ب ـ نظر پژوهشگر                        ج ـ ماهیت اندازه گیری ۵ ـ تعیین فاصله ی طبقات   : برای تعیین فاصله ی طبقات باید دامنه ی تغییرات را بر تعداد طبقات تقسیم کنیم ، سپس نزدیکترین اعداد نزدیک به خارج قسمت را به عنوان فاصله ی طبقات مناسب بر می گزینیم. I      فاصله ی طبقات                                                                                                     R     دامنه ی تغییرات                                                                                             C      تعداد طبقات ۶ـ نوشتن طبقات : کوچکترین اعدادی که در طبقات مختلف قرار دارند، حد پایین طبقات و بزرگترین اعدادی که به طبقات مختلف تعلق دارند، حد بالای طبقات گفته می شود . اگر نصف اختلاف بین حد بالای یک طبقه ی و حد پایین طبقه بعدی ( معمولا ۵/ . واحد )   را از حد پایین هر طبقه کم و به حد بالای همان طبقه اضافه کنیم ، حد واقعی هر طبقه یا کراندی طبقه بدست می آید. برای نوشتن طبقات ابتدا کوچکترین عدد ( یعنی حد پایین اولین طبقه ) را نوشته و بعد فاصله ی طبقاتی را به حد پایین طبقه اول اضافه می کنیم تا طبقه ی اول شکل بگیرد. سپس فاصله ی طبقاتی را به حد پایین و حد بالای طبقه ی اول اضافه می کنیم تا طبقه ی دوم شکل بگیرد. این کار را تا آخرین طبقه یعنی طبقه ای که بزرگترین عدد در آن قرار بگیرد ادامه  می دهیم .در اینجا باید به یک نکته توجه کرد و آن این است که، هنگام نوشتن طبقات ، طبقات باید ناسازگار باشند، یعنی هر عدد فقط در یک طبقه قرار داده شود . ۷ـ نقطه ی میانی (حدمیانی ) : نقطه ی میانی هرطبقه عبارت است از: نصف مجموع حد بالا و پایین هر طبقه . نقطه ی میانی را با علامت MP نشان می دهند . ۸ ـ ستون های خط نشان ، فراوانی مطلق ، فراوانی نسبی ، درصد فراوانی نسبی ، فراوانی تراکمی و درصد فراوانی تراکمی را، مانند جدول توزیع فراوانی ساده تکمیل می کنیم.

مثال ـ وزن ۳۵ نفر از دانشجویان یک کلاس اندازه گیری شده که نتایج آن به شرح زیر است: ۷۲                     ۷۱                   ۸۱                    ۶۸                  ۱۰۰                 ۶۱                   ۷۴۶۵                     ۹۰                   ۸۴                    ۷۶                   ۷۴                  ۷۰                   ۸۳۷۳                    ۷۵                    ۷۴                    ۶۱                    ۷۷                 ۹۰                   ۷۶۸۲                    ۶۴                    ۷۰                   ۸۰                     ۷۸                 ۶۸                   ۹۶۶۳                    ۸۴                    ۹۱                   ۷۳                     ۷۶                 ۷۱                  ۷۵حال جدول توزیع فراوانی طبقه بندی شده وزن دانشجویان را رسم می کنیم.                               جدول ۷ـ۳ . جدول توزیع فراوانی طبقه بندی شده ی وزن دانشجویانطبقات خط نشان حدود واقعی طبقات نقطه ی میانی طبقات فراوانی مطلق (F) فراوانی نسبی (f) درصد فراوانی نسبی P%)) فراوانی تراکمی (Fci) درصد فراوانی تراکمی (P%)64-61     ////       ۵/۶۴-۵/۶۰ ۵/۶۲ ۴ ۱۱۴/۰ ۴/۱۱% ۴ ۴۲/۱۱%

۶۸-۶۵     /// ۵/۶۸-۵/۶۴ ۵/۶۶ ۳ ۰۸۵/۰ ۵/۸% ۷ ۹/۱۹%۷۲-۶۹     //// ۵/۷۲-۵/۶۸ ۵/۷۰ ۵ ۱۴۲/۰ ۲/۱۴% ۱۲ ۱۲/۳۴%۷۶-۷۳     ////          ////         ۵/۷۶-۵/۷۲ ۵/۷۴ ۱۰ ۲۸۵/۰ ۵/۲۸% ۲۲ ۶۲/۶۲%۸۰-۷۷      /// ۵/۸۰-۵/۷۶ ۵/۷۸ ۳ ۰۸۵/۰ ۵/۸% ۲۵ ۱۲/۷۱%۸۴-۸۱      //// ۵/۸۴-۵/۸۰ ۵/۸۲ ۵ ۱۴۲/۰ ۲/۱۴% ۳۰ ۳۲/۸۵%۸۸-۸۵     ۵/۸۸-۵/۸۴ ۵/۸۶ ۰ ۰۰۰/۰ ۰۰۰/۰% ۳۰ ۳۲/۸۵%۹۲-۸۹     /// ۵/۹۲-۵/۸۸ ۵/۹۰ ۳ ۰۸۵/۰ ۵/۸% ۳۳ ۸۲/۹۳

 

%۹۶-۹۳       / ۵/۹۶-۵/۹۲ ۵/۹۴ ۱ ۰۲۸/۰ ۸/۲% ۳۴ ۶۲/۹۶%۱۰۰-۹۷       /   ۵/۱۰۰-۵/۹۶ ۵/۹۸ ۱ ۰۲۸/۰ ۸/۲% ۳۵ ۱۰۰%جمع    ۳۵ ۳۵  ۷ـ۳ـ آمار توصیفی مناسب در تحلیل یک متغیری : آمار توصیفی در تحلیل های یک متغیری شامل اندازه های گرایش مرکزی و اندازه های پراکندگی می باشد . ۷ـ۳ـ۱ـ آمار توصیفی مناسب برای یک متغیر اسمی : ۷ـ۳ـ۱ـ۱ـ اندازه های گرایش مرکزی   : اندازه های گرایش مرکزی یا معیارهای مرکز گرایی ، مرکز توزیع داده ها را نشان می دهند . تنها معیار مرکز گرایی در متغیرهای اسمی ، نما می باشد . ۷ـ۳ـ۱ــ۱ـ۱ـ  نما   : نما کلمه ای فرانسوی است که به معنای معمول و رایج است . ولی نما در اصطلاح، عددی است که در یک توزیع فراوانی، بیشترین فراوانی را داشته باشد وآن را با  MO       نمایش می دهند . مثلاً، اعداد زیر را در نظر بگیرید :۴،۱،۳،۲،۱در اینجا نما عدد یک است، زیرا بیشترین فراوانی را داراست . یک توزیع فراوانی در رابطه با نما ممکن است حالات زیر را داشته باشد :الف ـ فاقد نما : زمانی که فراوانی همه ی نمره ها برابر باشد، توزیع فاقد نماست. مانند مثال زیر  : ۱،۱۲، ۱۵،۱۰ ، ۶ب ـ تک نمایی : زمانی که فراوانی یکی از نمره ها، بیشتر از فراوانی سایر نمرات باشد، توزیع تک نمایی است .مانند مثال زیر : ۲۵،۱۱،۲۳،۱۴،۱۱،۱۵ج ـ دو نمایی   : زمانی که فراوانی دو مورد از نمره ها، با هم برابر و از سایر نمره ها بیشتر باشد، توزیع دو نمایی است . در توزیع دو نمایی متقارن ، میانگین و میانه برابر است ، ولی نما در طرفین آنها واقع شده است . (مانند شکل ۷ـ۱ )
اعداد زیر را در نظر بگیرید . ۱۴،۲۵،۱۱،۲۳،۱۴،۱۱در اینجا نما دو عدد ۱۱و۱۴ است . د- چندنمایی    : زمانی که فراوانی حداقل سه مورد از نمره ها، با هم برابر و از سایر نمره ها بیشتر باشد، توزیع چند نمایی است . ۱۹،۳۰،۱۸،۲۴،۱۲،۱۹،۱۸،۱۴،۱۲دراین مثال نما اعداد ۱۲،۱۸و۱۹ است

. هنگامی که داده ها گروه بندی شده باشند ، طبقه ای که بیشترین فراوانی را دارد ،طبقه حاوی نماست. بعد از تعیین طبقه ی حاوی نما ، مقدار نما از طریق فرمول زیر بدست می آید : h   = فاصله یا عرض طبقات                                                                       =  حد پایین طبقه ی حاوی نما                                                        d1 = اختلاف فراوانی طبقه ی حاوی نما از فراوانی طبقه ی ماقبل d2 =اختلاف فراوانی طبقه ی حاوی نما از فراوانی طبقه ی

بعد . مثال : میزان درآمد فراوانی  ۱۰۰-۰ ۳۵۲۰۰-۱۰۰ ۴۰۳۰۰-۲۰۰ ۷۰۴۰۰-۳۰۰ ۲۵۵۰۰-۴۰۰ ۳۰۶۰۰-۵۰۰ ۵۰
 

موقعی از نما استفاده می کنیم  که ، اولاً متغیر مورد نظر در سطح سنجش اسمی باشد، زیرا به مرتب کردن نمرات بستگی دارد . اگر برای متغیرهای ترتیبی ، فاصله ای یا نسبی از نما استفاده کنیم ، اطلاعات زیاد و مفیدی را از دست می دهیم . دوماً، هنگامی که حالات موجود در یک متغیر زیاد باشد. نما در گروه های کوچک دارای اعتبار کمی است، زیرا تابع چند عدد است .  برای اینکه ببینیم آماره ی نما برای بیان توزیع فراوانی مورد بررسی مناسب است یا نه ، نگاه می کنیم ، ببینیم چند درصد پاسخگویان در مقوله ی نما قرار می گیرند. هرچه این درصد بیشتر باشد آماره ی نما برای بیان توزیع مورد بررسی مناسب تر است .استفاده از نما دارای مزایا و معایبی است که عبارتند از : الف ـ مزایا : ۱ـ اعداد خیلی بزرگ یا خیلی کوچک روی نما تأثیری ندارند.  ۲ـ تنها معیار مرکز گرایی برای متغیرهای اسمی است . ۳ـ از میان معیارهای مرکز گرایی ، کمترین مفروضات را داراست . ۴ـ به سهولت محاسبه می شود . ۵ـ در نما احتیاجی نیست که، حتماً مقادیر معنای خاصی داشته باشند . ب ـ معایب : ۱ـ فقط یک جنبه ی توزیع را که همان مقدار مربوط به بیشترین فراوانی است، نمایان می سازد . ۲ـ اعمال ریاضی را نمی توان با آن انجام داد . ۳ـ در توزیع فراوانی گروه بندی شده، نما اندازه ی خوبی برای مرکز گرایی نیست، زیرا به گروه بندی داده ها بستگی دارد . ۴ـ برآورد خیلی ضعیفی از پارامتر جامعه است . ۵ـ هنگامی که حالات موجود در یک متغیر کم باشد، نما اعتبارزیادی ندارد،زیرا تابع چند عدد است. ۶ـ حالت پایداری ندارد و می توان هرگونه دخل و تصرفی در آن صورت داد . ۷ـ در توزیع هایی که دو یا چند نما دارند، کارایی نما خیلی پایین می آید . ۸ـ استفاده ی محدودی از نظر محاسبات آماری دارد . روش اجرای نما : ۱ـ ابتدا منو analyze و سپس فرمان descriptive  statistics  را کلیک می کنیم . ۲ـ بر روی گزینه ی frequencies کلیک می کنیم و سپس متغیر مورد بررسی را به بخش variables منتقل می کنیم. ۳ـ گزینه ی statistics را کلیک کرده و سپس گزینه ی Mode را انتخاب می کنیم. ۴ـ گزینه ی continue و سپس گزینه ی ok را کلیک می کنیم. ۷ـ۳ـ۱ـ۲  اندازه های پراکندگی   : اندازه های پراکندگی یا شاخص های پراکندگی برای متغیرهای اسمی عبارتند از : الف ـ ضریب تغییرات ب ـ شاخص تغییر پذیری کیفی (I.Q.V) ۷ـ۳ـ۱ـ۲ـ۱ـ پراکندگی نسبی واریانس یا ضریب تغییرات   : ضریب تغییرا ت برای مقایسه ی پراکندگی دو متغیر اسمی زمانی که میانگین یکسانی نداشته باشند، بکاربرده می شود . ضریب تغییرات گاهی اوقات پراکندگی نسبی  ، واریانس هم گفته می شود . فرمول محاسبه ی ضریب تغییرات عبارت است از :    v    ضریب تغییرات s    انحراف معیار        میانگی

ن اگر میانگین منفی بود از قدرمطلق میانگین استفاده می کنیم.اگر میانگین و انحراف معیار برابر باشند، ضریب تغییرات برابر با ۱۰۰ درصد می شود . هرچه ضریب تغییرات متغیری بیشتر باشد ، نشانگر پراکندگی بیشتر بین اعداد است .راه دیگر محاسبه یضریب تغییرات ا

 

ین است این است که، درصد پاسخگویانی که در مقوله ی نما قرار ندارند را محاسبه کرده و سپس رقم اعشار این درصد را دو رقم به عقب برگردانیم تا ضریب تغییرات بدست آید . جدول ۷ـ۴ را در نظر بگیرید.            جدول ۷ـ۴  جدول توزیع پاسخگویان بر حسب مذهبمذهب فراوانی P درصدکاتولیک ۴۰ ۲۰%پروتستان ۱۱۰ ۵۵%ارتدوکس ۵۰ ۲۵% در این جدول ۴۵ درصد افراد پاسخگو در مقوله ی نما قرار ندارند (۴۵=۲۵+۲۰) چون که در مقوله ی نما (۵۵%MO =   )  ۵۵ درصد افراد قرار دارند. پس:                     ۴۵/۰= Vمثال ـ فرض کنید حقوق متوسط ماهانه در ایران ۱۵۰۰۰۰ تومان با انحراف معیار ۲۵۰۰۰ تومان و در کانادا ۱۰۰۰ دلار با انحراف معیار ۲۰۰ دلار باشد . حال سؤال این است که تغییر پذیری در ایران بیشتر است یا در کانادا ؟                                       نتیجه نشان می دهد که پراکندگی نسبی حقوق سالانه در کشور کانادا، بیشتر از پراکندگی نسبی در کشور ایران است .۷ـ۳ـ۱ـ۲ـ۲ـ شاخص تغییر پذیری کیفی    : شاخص تغییر پذیری کیفی یا .I   V. میزان پراکندگی داده ها را،در یک متغیر اسمی نشان می دهد . بعبارت دیگر این شاخص به مقایسه میزان تغییرپذیری مشاهده شده یک متغیر اسمی با حداکثر تغییری که امکان وجود دارد ، می پردازد . این شاخص زمانی استفاده می شود که : اولاً متغیر مورد بررسی اسمی باشد ثانیاً تعداد مقوله های آن نسبتاً کم باشد . فرمول محاسبه شاخص تغییر پذیری کیفی عبارت است از :  OV  :  تغییر پذیری مشاهده شده EV   : تغییر مورد انتظار تغییر پذیری مشاهده شده، اختلافاتی است که در یک توزیع وجود دارد و برای بدست آوردن آن مشاهدات را در همه ی زوج های ممکن ضرب می کنیم و سپس جمع می زنیم . تغییر مورد انتظار هم، عبارت است از : نهایت درجه تغییر پذیری که امکان آن هست که در یک توزیع پیش بیاید. برای محاسبه ی تغییر مورد انتظار میانگین داده هارا محاسبه می کنیم و در جدول وارد می کنیم . هنگامی که شاخص تغییر پذیری کیفی صفرشود نشان دهنده ی همگنی توزیع است و هنگامی که مقدار آن برابر با یک باشد نشان دهنده ی پراکندگی کامل است . مثال ـ بمنظور بررسی رنگ چشم دانش آموزان یک مدرسه، تعداد ۹۰ نفر از آنها بصورت تصادفی انتخاب شدند که نتایج آن در زیر ارائه شده است . حال می خواهیم میزان پراکندگی رنگ چشم این دانش آموزان را بررسی کنیم .                         جدول ۷ـ۵ توزیع پاسخگویان برحسب رنگ چشم           رنگ چشم فراوانی مشاهده شده  (OV) فراوانی مورد انتظار (EV)مشکی ۴۰ ۳۰آبی ۲۰ ۳۰سبز ۳۰ ۳۰جمع ۹۰=n 90=n ۲۶۰۰=(۳۰)۲۰+(۳۰+۲۰)۴۰=  OV2700=(30)30+(30+30)30=EV   .I =  V.7ـ۳ـ۲ ـ آمار توصیفی مناسب برای یک متغیر ترتیبی : ۷ـ۳ـ۲ـ۱ـ اندازه های گرایش مرکزی : معیار مرکز گرایی برای یک متغیر ترتیبی میانه است . ۷ـ۳ـ۲ـ۱ـ۱ـ میانه  یا نیمساز : مقداری است که، فراوانی ها را به دو گروه مساوی تقسیم         می کند، بطوری که نیمی از حالات بالاتر از آن و نیمی پایین تر از آن قرار دارند . میانه را با Md نمایش می دهند . محاسبه ی میانه به دو صورت امکان پذیر است که عبارتند از : الف ـ محاسب

ه ی میانه برای داده های گروه بندی نشده ب ـ محاسبه ی میانه برای داده ها ی گروه بندی شده محاسبه میانه برای داده های گروه بندی نشده : وقتی تعداد داده ها کم باشد،از این روش استفاده می کنیم. در این روش، ابتدا داده ها را از کوچک به بزرگ یا از بزرگ به کوچک مرتب می کنیم (نوع مرتب کردن داده ها از کوچک به بزرگ یا از بزرگ به کوچک در مقدار میانه تأثیری ندارد). سپس ، اگر تعداد داده ها فرد بود  ، عددی که در وسط قرار می گیرد میانه است. مثلاً، اعدا

د زیر را درنظر بگیرید . در اینجا عدد۴ میانه است.۳،۴،۷،۱۰،۱ولی اگر تعداد داده ها زوج بود ، میانگین دو عددی که در وسط قرار می گیرد میانه است  .
مثال :                                                                          ۱۲، ۳،۴،۷،۱۰،۱
محاسبه ی میانه برای اعداد گروه بندی شده :  هنگامی که تعداد داده ها زیاد باشد، از روش گروه بندی شده استفاده می کنیم. در این روش داده ها را در طبقات مختلف قرار می دهیم و سپس میانه را از فرمول زیر بدست می آوریم :  l=حدپایین طبقه ی حاوی میانه  =Fiجمع فراوانی های قبل از طبقه ی حاوی میانه  f= فراوانی مطلق طبقه ی حاوی میانه =Md میانه i= فاصله ی طبقات برای پیدا کردن میانه در طبقات ، از درصد فراوانی تجمعی استفاده می کنیم . هر طبقه ای که دارای درصد تجمعی ۵۰ یا بیشترباشد، آن طبقه حاوی میانه است . مثال ـ درآمد ماهانه ی ۲۰۰ نفر بصورت تصادفی گرفته شده است، که در زیر ارائه گردیده است . حال مقدار میانه اعداد زیر را محاسبه می کنیم :                                     جدول ۷ـ۶ ـ جدول توزیع درآمد ماهانه ی پاسخگویاندرآمدماهانه خانواده به هزار تومان فراوانی فراوانی تجمعی درصد فراوانی تجمعی ۷۹-۵۰ ۲۵ ۲۵ ۵/۱۲۱۰۹-۸۰ ۳۰ ۵۵ ۵/۲۷۱۳۹-۱۱۰ ۷۰ ۱۲۵ ۵/۶۲
۱۶۹-۱۴۰ ۳۰ ۱۵۵ ۵/۷۷۱۹۹-۱۷۰ ۳۵ ۱۹۰ ۹۵۲۲۹-۲۰۰ ۱۰ ۲۰۰ ۱۰۰میانه در طبقه ی سوم قرار دارد .  ویژگی های میانه :۱ـ تنها معیار مرکزگرایی برای متغیرهای ترتیبی است .۲ـ اعداد خیلی کوچک یا بزرگ روی آن تأثیر ندارد . بعبارت دیگر تحت تأثیر ارزش عددی نمره ها قرار ندارد . در توزیع های چوله (توزیع که دارای مقادیر پرت باشد ) مثل درآمد، بهترین روش استفاده از میانه است . ۳ـ فراوانی ها را به دو گروه مساوی تقسیم می کند . ۴ـ اگر انحراف هریک از نمره ه

ا را از میانه  بدون در نظر گرفتن علامت آنها محاسبه کنیم و جمع بزنیم جمع این انحراف ها مساوی یا کوچکتر از مجموع قدرمطلق (در نظر گرفتن اعداد بدون توجه به علامت آنها ) انحراف های نمره ها از هر عدد دیگری است . اعداد ۵،۴،۳،۲،۱ را در نظر بگیرید . در این مثال میانه عدد ۳ است . در اینجا مجموع قدرمطلق انحراف نمره ها از میانه، یعنی عدد ۶، کوچکتر از مجموع قدرمطلق انحرافهای نمره ها از سایر اعداد توزیع است . 

معایب میانه : ۱ـ میانه چیزی در مورد میزان تفاوت مقدارها به ما نمی گوید .۲ـ در محاسبه ی میانه از عملیات ریاضی کمی استفاده می شود . ۳ـ برآورد ضعیفی از پارامتر جامعه است . ۴ـ هرچه دامنه ی تغییر نمره ها بیشتر باشد ، کارایی میانه کمتر می شود . روش اجرای میانه : ۱ـ ابتدا منو analyze  و سپس فرمان descriptive statistics را کلیک می کنیم. ۲ـ فرمان Frequencies را کلیک می کنیم و متغیر مورد نظر را به بخش variables منتقل        می کنیم. ۳ـ فرمان statistics را کلیک و سپس گزینه ی median را انتخاب می کنیم. ۴ـ گزینه ی continue و سپس okرا کلیک می کنیم. ۷ـ۳ـ۲ـ۲ـ اندازه های پراکندگی : تنها شاخص پراکندگی برای یک متغیر ترتیبی، دامنه  دهدهی یا دهکی است . ۷ـ۳ـ۲ـ۲ـ۱ـ دامنه دهدهی  یا دهکی : دامنه ی دهدهی یا دهکی شاخص است که، میزان پراکندگی متغیرهای ترتیبی را نشان میدهد . ممکن است در یک توزیع، اعدادی وجود داشته باشد که خیلی بزرگ یا خیلی کوچک باشندبه طوری که با بقیه ی اعداد تفاوت زیادی داشنه باشند . در چنین مواقعی که دامنه ی تغییرمتغیرهای یک توزیع زیاداست ، از کارایی میانه کاسته می شود . در چنین مواقعی بهتر است که از دامنه دهکی استفاده کنیم. پس کار دامنه ی دهکی از بین بردن تأثیر اعداد پرت در توزیع است . بنابراین، برای اینکه تأثیر این اعداد را در توزیع فراوانی ازبین ببریم، ۱۰ درصد ازاعداد پایین و ۱۰ درصد از اعداد بالای توزیع را حذف کرده و ۸۰ درصد میانی توزیع را مورد بررسی قرار می دهیم . ۷ـ۳ـ۳ آمار توصیفی مناسب برای یک متغیر فاصله ای یا نسبی : ۷ـ۳ـ۳ـ۱ـ اندازه های گرایش مرکزی : تنها معیار مرکز گرایی برای یک متغیر فاصله ای یا نسبی، میانگین است . میانگین انواع گوناگونی دارد که مهمترین آن عبارتند از : ۱ـ میانگین حسابی ۲ـ میانگین وزنی ۳ـ میانگین هندسی ۴ـ میانگین مرکب ۵ـ میانگین هارمونیک ۷ـ۳ـ۳ـ۱ـ۱ـ میانگین حسابی   : میانگین حسابی، از تقسیم حاصل جمع نمرات بر تعداد آزمودنی ها بدست می آید و فرمول محاسبه ی آن عبارت است از :  = میانگین حسابی n= تعداد آزمودنی ها یا تعداد مشاهدات X = مقادیر = حرف یونانی سیگما که معنی آن جمع کردن است .  = مجموع یک یک مقدارها علامت میانگین حسابی در نمونه ی آماری M

یا     (ایکس بار ) ودرجامعه ی آماری μ  (مو) است. ولی نحوه ی محاسبه ی میانگین برای نمونه و جامعه یکسان است . میانگین حسابی هنگامی مورد استفاده قرار می گیرد که اهمیت داده هابرابر باشد.  مثال ـ نمرات درسی یک دانشجو در زیر ارائه شده است :                                                                                              ۱۴،۱۳،۵/۱۶، ۱۱،۱۹،۱۵،۱۶

،۱۷،۱۰ میانگین نمرات این دانشجو عبارت است از :  ۷ـ۳ـ۳ـ۱ـ۲ـ میانگین وزنی  : میانگین وزنی زمانی مورد استفاده قرار می گیرد که، اعداد دارای درجه ی اهمیت متفاوتی باشند . فرمول محاسبه ی میانگین وزنی عبارت است از :      = میانگین وزنیW=درجه ی اهمیت مقادیر x= فراونی مقادیر =مجموع درجات اهمیت مقادیر مثلاً یک دانشجو در امتحانات کنکور سراسری در درس معارف اسلامی نمره ۸۵ ، زبان و ادبیات فارسی ۹۰ ، زبان عربی نمره ۴۰ و زبان انگلیسی نمره ۵۰ گرفته است . دراینجا اگر از میانگین حسابی استفاده کنیم میانگین نمرات ۵۳ می شود ولی از آنجایی که معارف اسلامی دارای درجه اهمیت ۳ ، ادبیات فارسی ۴ ، عربی ۲ وزبان انگلیسی ۲ است ، این میانگین نمی تواند اهمیت بیشتری را که برای ادبیات فارسی و اهمیت کمتری که برای زبان عربی و زبان انگلیسی است را منعکس کند بنابراین باید در اینجا از میانگین وزنی استفاده کنیم ، میانگین وزنی نمرات این دانشجو عبارت است از: 
                 جدول ۷ـ۷ جدول توزیع نمرات دانشجویان همراه با ضرایب x w  
۸۵۹۰۴۰۵۰ ۳۴۲۲ ۲۵۵۳۶۰۸۰۱۰۰  ۷۹۵ 
  ۷-۳-۳-۱-۳ – میانگین هندسی : میانگین هندسی n عدد برابر با ریشه ی n ام حاصلضرب آن ها که     با      ا  نمایش داده می شود. فرمول میانگین هندسی عبارت است از:                                                                                                                                                                                                                                                                                                                                                                                     مثال:اعداد زیر را در نظر بگیرید:                                             ۵،۵،۵،۴،۴،۳،۳،۲،۱،۱میانگین هندسی این اعداد عبارت اند از:                            ۳۶۰۰ = ۵*۵*۵*۴*۴*۳*۳*۲*۱*۱۷-۳-۳-۱-۴- میانگین مرتب یا میانگین میانگین ها:میانگین مرکب را با  نمایش            می دهند.میانگین مرکب به دو صورت محاسبه می شود که عبارت اند از:الف- هنگامی که حجم گروه ها مساوی است.در این صورت میانگین مرکب از فرمول زیر محاسبه می شود:=  میانگین مرکب                                             = میانگین نمونه ها       N= میانگین نمونه ها مثال:چهار گروه د

اریم که میانگین هر کدام از گروه هادر جدول ۷-۸ ارائه شده است. میانگین گروه A مساوی با ۱۵، میانگین گروه  Bمساوی با۳۵ ، میانگین گروه  cمساوی با ۴۰ ومیانگین گروه  Cمساوی با ۱۰ است.                                          n       گروه ها۲۰۰۲۰۰۲۰۰۲۰۰ ۱۵۳۵۴۰۱۰ گروه A        گروه Bگروه Cگروه D  

 

ب – هنگامی که حجم گروهها نامساوی است . دراین شرایط میانگین مرکب از فرمول زیر محاسبه می شود :   = میانگین هر گروه NT= مجموع تعداد کل گروهها nj= فراوانی هرگروه

جدول ۷ـ۹ جدول توزیع گروهها همراه با میانگین وحجم گروههاگروهها  Nj           
گروه Aگروه Bگروه Cگروه D 15354010 100150200250 1500525080002500

NT=100+150+200+250=700
 

۷ـ۳ـ۳ـ۱ـ۵ـ مینگین همساز یا هارمونیک    : میانگین هارمونیک را با   نمایش می دهند و فرمول محاسبه ی آن عبارت است از :  n= تعداد نمره ها x= نمره ها مثال ـ میانگین هارمونیک اعداد زیر را محاسبه می کنیم :                        ۵ ،۱،۲،۳،۴نکته : صفر نمی تواند جزو اعداد باشد . خواص میانگین : ۱ـ اگر همه ی مقادیر یک متغیر را در یک عدد ثابت (مثلاً عدد۲) ضرب کنیم ، میانگین هم در عدد ثابت ضرب می شود .( یعنی میانگین هم دو برابر می شود.)  اعداد روبه رو را در نظر بگیرید:  ۵ ،۱،۲،۳،۴میانگین این اعداد برابر ۳ است. حال اگر این اعداد را در عدد ۲ ضرب کنیم، نتیجه عبارت است از:  ۱۰،۸،۶،۴،۲در این صورت میانگین اعداد جدید برابر با ۶ خواهد بود:                                                                                         ۲- اگر همه ی مقادیر یک متغیر را در یک مقدار ثابت( مثلاً )۲ تقسیم کنیم، میانگین هم بر آن عدد ثابت( یعنی عدد )۲ تقسیم می شود. مثلاً اعداد روبرو را در نظر بگیرید:۱،۲،۳،۴،۵ میانگین این اعداد عدد ۳ است. حال اگر این اعداد را برعدد ۲ تقسیم کنیم، نتیجه عبارت خواهد بود از: ۵/۲،۲،۵/۱،۱،۵/۰ در این صورت میانگین اعداد جدید ۵/۱ خواهد شد .  ۳ـ اگر همه ی مقادیر یک متغیر را از یک عدد ثابت (مثلاً عدد)۲ کسر کنیم ،میانگین هم به همان مقدار کم می شود .۴ـ اگر به همه ی مقادیر یک متغیر ، یک عدد ثابت مثلاً عدد۲ اضافه کنیم ،میانگین اعداد جدید هم به همان اندازه  (یعنی ۲ واحد) اضافه می شود . ۵ـ مجموع انحراف مقادیر از میانگین برابر صفر است. مثلاً، اعداد روبه رو را در نظر بگیرید: ۱،۲،۳،۴،۵                                                                                                                                                   در اینجا اگر همه ی اعداد را از میانگین یعنی عدد ۳ کم کنیم ، نتیجه برابر با صفر می شود . در اینجا مجموع ا

نحراف های منفی (۳-) دقیقا برابر مجموع انحراف های مثبت (۳+) است . نمرات انحراف از میانگین۱۲۳۴۵ ۲-=۳-۱۱-=۳-۲۰=۳-۳۱=۳-۴۲=۳-۵                                      ۶ـ خاصیت حداقل مربعات یکی دیگر از خواص میانگین است . ۷ـ میانگین فقط برای متغیرهای فاصله ای و نسبی به کار برده می شود . ۸ـ در میانگین همه ی اطلاعات منظور می شود . بنابراین میانگین نسبت به همه ی اعداد موجود در توزیع فراو

انی حساس است و مقادیر خیلی کوچک و خیلی بزرگ روی آن تأثیر می گذارد . بنابراین در توزیع های چوله میانگین کارایی زیادی ندارد . مشکلات میانگین : ۱ـ ممکن است چندین توزیع کاملاً متفاوت وجود داشته باشد ، ولی میانگین آنها یکسان باشد . ۲ـ حرکت میانگین در جهت چولگی سریع تر از سایر شاخص های گرایش مرکزی (نما و میانه ) است . وقتی در میان داده ها اعداد خیلی بزرگ یا کوچک (مقادیر پرت) وجود داشته باشد ، میانگین تحت تأثیر این مقادیر قرار می گیرد . بنابراین حذف در چنین مواقعی شاخص خوبی برای تجمع اطلاعات نیست . در چنین مواقعی بهتر است از میانه استفاده کرد . مقایسه ی نما ، میانه و میانگین : ۱ـ نما برای متغیرهای اسمی ، میانه برای متغیرهای ترتیبی و میانگین برای متغیرهای فاصله ای ونسبی بکار برده می شود . ۲ـ مجموع انحراف نمره ها از میانگین، همیشه برابر با صفر است. ولی مجموع انحراف نمره ها از میانه یا نما همیشه برابر با صفر نیست . ۳ـ ثبات میانگین بیشتر از میانه و نما است . ۴ـ با میانگین عملیات ریاضی بیشتری می توان انجام داد . ۵ـ در توزیع های چوله بهترین اندازه گرایش مرکزی ، میانه است ولی در توزیع های نرمال بهترین اندازه گرایش مرکزی ، میانگین است. ۶- در توزیع های نرمال هر سه شاخص برهم منطبق اند، ولی در توزیع های چوله نما در قله قرار می گیرد و میانگین و میانه در جهت چولگی حرکت می کنند .   روش اجرای میانگین : ۱ـ ابتدا منو analyze و سپس فرمان descriptive statistics  را کلیک می کنیم . ۲ـ فرمان frequencies  را کلیک کرده و سپس متغیر مورد بررسی را به بخش variables منتقل می کنیم. ۳ـ گزینه ی statistics را کلیک کرده و سپس گزینه ی mean را انتخاب می کنیم. ۴ـ گزینه ی continue و سپس ok را کلیک می کنیم. ۷ـ۳ـ۳ـ۲ـ اندازه های پراکندگی: شاخص های پراکندگی برای متغیرهای فاصله ای و نسبی عبارتند از :۱ـانحراف متوسط    ۲ـ واریانس     ۳ـ انحراف معیار  ۴ـ نمره های استاندارد   ۵ـ کشیدگی۶ـ کجی یا چوگی           ۷ـ دامنه ی تغییرات       ۸ـ گشتاورها ۷ـ۳ـ۳ـ۲ـ۱ـ انحراف متوسط   : میانگین قدرمطلق  انحرافات مقادیر از میانگین را انحراف متوسط می گویند و آن را با AD نشان می دهند . مزیت انحراف متوسط این است که انحراف تمامی نمرات و مشاهدات در محاسبه ی آن دخالت دارند . ولی عیب این شاخص این است که، در انحراف متوسط به علت استفاده از قدرمطلق اعداد ، نمی توان عملیات جبری انجام داد . هرچه مقدار انحراف متوسط بزرگتر باشد ، نشانگر پراکندگی بیشتر بین داده هاست و

هرچه مقدار آن کوچکتر باشد نشانگر پراکندگی کمتر بین داده هاست . 

روش محاسبه ی انحراف متوسط : روش های محاسبه ی انحراف متوسط عبارتند از : الف ـ محاسبه انحراف متوسط برای داده های بدون فراوانی و گروه بندی نشده : فرمول محاسبه انحراف متوسط هنگامی که داده ها گروه بندی نشده اند و فاقد فراوانی هستند          عبارت است از : 
   
۲۰۲۱۲۲۲۳۲۴۲۵ ۵/۲-=۵/۲۲-۲۰۵/۱-=۵/۲۲-۲۱۵/۰-=۵/۲۲-۲۲۵/۰=۵/۲۲-۲۳۵/۱=۵/۲۲-۲۴۵/۲=۵/۲۲-۲۵ ۵/۲۵/۱۵/۰۵/۰۵/۱۵/۲               
 AD= انحراف متوسط     = میانگین نمرات  n= تعداد نمرات  = علامت قدرمطلق  تفسیر : بطور متوسط نمره ها در اطراف میانگین معادل ۵/ ۱ نمره پراکندگی دارند.ب ـ محاسبه ی انحراف متوسط برای داده های دارای فراوانی و گروه بندی نشده :

جدول ۷ـ۱۱ جدول توزیع پاسخگویان برحسب سن همراه با فراوانی آنهاxi Fi xiFi   
۲۰۲۱۲۲۲۳۲۴۲۵ ۸۱۱۴۱۰۹۸ ۱۶۰۲۳۱۸۸۲۳۰۲۱۶۲۰۰ ۵/۲-=۵/۲۲-۲۰۵/۱-=۵/۲۲-۲۱۵/۰-=۵/۲۲-۲۲۵/۰=۵/۲۲-۲۳۵/۱=۵/۲۲-۲۴۵/۲=۵/۲۲-۲۵ ۲۰۵/۱۶۲۵۵/۱۳۲۰ 
                                                                                         

  
ج ـ محاسبه ی انحراف متوسط برای داده ها ی دارای فراوانی و گروه بندی شده :              جدول ۷ـ۱۲ جدول توزیع پاسخگویان بر حسب سن همراه با فراوانی آنها X Fi MP FIMP   
۲۱-۲۰۲۳-۲۲۲۵-۲۴ ۱۹۱۴۱۷ ۵/۲۰۵/۲۲۵/۲۴ ۵/۳۸۹۳۱۵۵/۴۱۶ ۹۲/۱-=۴۲

/۲۲-۵/۲۰۰۸/۰=۴۲/۲۲-۵/۲۲۰۸/۲=۴۲/۲۲-۵/۲۴ ۴۸/۳۶۱۲/۱۳۶/۳۵۹۶/۷۲                                                 ۱۱۲۱ 
 N= تعداد نمرات  MP= نقطه ی میانی طبقه     = میانگین نمرات Fi= فراوانی هر طبقه MP   =                                                                   هرچه واریانس بزرگتر باشد ، پراکندگی مقادیر هم بیشتر است و هرجه واریانس کوچکتر باشد ، تشابه داده ها بیشتر اس

ت و مقادیر متغیر به میانگین نزدیک تر می شوند . اگر همه ی اعداد با هم برابر باشند ، واریانس داده ها صفر می شود . پس هنگامی که داده ها تغییر نکنند ، متغیر فاقد واریانس است و کار زیادی با آن نمی توان انجام داد . ۷ـ۳ـ۳ـ۲ـ۲ واریانس  : واریانس   عبارت است از : مجموع مجذورات انحراف نمره ها از میانگین تقسیم بر تعداد نمره ها .به همین دلیل گاهی اوقات واریانس را میانگین مجذورها می نامند . واریانس میزان پراکندگی داده ها را در اطراف میانگین نشان می دهد . علامت واریانس برای     نمونه ی آماری s2 یا v  و برای جامعه ی آماری σ۲  (سیگما ) است . اگر همه ی اندازه های یک جامعه را داشته باشیم، می توانیم واریانس آن را محاسبه کنیم. ولی در اکثر اوقات تمام اندازه های یک جامعه را نداریم، بنا بر این سعی می کنیم بامحاسبه ی واریانس نمونه یا واریانس نمونه ها ، واریانس جامعه را برآورد می کنیم . واریانس نمونه بهترین برآورد از واریانس جامعه است . هرچند که واریانس نمونه( s2) بهترین برآورد از واریانس جامعه(σ ۲ )است ، ولی یک برآوردگر اریب از واریانس جامعه (σ ۲ ) است . با این حال اگر حجم نمونه بزرگ باشد ، می توانیمs  را برآورد معقولی از σ بدانیم.

محاسبه واریانس : روش های محاسبه واریانس عبارتند از : الف ـ محاسبه ی واریانس برای داده های بدون فراوانی و گرو ه بندی :جدول ۷ـ۱۳  توزیع پاسخگویان بر حسب سن    
۲۰۲۱۲۲۲۳۲۴۲۵ ۵/۲-=۵/۲۲-۲۰۵/۱-=۵/۲۲-۲۱۵/۰-=۵/۲۲-۲۲۵/۰=۵/۲۲-۲۳۵/۱=۵/۲۲-۲۴۵/۲=۵/۲۲-۲۵ ۲۵/۶۲۵/۲۲۵/۰۲۵/۰۲۵/۲۲۵/۶                                                                                           فرمول محاسبه ی واریانس برای داده های فاقد فراوانی وگروه بندی نشده عبارت است از :
از این فرمول وقتی استفاده می شود که بخواهیم از شاخص های آماری برای توصیف استفاده کنیم . از دو فرمول زیر وقتی استفاده می شود که بخواهیم واریانس جامعه را برآورد کنیم .  علت اینکه در مخرج فرمول گاهی n و گاهی n-1  استفاده شده، بخاطر این است که n-1 در نمونه های کوچک ، باعث می شود که برآورد واریانس جامعه از روی واریانس نمونه، دارای تورش

کمتری گردد . ولی در نمونه های بزرگ تفاوت زیادی نمی کند که در مخرج  n قرار دهیم یا n-1 .   ب- محاسبه واریانس برای داده های دارای فراوانی ولی گروه بندی نشده : جدول ۷ـ۱۴ توزیع پاسخگویان برحسب سن همراه با فراوانی آنهاxi Fi     
۲۰۲۱۲۲۲۳۲۴۲۵ ۸۱۱۴۱۰۹۸ ۱۶۰۲۳۱۸۸۲۳۰۲۱۶۲۰۰ ۲۵/۶۲۵/۲۲۵/۰۲۵/۰۲۵/۲۲۵/۶ ۵۰۷۵/۲۴۱۵/۲۲۵/۲۰۵۰    ۵/۱۴۸ 

ج ـ محاسبه ی واریانس برای داده های دارای فراوانی و گروه بندی شده :                   جدول ۷ـ۱۵ جدول توزیع پاسخگویان برحسب سن همراه با فراوانی آنها xi Fi MP FiMP    
۲۱-۲۰۲۳-۲۲۲۵-۲۴ ۱۹۱۴۱۷ ۵/۲۰۵/۲۲۵/۲۴ ۵/۳۸۹۳۱۵ ۹/۱-۱/۰۱/۲ ۶۱/۳۰۱/۰۴۱/۴ ۵۹/۶۸۱۴/۰۹۷/۷۴   ۱۱۲۱ ۷/۱۴۳ 

                                                                                              حد پایین طبقه +حدبالای طبقهMP =                                                                                                                    ۲                     خواص واریانس : ۱ـ اگر یک مقدار ثابت (مثلاً عدد۳)را به تمام مقادیر متغیر مورد بررسی اضافه کنیم، واریانس هیچ تغییری نمی کند . ۲ـ اگر یک مقدار ثابت( مثلاً عدد ۳)راتمام مقادیر متغیر مورد بررسی کم کنیم، واریانس هیچ تغییری نمی کند .۳ـ هنگامی که همه ی مقادیر متغیر را در یک مقدار ثابت (مثلاً ۳) ضرب کنیم، واریانس توزیع جدید ۳۲ برابر واریانس توزیع قدیم می شود . به عبارت دیگر واریانس توزیع جدید ۹ برابر واریانس توزیع قدیم می شود . ۴ـ هنگامی که همه ی مقادیر متغیر را بر یک مقدار ثابت (مثلاً عدد ۳) تقسیم کنیم، واریانس توزیع جدید ۳۲ برابر از وریانس توزیع قدیم کوچکتر می شود . مثلاً، اگر همه ی اعداد یک مجموعه را بر عدد ۳ تقسیم کنیم، واریانس آنها بر ۹ تقسیم می شود . روش اجرای واریانس : ۱ـ ابتدا منو analyze و سپس فرمان descriptive statistics  را کلیک می کنیم . ۲ـ فرمان frequencies  را کلیک کرده و سپس متغیر مورد بررسی را به بخش variables منتقل می کنیم. ۳ـ گزینه ی statistics را کلیک کرده و سپس گزینه ی variance را انتخاب می کنیم. ۴ـ گزینه ی continue و سپس ok را کلیک می کنیم. ۷ــ۳ـ۳ــ۲ـ۳ ـ انحراف معیار  :انحراف معیار ریشه ی دوم یا جذر واریانس است . علامت انحراف معیار در نمونه ی آماری sوsd ودر جامعه ی آماری σ است . انحراف معیار مانند واریانس، میزان پراکندگی داده ها را در اطراف میانگین نشان می دهد . هرچه انحراف معیار کوچکتر باشد ، نشانگر این واقعیت است که نمونه های مورد مطالعه از لحاظ ویژگی مورد سنجش متجانس تر هستند و تغییر پذیری آنها کمتر است . یعنی اختلاف بین نمونه ها کمتر است و میانگین پراکندگی داده ها را بهتر نشان می دهد . و هنگامی که انحراف معیار بزرگ باشد، عکس این حالات رخ می دهد . البته باید به این نکته توجه داشت عوامل متعددی بر اندازه ی انحراف م

عیار تأثیر دارند. یکی از این عوامل واحد اندازه گیری متغیر مورد بررسی است . مثلاً، انحراف معیار درآمد پاسخگویان هنگامی که با واحد ریال ذکر شود، بزرگتر از انحراف معیار درآمد پاسخگویان همان نمونه، در هنگامی است که با واحد تومان ذکر شود . وقتی دو گروه دارای میانگین مشابهی

باشند ، میانگین گروهی که انحراف معیار آن کمتر باشد، خلاصه ی بهتری از داده ها ار

ائه می کند، زیرا در اینجا افراد شبیه تر به یکدیگر اند و پراکندگی نمرات آنها کمتر است . مثلاً، دوکلاس A و B  داریم به طوری که در کلاس A ، میانگین نمرات دانشجویان ۱۵ و انحراف معیار ۵/۱ و کلاس B  دارای میانگین ۱۵ و انحراف معیار ۲ است . در اینجا نمرات دانشجویان در کلاس A شبیه تر به یکدیگر است و پراکندگی کمتری دارند زیرا انحراف معیار کوچکتری دارد . هنگامی می توان دو انحراف معیار را مقایسه کرد که دامنه ی تغییر نمرات و واحد اندازه گیری آنها یکسان باشد . مثلاً، نمی توان پراکندگی دو متغیر وزن و قد را با یکدیگر مقایسه کرد. زیرا اولاً، دامنه ی تغییرات این متغیرها با یکدیگر تفاوت دارد و ثانیاً ، واحد اندازه گیری آنها متفاوت است. زیرا واحد اندازه گیری قد ، سانتیمتر و واحد اندازه گیری وزن کیلوگرم است . حتی اگر واحد اندازه گیری دو گروه یکسان باشد ولی دامنه ی تغییر آنها تفاوت داشته باشد، نمی توان این دو گروه را با یکدیگر مقایسه کرد. مثلاً نمی توان انحراف معیار وزن دانش آموزان یک مدرسه ی ابتدایی را با انحراف معیار وزن دانشجویان یک دانشگاه مقایسه کنیم . زیرا بزرگی انحراف معیار وزن دانشجویان، ممکن است به خاطر وزن بالای آنها نسبت به دانش آموزان راهنمایی باشد، نه به خاطر اینکه تغییرات در بین وزن دانشجویان بیشتر است.  در چنین مواقعی بهتر است بجای استفاده از انحراف معیار برای مقایسه تغییرات گروه ها ، از ضریب تغییرا ت استفاده نمود .  محاسبه ی انحراف معیار : روش های محاسبه انحراف معیار عبارتند از : الف ـ محاسبه ی انحراف معیار برای داده های بدون فراوانی و گروه بندی : جدول ۷ـ۱۳ را در نظر بگیرید، در این جدول سن تعدادی از دانشجویان یک کلاس ارائه شده است انحراف معیار این داده ها را محاسبه می کنیم:                            ۲۵،۲۴،۲۳،۲۲،۲۱،۲۰     
۲۰۲۱۲۲۲۳۲۴۲۵ ۵/۲-=۵/۲۲-۲۰۵/۱-=۵/۲۲-۲۱۵/۰-=۵/۲۲-۲۲۵/۰=۵/۲۲-۲۳۵/۱=۵/۲۲-۲۴۵/۲=۵/۲۲-۲۵ ۲۵/۶۲۵/۲۲۵/۰۲۵/۰۲۵/۲۲۵/۶ 
   

 ب ـ محاسبه ی انحراف معیار برای داده های دارای فراوانی ولی گروه بندی نشده : جدول ۷ـ۱۴ را در نظر بگیرید . دراین جدول سن تعدادی از دانشجویان همراه با فراوانی هر کدام از سنین ارائه شده است . حال به محاسبه ی انحراف معیار این داده ها می پردازیم . 

xi Fi       
۲۰۲۱۲۲۲۳۲۴۲۵ ۸۱۱۴۱۰۹۸ ۱۶۰۲۳۱۸۸۲۳۰۲۱۶۲۰۰ ۵/۲-۵/۱-۵/۰-۵/۰۵/۱۵/۲ ۲۵/۶۲۵/۲۲۵/۰۲۵/۰۲۵/۲۲۵/۶ ۵۰۷۵/۲۴۱۵/۲۲۵/۲۰۵۰ ۵۰ ۱۱۲۵  ۵/۱۷ ۵/۱۴۸ 

 

 ج ـ محاسبه ی انحراف معیار برای داده های دارای فراوانی و گروه بندی شده : با توجه به جدول ۷ـ۱۵ به محاسبه ی انحراف معیار این داده ها می پردازیم : xi Fi MP FiMP    
۲۱-۲۰۲۳-۲۲۲۵-۲۴ ۱۹۱۴۱۷ ۵/۲۰۵/۲۲۵/۲۴ ۵/۳۸۹۳۱۵۹/۱۱/۰۱/۲ ۶۱/۳۰۱/۰۴۱/۴ ۵۹/۶۸۱۴/۰۹۷/۷۴
۱۱۲۱ ۷/۱۴۳ 
تصحیح شپرد  : در مثال هایی که حل نمودیم میانگین اعداد طبقه بندی نشده برابر با۵/۲۲ ولی اعداد طبقه بندی شده برابر با ۴/۲۲ شد . طبقه بندی کردن اطلاعات این تفاوت را بوجود آورده است . به این خطای به وجود آمده ، خطای طبقه بندی می گویند. هرچه فاصله ی طبقات بیشتر باشد این خطای طبقه بندی هم بیشتر می شود . برای اینکه این خطا را در انحراف معیار کاهش دهیم ، باید انحراف معیار محاسبه شده را تصحیح کنیم برای تصحیح انحراف معیار از فرمول زیر استفاده می کنیم که به تصحیح شپرد معروف است .   sC= انحراف معیار تصحیح شده s= انحراف معیار محاسبه شده I = فاصله ی طبقاتی معایب انحراف معیار : ۱ـ انحراف معیار هیچ وقت کمتر از صفر نمی شود . ۲ـ حدبالای انحراف معیار باز است . ۳ـ در توزیع های دارای چولگی زیاد ، کارایی آن پایین است، زیرا نمرات خیلی بزرگ یا کوچک در انحراف معیار تأثیر می گذارند. در چنین شرایطی بهتر است از انحراف چارکی یا انحراف متوسط استفاده نمود .  

محاسن انحراف معیار : ۱ـ انحراف معیار تحت تأثیر همه ی نمرات قرار دارد، بنابراین معتبرترین و با  ثبات ترین شاخص پراکندگی است . اگر نمونه های زیادی از جامعه انتخاب کنیم، انحراف معیار آنها خیلی به هم نزدیک خواهد بود. ۲ـ در آمار استنباطی کاربرد گستره ای دارد . ۳ـ با انحراف معیار امکان انجام عملیات ریاضی وجود دارد . ۴ـ با استفاده از انحراف معیار می توانیم مشخص کنیم، چند درصد نمرات در فواصل مختلف نسبت به میانگین قرار دارند. مثلاً، ۲۸/۶۸ درصد نمرات به مقدار یک انحراف معیار بیشتر یا کمتر از میانگین قرار دارند . حال ممکن است این سوال پیش آید که استفاده از انحراف معیار بهتر است یا واریانس ؟ درپاسخ باید گفت که، تفسیر از طریق انحراف معیار دقیق تر و با مفهوم تر است. مثلاً وقتی واریانس قد پاسخگویان ۱۰۰ سانتی متر، درحالی که انحراف معیارش ۱۰ سانتی متر باشد ، در اینجا انحراف معیار مفهوم بیشتری نسبت به واریانس دارد . روش اجرای انحراف معیار:۱ـ ابتدا منو analyze و سپس فرمان descriptive statistics  را کلیک می کنیم . ۲ـ فرمان frequencies را کلیک کرده و سپس متغیر مورد بررسی را به بخش variables       منتقل می کنیم. ۳ـ گزینه ی statistics را کلیک کرده و سپس گزینه یstd.deviation  را انتخاب می کنیم. ۴ـ گزینه ی  continueو سپس ok را کلیک می کنیم.۷ـ۳ـ۳ـ۲ـ۴ـ  گشتاور   : اگر یک متغیر n  بار مورد اندازه گیری قرار بگیرد و اندازه های    را بدست آوریم ، میانگین انحراف این اعداد از میانگین گشتاور نامیده می شود . گشتاور را با m  نشان می دهند و فرمول های محاسبه ی آن در جدول ۷ـ۱۶ ارائه شده است . 
جدول ۷ـ۱۶ فرمول های محاسبه گشتاور مرتبه اول ، دوم ، سوم و چهارم اگر داده ها فاقد فراوانی باشد اگر داده ها دارای فراوانی باشدگشتاور مرتبه ی اول =m1  

گشتاور مرتبه ی دوم =m2       
گشتاور مرتبه ی سوم =m3       
گشتاور مرتبه ی چهارم =m4   
واریانس ومیانگین ،هم گشتاور محسوب می شوند . مثال ـ وزن تعدادی از دانشجویان یک کلاس در جدول ۷ـ۱۷ ارائه شده است . حال مقدار گشتاورها را با توجه به این اطلاعات محاسبه می کنیم. جدول ۷ـ۱۷ جدول توزیع وزن دانشجویانx Fi        
۷۰۷۱۷۲۷۳۷۴۷۵ ۵۶۷۳۸۵ ۵/۲-۵/۱-۵/۰-۵/۰۵/۱۵/۲ ۲۵/۶۲۵/۲۲۵/۰۲۵/۰۲۵/۲۲۵/۶۲۵/۳۱۵/۱۳۷۵/۱۷۵/۰۱۸۲۵/۳۱ ۶۲/۱۵-۳۷/۳-۱۲/۰-۱۲/۰۷/۳۶۲/۱۵ ۱/۷۸-۲۲/۲۰-۸۴/۰-۳۶/۰۹۶/۲۶۱/۷۸۰۶/۳۹۰۶/۵۰۶/۰۰۶/۰۰۶/۵۰۶/۳۹ ۳/۱۹۵۳۶/۳۰۴۲/۰۱۸/۰۴۸/۴۰۳/۱۹۵
۵۰ ۰ ۵/۱۷ ۵/۹۶ ۰ ۲۶/۶ ۳۶/۸۸ ۰۴/۴۶۲
                                                                          ۷ـ۳ـ۳ـ۲ـ۵ـ  کشیدگی    : کشیدگی میزان پراکندگی یا انباشتگی داده های یک متغیر را نشان می دهد . بعبارت دیگر میزان بلندی یا پخی یک توزیع را نشان می دهد . هرچه پراکندگی داده ها از میانگین کمتر باشد ، توزیع کشیده تر می شود (مانند شکل ۷ـ۲) و هرچه پراکندگی داده ها از میانگین بیشتر باشد توزیع پخ تر (خوابیده تر ) است .(مانند شکل ۷ـ۳)

ضریب کشیدگی را با  k نشان می دهند و فرمول محاسبه آن عبارت است از :  k = ضریب کشیدگی m4 = گشتاور مرتبه ی چهارم m2 = گشتاور مرتبه ی دوم پس برای محاسبه ی کشیدگی از گشتاور مرتبه ی دوم و گشتاور مرتبه ی چهارم استفاده می شود . هنگامی که مقدار ضریب کشیدگی (k)  کوچکتر از صفر باشد، کشیدگی از نوع منفی است . در این صورت منحنی توزیع به صورت نیمه برآمده وپخ تر از منحنی توزیع نرمال می شود در کشیدگی منفی دامنه ی تغییر بین متغیرها زیاد است . هنگامی که مقدار ضریب کشیدگی بزرگتر از صفر باشد، کشیدگی از نوع مثبت است ، در این صورت منحنی توزیع، کشیده تر از منحنی توزیع نرمال          می شود. درصورتی که مقدار ضریب کشیدگی مساوی با صفر باشد، کشیدگی نرمال است . در این هنگام منحنی توزیع برابر با توزیع نرمال می شود . مثال ـ توزیع سن تعدادی از پاسخگویان در جدول ۷ـ۱۴ ارائه شده است. با توجه به آن اطلاعات، مقدار ضریب کشیدگی را محاسبه می کنیم. x            
۲۰۲۱۲۲۲۳۲۴۲۵ ۸۱۱۴۱۰۹۸ ۵/۲-۵/۱-۵/۰-۵/۰۵/۱۵/۲ ۲۵/۶۲۵/۲۲۵/۰۲۵/۰۲۵/۲۲۵/۶ ۵۰۷۵/۲۴۱۵/۲۲۵/۲۰۵۰ ۵/۳۱۲۶۸/۵۵۲۵/۰۶۲۵/۰۵۶/۴۵۵/۳۱۲
۵۰ ۰ ۵/۱۷ ۵/۱۴۸ ۱۱/۷۲۷                                                                  چونکه ضریب کشیدگی کوچکتر از صفر (۳۵/۱-> 0)  است ، نتیجه می گیریم توزیع دارای کشیدگی منفی است. در این جا منحنی توزیع پخ تر (پایین تر ) از منحنی نرمال است . روش اجرای کشیدگی : ۱ـ ابتدا منو analyze و سپس فرمان descriptive statistics  را کلیک می کنیم. ۲ـ فرمان frequencies  را کلیک کرده و سپس متغیر مورد بررسی را به بخش variables     منتقل می کنیم

 

این فقط قسمتی از متن مقاله است . جهت دریافت کل متن مقاله ، لطفا آن را خریداری نمایید
word قابل ویرایش - قیمت 30000 تومان در 426 صفحه
300,000 ریال – خرید و دانلود
سایر مقالات موجود در این موضوع
دیدگاه خود را مطرح فرمایید . وظیفه ماست که به سوالات شما پاسخ دهیم

پاسخ دیدگاه شما ایمیل خواهد شد