بخشی از مقاله

کاربرد آمار در علوم رفتاری همراه با دستورات SPSS و نحوه ی تفسير خروجی هاکاربرد آمار در علوم رفتاری همراه با دستورات SPSS و نحوه ی تفسير خروجی ها

SPSS  آشنايي با 1ـ1 ـ نحوه ي ورود به: SPSS قبل از آشنايي با محيط SPSS و نحوه ي ورود به محيط آن بهتر است با محيط ويندوز آشنا شويم . ويندوز داراي يك محيط گرافيكي به نام ميزكار   است ،كه از قسمت هاي متفاوتي تشكيل شده است .اين قسمت ها عبارتند از :1ـ نمادهاي گرافيكي يا آيكون   :آيكونها تصاوير كوچكي هستند كه هريك از تصاوير با كاربردهاي آن متناسب

است . كاربردي كه هرآيكون مي تواند داشته باشد عبارتند از :  يكي اجراي يك برنامه و ديگري باز كردن پنجره .2ـ نوار كار   : نوار كار ، خود از قسمت هاي زير تشكيل شده است :الف ـ نوار ابزار   ب ـ برنامه هاي در حال اجرا : ويندوز طوري طراحي شده است كه در آن واحد مي توان چند برنامه را در محيط ويندوز بازكرد . وقتي يك برنامه در ويندوز اجرا مي شود ، در قسمت نوار كار كليد هاي كوچكي كه نشان دهنده ي برنامه فعال مي باشد ، قابل مشاهده است . به اين قسمت از نوار كار كه برنامه ي فعال را نشان مي دهد ، برنامه ي درحال اجرا گفته مي شود . ج ـ سيني نوار ابزار   : سيني نوار ابزار شامل : ساعت ، تقويم ، صدا و قسمت هاي ديگر  مي باشد . دـ دكمه شروع    : كاربردهايي كه اين دكمه مي تواند داشته باشد عبارتند از : باز كردن پنجره ها ، بكارگيري ابزار و محيط هاي كمكي ويندوز و خاموش كردن كامپيوتر . ميزكار و قسمت هاي مختلف آن در شكل 1ـ1 ارائه شده است . 

 


                                                                                                                                                                                                  آيكون 
                                                                                نوار ابزارسيني نوار ابزار برنامه ي در حال اجرا نوار ابزار دكمه ي شروع
براي وارد شدن به محيط spss دو راه وجود دارند كه عبارتند از :1ـ در پنجره ي ميزكار روي آيكون spss 11.5 for windows  دوبار كليك مي كنيم تا وارد محيط spss شويم . 2ـ راه ديگر اين است كه در پنجره ي ميزكار ابتدا روي گزينه ي start (در قسمت گوشه نوار كار ) ، سپس روي گزينه ي programs  ( برنامه ها) كليك مي كنيم تاليستي از برنامه هاي موجود باز شود . در مرحله ي آخر روي گزينه ي spss 11.5 for windows كليك مي كنيم تاوارد محيط spss شويم. مراحل بالا را مي توان به طور خلاصه چنين بيان كرد :                           start       programs         spss 11.5 for windows                                     1ـ2 ـ پنجره هاي spss : spss داراي سه پنجره ي مهم است كه عبارتند از :1ـ پنجره ي صفحه ي متغير ها 2ـ پنجره ي صفحه ي كاربرگ براي وارد كردن داده ها 3ـ پنجره ي نمايش خروجي براي مشاهده ي نتايج محاسبه ها ، جداول ، نمودارها و … 1ـ2ـ1 ـ پنجره ي صفحه ي متغيرها : براي اينكه بتوانيم با spss كار كنيم بايد هم متغيرها را تعريف كنيم و هم داده ها را در صفحه ي كاربرگ وارد كنيم . براي اينكه متغيرها را تعريف كنيم ، ابتدا روي منوي view و سپس فرمان variabels كليك مي كنيم تا پنجره ي صفحه ي متغيرها مانند شكل 1ـ2 ظاهر شود.

Name Type width Decimal s Label Values Missing Columns Align Measure1 Var00001 Numeric None None Right Scale2 Var00002 Numeric None None Right Scale3 Var00003 Numeric None None Right Scale4 Var00004 Numeric None None Right Scale

پنجره ي صفحه ي متغيرها داراي ده ستون است كه عبارتند از :1ـ ستون name  : در اين ستون مي توانيم يك نام دلخواه (البته با توجه به ماهيت متغير ) وارد كنيم . 2ـ ستون type    : اين ستون شامل نوع متغير است . 3ـ ستون  width : در اين ستون مي توانيم تعداد اعداد صحيح متغير را با كليك كردن روي آنها افزايش يا كاهش دهيم . 4ـ ستون  decimals : در اين ستون مي توانيم تعداد ارقام اعشار را براي يك متغير مورد بررسي كاهش يا افزايش دهيم . 5ـ ستون label  :  در اين

ستون مي توانيم برچسبي براي متغير وارد كنيم يا ستون را خالي بگذاريم . 6ـ ستون  values: اين ستون مقادير متغير را نشان مي دهد . براي تعريف مقادير متغير مراحل زير را انجام مي دهيم : روي ستون هاي پايين ستون values كليك مي كنيم تا پنجره اي به شكل 1ـ3 ظاهر شود . 


فرض كنيد مي خواهيم  x43 را تعريف كنيم . براي اين كار مراحل زير را انجام مي دهيم :الف- ابتدا دوبار روي x43 كليك مي كنيم، يا اينكه ابتدا روي منوي data و سپس فرمان         define variable كليك مي كنيم . ب - در كادر خالي جلو variable name ، x43  را تايپ كرده ، سپس روي گزينه ي labels كليك مي كنيم . ج-  در كادر خالي جلوي variable label يك نام دلخواه با توجه به ماهيت متغير تايپ مي كنيم . به عنوان مثال ما در اينجا عنوان تحصيلات را انتخاب كرده ايم . د-  دركادر خالي جلو value كد گزينه و در كادر خالي جلوvalue label خود گزينه را تايپ كنيم. بعنوان مثال اگر داشته باشيم :بي سواد    þ 0       ابتدايي     þ  1   راهنمايي   þ  2      متوسطه  þ  3   ديپلم  þ  4        تحصيلات دانشگاه    þ  5  حال اگر بخواهيم گزينه ي بي سواد را تعريف كنيم در قسمت كادر خالي جلوي value عدد صفر و در كادر خالي جلو value label عنوان بي سواد را تايپ مي كنيم . ت - سپس گزينه add  را كليك مي كنيم . ﻫ - در آخر هم گزينه ي continue و سپس ok را كليك مي كنيم . 7ـ ستون missing   : اين ستون مقادير غايب را نشان مي دهد. 8 ـ ستون columns  : اين ستون عرض ستون ها را نشان مي دهد . اگر بخواهيد عرض ستون ها را كاهش يا افزايش دهيد ، روي خط كناري هر ستون كليك چپ كنيد ، سپس نشانگر ماوس را به طرف راست يا چپ بكشيد تا عرض ستون به اندازه دلخواه شود . 9ـ ستون Align  : اين ستون تراز داده ها را نشان مي دهد . به سه صورت مي توان تراز داده ها را نشان داد، كه عبارتند از:الف ـ تراز راست  ب ـ تراز مركز  ج ـ تراز چپ  (در spss  تراز راست از پيش تعيين شده است).10 ـ ستون measure  : اين ستون مقياس اندازه گيري داده ها را نشان مي دهد . اين مقياس مي تواند اسمي ، ترتيبي ، فاصله اي يا نسبي باشد . 1ـ2ـ2ـ پنجره ي صفحه كاربرگ   : هنگامي كه به محيط spss  وارد مي شويم اولين پنجره اي كه ظاهر مي شود پنجره ي صفحه كاربرگ است . كاري كه با اين پنجره مي توان انجام داد اين است كه داده هاي خود را براي تحليل بايد در اين پنجره وارد نمود . شكل پنجره ي صفحه ي كاربرگ و قسمت هاي مختلف آن در شكل 1ـ4 ارائه شده است. 

پنجره ي صفحه ي كاربرگ داراي قسمت هاي مختلفي است كه اين قسمت ها عبارتند از :1ـ نوار عنوان : نوار عنوان ، نام نرم افزار و نام فايل جاري را نشان مي دهد . 2ـ نوار منو   :  در نوار منو كلماتي كه هركدام موضوع يك سري منو هستند نوشته شده است. اين منوها عبارتند از : 1ـ منو File 2ـ منو Edit 3ـ منو View 4ـ منوData  5ـ منو Transform  6ـ منو Analyze  7ـ منوGraphs   8ـ منو Utilities  9ـ منو Window 10ـ منوHelp  زير اولين حرف هركدام از اين كلمات خطي كشيده شده است كه فايده ي اين خطوط اين است كه   مي توان با استفاده از كليد ALT  و هر يك از حروفي كه در زير آنها خطي كشيده شده ، آن موضوع را انتخاب نمود . از سوي ديگر ، همچنين مي توان با كليك روي هركدام از منوها، به محتويات آن منو دسترسي پيدا كرد . 3ـ نوار ابزار: نو

ار ابزار شامل17 دكمه است كه هركدام از اين دكمه هاكاريك فرمان را انجام          مي دهند .4ـ متغير   :  هر ستون يك متغير محسوب مي شود . نام يك متغير بايد چندين شرط داشته باشد. اولاً مي بايست با حرف شروع شود، ثانياً در انتهاي آن نقطه نباشد،  ثالثاً از 8 كاراكتر بيشتر نباشد و رابعاً نبايد شامل فاصله ،  ؟  ، *  و … باشد . 5 ـ نمونه   : هر سطر يا ركورد يك نمونه مح

سوب مي شود . 6 ـ خانه  : محل ورود داده ها خانه ناميده مي شود ،كه در واقع محل تلاقي يك سطر و يك ستون است. براي ورود داده ها در خانه ها، ابتدا نشانگر ماوس را در خانه مورد نظر برده، سپس براي فعال شدن خانه روي آن كليك چپ مي كنيم.در مرحله ي بعد، داده ي مورد نظر را در خانه وارد مي كنيم.  حال اگر بخواهيم خانه ي بعدي در سطر را فعال كنيم يا كليد          ولي اگر بخواهيم خانه ي بعدي را در ستون فعال كنيم يا كليد                                                       را  مي زنيم. 1ـ2ـ3 ـ پنجره ي نمايش خروجي : پنجره ي نمايش خروجي از دو بخش تشكيل شده است كه عيارتند از : 1ـ outline pane   2ـ  display pane    اين دو قسمت در شكل 1ـ5 نمايش داده شده اند .

1ـoutline pane: اين قسمت شامل نماي كلي اجزاي خروجي است كه شامل چندين آيكون است و هر آيكون نماينده ي بخشي از خروجي است . براي اينكه ببينيم هر آيكون نماينده ي كدام بخش ازخروجي است روي آن كليك مي كنيم. 2ـ  display pane : در اين قسمت خود خروجي نمايش داده مي شود . براي كوچك يا بزرگ كردن هر كدام از بخش ها ، روي خط جداكننده دو بخش ، كليك چپ مي كنيم ، سپس نشانگر ماوس را براي كوچك يا بزرگتر كردن بخش مورد نظر به چپ يا راست مي كشيم تا بخش مورد نظر به     اندازه ي دلخواه شود. 1ـ3 اضافه كردن يك سطر :  براي اضافه كردن يك سطر جديد در پنجره ي صفحه ي كاربرگ مراحل زير را انجام مي دهيم:1ـ خانه اي كه مي خواهيم يك سطر جديد بالاي آن ايجاد  شود را انتخاب مي كنيم . 2ـ منو data و سپس فرمان insert case را كليك مي كنيم . 1ـ4 ـ حذف يك سطر : براي حذف يك سطر در پنجره ي صفحه ي كاربرگ: مراحل زير را انجام مي دهيم :1ـ با نشانگر ماوس ، روي شماره ي سطري كه مي خواهيم حذف شود كليك مي كنيم . 2ـ منو edit و سپس فرمان clear را كليك مي كنيم  . يا اينكه كليد delete در صفحه كليد را     مي زنيم .1ـ5 ـ اضافه كردن يك ستون : 1ـ يكي از خانه هاي سمت راست مكاني را كه مي خواهيم يك ستون جديد در سمت چپ آن ايجاد شود را، انتخاب مي كنيم . 2ـ منو data و سپس فرمان insert variable را كليك مي كنيم . 1ـ6  ـ حذف كردن يك ستون : 1ـ با نشانگر ماوس روي متغيري كه مي خواهيم حذف شود كليك مي كنيم . 2ـ منو editو سپس فرمان clear را كليك مي كنيم . يا اينكه كليد deleteدر صفحه كليد را        مي زنيم. 1ـ7 ـ مراحل ضبط اطلاعات :براي ضبط اطلاعات ، ابتدا روي منو file كليك چپ نموده، سپس فرمان save را انتخاب مي كنيم تا پنجره ي ضبط اطلاعات نمايان شود . در اين پنجره در مقابل save in  كشوهايي وجود دارد ، هركشويي را كه مي خواهيم اطلاعات در آن ضبط شود، انتخاب مي

كنيم . سپس يك نام براي اطلاعات ، انتخاب كرده و آن نام رادر كادر خالي مقابل file name تايپ نموده و در آخر روي گزينه ي save كليك چپ مي كنيم تا اطلاعات جديد ضبط شود . 1ـ8 ـ چاپ اطلاعات : براي چاپ اطلاعات، ابتدا تمام يا قسمتي از اطلاعاتي را كه مي خواهيم چاپ شود ، انتخاب مي كنيم .بعد از منو file فرمان  print   را انتخاب مي كنيم تا پنجره ي چاپ شبيه شكل 1ـ6 ظاهر شود . 


اگر بخشي از اطلاعات را فعال كرده ايد صفحات فعال شده را در قسمت page from      to

      تايپ كنيد و سپس گزينه ي ok را كليك كنيد . ولي اگر تمام اطلاعات را فعال كرده ايد          گزينه ي All را انتخاب و پس از آن گزينه ي ok را كليك كنيد . 1ـ9 ـ خروج ازspss : اگر بعد از چاپ اطلاعات بخواهيم از محيط spss خارج شويم، ابتدا منو file را انتخاب كرده، سپس فرمان exit  را كليك مي كنيم تا از محيط spss خارج و به محيط ويندوز وارد شويم . 2ـ1ـ تاريخچه ي آمار : استفاده از آمار به زمان هاي خيلي دور بر مي گردد ،شايد نتوان به طور دقيق مشخص نمود كه بشر از چه زماني از آمار استفاده نموده است ، ولي مي توان حدود آن را حدس زد. شايد بتوان گفت تاريخچه ي آمار به زماني برمي گردد كه قبايل ابتدايي براي اينكه از تعداد اسرا و همچنين تعداد مردان جنگي خود براي استفاده از آنها در جنگ آگاه شوند ، به شمارش آنها  مي پرداختند. در دورانهاي بعد ، وقتي دولتها به وجود آمدند، براي اينكه از وضع اقتصادي (براي ماليات گيري ) ، اجتماعي (براي سربازگيري ) و ساير امور مربوط به كشورداري و سياست و … آگاهي    يابند ، دست به آمارگيري زدند و استفاده از آمار متداول گشت. از جمله كشورهايي كه شايد بتوان گفت ، قبل از ساير كشورها از آمار براي مقاصد دولتشان استفاده كرده اند به هندوستان ، چين و مصر اشاره كرد . در قرن حاضر هم ، علم آمار، ياور ساير علوم شده است، زيرا فنوني كه در تحقيقات علمي مورد استفاده قرار مي گيرند از علم آمار بدست مي آيند . 2-2-  تعريف آمار و انواع آن :  لغت آمار در زبان فارسي معادل واژه انگليسي  statistics است، كه از ريشه ي لاتيني state كه به معني دولت مي باشد، گرفته شده است  . آمار در لغت به معني حساب كردن و شمارش كردن است ، ولي تعريف اصطلاحي آمار متفاوت از تعريف لغوي آن است . آمار در اصطلاح عبارت است از علمي كه وظايف آن عبارتند از :الف ـ اصول و فنون جمع آوري ، نمايش و گروه بندي داده ها ب ـ تجزيه و تحليل داده ها  ج ـ توصيف ، تبيين ، نتيجه گيري و تعميم نتايج . پس هدف آمار توصيف و استنباط است. بنابراين، علم آمار از دو بخش آمار توصيفي و آمار استنباطي تشكيل شده است.2ـ2ـ1  ـ آمار توصيفي   : آمار توصيفي مجموعه روش هايي است كه هدف آنها عبارت است از : توصيف اطلاعات بدست آمده ، طبقه بندي و منظم كردن داده ها، تهيه جداول ، رسم نمودار و خلاصه كردن اطلاعات. با توجه به توضيحاتي كه گفته شد .    مي توان گفت ، مهمترين هدف آمار توصيفي اين است كه داده را براي اينكه خوانا و قابل فهم شوند ، تقليل و پالايش دهد . 2ـ2ـ2 ـ آمار استنباطي    : زماني كه يك محقق مي خواهد تحقيقي را انجام دهد ، هدفش اين نيست كه فقط اطلاعاتي درباره ي آن گروه كوچك بدست بياورد .  بلكه مي خواهد اطلاعات مورد نياز در مورد جامعه ي آماري  را از طريق اين نمونه ي آماري بدست آورد. البته در اين كار كمي عدم اطمينان وجود خواهد

داشت. در آمار استنباطي بر پايه ي احتمالات ، ويژگي هاي يك جامعه از روي ويژگي هاي نمونه ي آماري استنباط مي شود . به عبارت ديگر به كمك آمار استنباطي نگاه مي كنيم ببينيم آيا مي توانيم با اطمينان، نتايج بدست آمده از نمونه ي آماري را به كل جامعه ي آماري تعميم دهيم يا خير . پس كار آمار استنباطي نتيجه گيري از شواهد و تعميم دادن اطلاعات است . 2-3- اصطلاحات آماري

:2-3-1-جامعه ي آماري   : جامعه ي آماري، مجموعه اي از اشيا ، افراد ، اعداد و يا چيزهايي است كه در يك يا چند صفت مشترك هستند. مثلاً مي خواهيم در سال 1384 تحقيقي در زمينه ي سنجش گرايش روستاييان 64ـ15 ساله ي استان همدان به مهاجرت انجام دهيم . در اين تحقيق همه ي روستاييان ساكن روستا در استان همدان در سال 1384 كه 64ـ 15 سال سن دارند جامعه ي آماري ما را تشكيل مي دهند . 2ـ3ـ2 ـ نمونه ي آماري :  نمونه ي آماري، مجموعه اي از اشيا ، افراد ، اعداد يا چيزهايي است كه ويژگي ها و صفات جامعه ي آماري را داراست و از جامعه ي آماري با روش هاي احتمال و شانس انتخاب مي شوند . 
2ـ3ـ3‌‌ ـ ثابت و متغير :2ـ3ـ3ـ1 ـ ثابت   :  ثابت ويژگي هايي است كه نزد افراد ، اعداد يا چيزهايي مختلف ، مقادير آن يكسان است. مثلاً اگر محققي تعدادي دانشجو دختر را كه 25 سال سن دارند، بعنوان نمونه انتخاب كند، در اين صورت جنس و سن ثابت ناميده مي شوند .2ـ3ـ3ـ2 ـ متغير :  متغير كميتي است كه از يك مشاهده به مشاهده ي ديگر، از واحدي به واحد ديگر و از يك فرد به فرد ديگر، مقادير مختلفي (حداقل دو ارزش يا دو عدد) را اختيار كند .

به عنوان مثال نمرات حاصله از آزمون آمار ، يك متغير است چونكه اين نمرات از فردي به فردديگر مختلف است . يا مثلا‌ًَ جنسيت يك متغير است كه مقوله هاي آن عبارتند از : زن و مرد . 2ـ3ـ4 ـ انواع متغير : 2ـ3ـ4ـ1 ـ انواع متغير از نظر ماهيت مقاديري كه مي پذيرند : 2ـ3ـ4ـ1ـ1 ـ متغير كيفي يا مقوله اي   : متغير كيفي يك ويژگي حالت هاي گوناگوني را شامل مي شود ، به اين حالت هاي گوناگون يك ويژگي متغير كيفي مي گويند. يا به عبارت ديگر متغيري استكه نتواند ارزشهاي  مثل جنسيت (زن ، مرد )،  مذهب ( مسلمان ، مسيحي ، كليمي و … ). ما نمي توانيم متغير كيفي را اندازه گيري كرده و با ارقام رياضي نشان دهيم ، بنابراين بايد از كد و نماد قراردادي استفاده كنيم . متغير كيفي خود به دو دسته تقسيم مي شوند : الف ـ متغير كيفي قابل رتبه بندي   : در م

تغير كيفي قابل رتبه بندي، مي توانيم مقوله ها را رتبه بندي كنيم. مثل طبقه ي اجتماعي (بالا ، متوسط ، پايين ) .ب‌‌ـ متغير كيفي غير قابل رتبه بندي   : در متغير كيفي غير قابل  رتبه بندي نمي توانيم مقوله ها را رتبه بندي كنيم. مثل جنسيت (زن ، مرد ) ، نژاد ( سفيد ، سياه ، زرد )، گروه خوني( O , AB , B, A )، رنگ چشم (مشكي ، قهوه اي ، آبي ، سبز و … ). 2ـ3ـ4ـ1ـ2 ـ متغير كمي   : متغير كمي به متغيري اطلاق مي شود كه بتواند مقادير يا ارزشهاي عدد گوناگوني را اختياركند . متغيركمي داراي واحد اندازه گيري و مبدأ اندازه گيري است و در آن      مي توان برطبق قاعده اي معين عدد به ويژگي آزمودني ها نسبت داد. مانندسن ، قد، وزن ، معدل و … متغير كمي خود به دو دسته ي پيوسته و گسسته(جدا) تقسيم مي شود : الف ـ متغير كمي پيوسته   : متغيري است كه بين هر دو مقدار متوالي آن مقادير بي شماري (اعشاري ، كسري و … ) مي توان پيدا كرد و مقاديري كه بين هر دو مقدار متوالي آن وجود دارد داراي معني و مفهوم است. مانند قد يا وزن. مثلاً بين قد 179 و 178 مي توان مقادير ديگري را پيدا نمود بعنوان مثال 7/178  يا 2/178  كه اين مقادير داراي معني و مفهوم هستند . ب ـ متغير كمي گسسته   : متغيري است كه بين هر دو مقدار متوالي آن نمي توان مقادير ديگري را پيدا كرد . بعبارت ديگر مقاديري كه بين دومقدار متوالي آن وجود دارد، معني و مفهومي ندارند. مثلاً وقتي تعداد دانشجويان رشته جامعه شناسي دانشگاه فردوسي 200 نفر باشد ، انتخاب عدد 2/190 يا 7/199 داراي هيچ معني و مفهومي نمي باشد . 2ـ3ـ4ـ2 ـ انواع متغيرها از نظر نقش آنها در تحقيق : متغير ها از نظر نقشي كه در تحقيق دارند به پنج دسته تقسيم مي شوند، كه عبارتند از: ا- متغير مستقل 2- متغير وابسته 3- متغير تعديل كننده       4- متغير كنترل 5- متغير مداخله گر.2ـ3ـ4ـ2ـ1 ـ متغير مستقل  : متغيري است كه در يك تحقيق در رابطه با معلول (متغير وابسته ) نقش علت احتمالي را دارد و نتايج و مقادير معلول (متغير وابسته ) را تحت تأثير قرار مي دهد . محقق از طريق متغير مستقل به تبيين يا پيش بينيمتغير وابسته مي پردازد . متغير مستقل به اين دليل مستقل ناميده مي شود كه مستقل از نتيجه است . زيرا نه به چيزي وابسته است و نه چيزي آن را تعيين مي كند. متغير مستقل خود بردو نوع است : الف ـ متغير فعال ب ـ متغير منسوب متغير مستقلي كه پژوهشگر با دخل و تصرف بوجود مي آورد و متغير فعال و متغير مستقلي كه نمونه ها همراه خودشان دارند و پژوهشگر بد

ون دخل و تصرف در آنها ، آنرا مي سنجد ، متغير منسوب ناميده مي شود. مثل متغير طبقه ي اجتماعي يا متغير هوش . متغير مستقل گاه متغير تجربي ، اعمالي ، محرك ، درونداد و پيش بين نيز ناميده مي شود .  20ـ3ـ4ـ2ـ2 ـ متغير وابسته   : متغيري است كه در يك تحقيق نقش معلول را دارد و تحت تأثير متغير مستقل قرار مي گيرد و با تغييرات متغير مستقل تغيير مي كند . بنابراين به خاطر اينكه به متغير هاي مستقل وابسته است ، متغير وابسته ناميده مي شود . متغير واب

سته و متغير مستقل با يكديگر تفاوتهايي دارند كه عبارتند از :1- متغير مستقل در تحقيق نقش علت احتمالي، ولي متغير وابسته نقش معلول را دارد. 2- متغير مستقل در اختيار محقق است، بنابراين محقق  مي تواند آن را دستكاري كند. ولي متغير وابسته در اختيار محقق نيست، بنابراين او نمي تواند در متغير وابسته دستكاري كند.3- محقق از روي متغير مستقل پيش بيني يا تبيين مي كند، ولي متغير وابسته مورد  پيش بيني قرار مي گيرد. نكته اي كه بايد به آن توجه داشت اين است كه يك متغير در يك تحقيق ممكن است  به عنوان متغير مستقل عمل كند و در يك تحقيق ديگر نقش متغير وابسته را ايفا كند . فرضيه ي روبرو را در نظر بگيريد: بين در آمد پاسخگويان و افت تحصيلي آنها رابطه وجود دارد . در اين فرضيه در آمد متغير مستقل و افت تحصيلي متغير وابسته است . حال ممكن است در يك فرضيه ي ديگر، در آمد نقش متغير وابسته را ايفا كند . مثلاً : بين شغل پاسخگويان ودر آمد آنها رابطه وجود دارد . متغير وابسته گاه متغير ملاك ، تابع يا برونداد نيز ناميده مي شود . 2ـ3ـ4ـ2ـ3 ـ متغير تعديل كننده  : متغير تعديل كننده، متغيري است كه از سوي محقق انتخاب مي شود ، دستكاري مي شود و اندازه گيري مي شود ، تا بفهمد تغيير آن موجب تغييرهمبستگي بين متغيرهاي مورد بررسي مي شود يا خير. بنابراين، متغير تعديل كننده يك متغير ثانويه يا يك متغير مستقل دوم است، كه ممكن است بر جهت و ميزان رابطه اي كه ممكن

است ميان متغيرهاي مستقل و متغير وابسته وجود داشته باشد اثر مي گذارد . هنگامي كه رابطه ي بين متغير مستقل و متغير وابسته كم و بي ثبات باشد ، مثلاً براي يك زير  مجموعه ي جامعه ي آماري (مثلاً براي مردها ) بين متغير مستقل و متغير وابسته رابطه وجود داشته باشد ولي برا

ي زير مجموعه ي ديگر جامعه ي آماري                  (مثلاً براي زن ها ) بين متغير مستقل و متغير وابسته رابطه وجود نداشته باشد، احتمالاً نشانگر وجود متغير تعديل كننده در تحقيق است . مثال : محققي مي خواهد رابطه ي بين يك متغير مستقل ، مثلاً سنوات خدمت و متغير وابسته، مث

لاً درآمد خانوار را مطالعه كند ، اما مشكوك به اين است كه رابطه ي بين دو متغير درآمد خانوار و سنوات خدمت بوسيله ي متغير ديگري ، مثلاً جنسيت تغيير مي كند يا خير .در اين صورت متغير جنسيت يك متغير تعديل كننده محسوب مي شود. 2ـ3ـ4ـ2ـ4  ـ متغير كنترل   : وقتي يك محقق مي خواهد تحقيقي را انجام دهد نمي خواهد يا شايد نمي تواند همزمان اثر همه متغيرها را مطالعه و بررسي كند ، بنابراين ممكن است بخواهد اثر برخي از متغيرها را خنثي كند ( ثابت نگه دارد يا تصادفي كند ). به اين متغيرها، متغير كنترل گفته مي شود. مثلاًَ محققي مي خواهد رابطه ي بين متغير مستقل پايگاه اجتماعي و متغير وابسته ي افت تحصيلي را بررسي كند ، ولي او مي داند كه هوش و جنسيت بر روي متغير وابسته ي(افت تحصيلي ) تأثير دارد ، بنابراين متغيرهاي هوش و جنسيت متغير كنترلي هستند . براي كنترل اين متغيرها، محقق بايد همه آزمودني ها را مثلاً پسر انتخاب كند تا متغير جنسيت كنترل شود و يا آزمودني هايي را انتخاب كند كه داراي هوش يكساني باشند، تا متغيرهوش كنترل شود . سوالي كه ممكن است پيش بيايد اين است كه ، پس بين متغير كنترل و متغير تعديل كننده چه تفاوتي وجود دارد؟ در پاسخ بايد گفت كه محقق اثر متغيرهاي تعديل كننده را بررسي مي كند ولي اثر متغيرهاي كنترلي را ثابت نگه مي دارد و مورد مطالعه قرار نمي دهد . متغير كنترل گاه متغير سابقه ، گاه متغير طبقه بندي و گاه متغير سازمان دهي نيز ناميده مي شود . 2ـ3ـ4ـ2ـ5 ـ متغير مداخله گر  : متغير مداخله گر، متغيري است ذهني ،كه قابل ديدن نيست و بايد آن را از طريق رابطه ي بين متغير مستقل و متغير وابسته يا از رفتار فرد استنباط كرد. بنابراين، اين متغيرها قابل اندازه گيري و دستكاري نيستند. اگر در تحقيقي بين متغيرهاي مستقل و وابسته رابطه ي قوي مشاهده شود ، بهتر است اثر متغيرهاي مداخله گر بررسي شود . ويژگي هاي متغير مداخله گر عبارت اند از : 1ـ فرضي اند. 2ـ مستقيماً قابل مشاهده نيستند و فقط در ذهن وجود دارند .3ـ مستقيماً قابل اندازه گيري نيستند و آنها را بايد از روي رفتار استنباط كرد .4ـ قابل كنترل نيستند . 

متغيرهايي مثل شخصيت ، از خود بيگانگي ، همبستگي گروهي ، هوش ، احساس و ادرا

ك از نوع متغير هاي مداخله گر هستند . متغير مداخله گر ،گاه متغير مزاحم و گاه متغير واسطه اي نيز ناميده مي شود .انواع متغير را مي توان به صورت شكل 2ـ1 نمايش داد :

 


2ـ3ـ5 ـ شاخص متقارن و نامتقارن :2ـ3ـ5ـ1 ـ شاخص متقارن   : شاخص متقارن ، شاخ

صي است كه در آن هيچ فرقي نمي كند كه كدام متغير ، متغير وابسته و كدام متغير ، متغير مستقل باشد . شاخصهاي متقارن در متغيرهاي اسمي عبارتند از : 1ـ ضريب في 2ـ ضريب وي كرامر 3ـ ضريب چوپرو 4ـ ضريب يولس شاخص هاي متقارن در متغيرهاي ترتيبي عبارتند از  :1 ـ ضريب گاما 2ـ ضريب تاوآكندال (Ta ) 3ـ ضريب تاو بي كندال (Tb ) 4ـ ضريب تاو سي كندال (Tc) شاخص هاي متقارن در متغيرهاي فاصله اي هم عبارتند از :1ـ ضريب همبستگي پيرسون  ( r ) 2ـ ضريب تعيين دو متغيري) (r2  (اين ضرايب همبستگي در فصل هاي بعدي توضيح داده مي شوند) . 2ـ3ـ5ـ2 ـ شاخص نا متقارن   :  شاخص نامتقارن ، شاخصي است كه در آن به وسيله ي متغير مستقل ، متغير وابسته را پيش بيني          مي كنيم. شاخص هاي نامتقارن در متغيرهاي اسمي عبارتند از :1ـ ضريب تاوگودمن وكروسكال 2ـ مجذوراتا) (η 2شاخص هاي نامتقارن در متغيرهاي ترتيبي عبارتند از :1ـ ضريب دي سامرز 2ـ ضريب همبستگي رواسپيرمن) (rsشاخص هاي نامتقارن در متغيرهاي فاصله اي  عبارتند از :1ـ ضريب هاي رگرسيون (B, b ) 2ـ عرض از مبدأ (a) برخي شاخص ها نيز، هم متقارن و هم نامتقارن  هستند. اين شاخص ها عبارتند از : 1ـ ضريب لامبدا 2ـ ضريب عدم اطمينان 2ـ3ـ6 ـ آماره و پارامتر :2ـ3ـ6ـ1 ـ آماره   : آماره، اندازه هاي عددي است كه ويژگي هاي نمونه ي آماري را توصيف  مي كنند . در آماره تعداد افراد مورد بررسي (تعداد مشاهدات ) را با n  ، ميانگين را باx  ياm  ، انحراف معيار را با s ، واريانس را با s 2  و همبستگي را با  r نشان مي دهند . 2ـ3ـ6ـ2 ـ پارامتر    : پارامتر يا مقدار واقعي ، اندازه هاي عددي است كه ويژگي هاي جامعه ي آماري را توصيف مي كند . پارامتر ، يك ارزش و مقوله اختيار مي كند، براي مثال متوسط سن دانشجويان يك دانشگاه در نمونه ي آماري كه انتخاب كرده ايم يك آماره است ، ولي اگر سن تمام دانشجويان يك دانشگاه (جامعه ي آماري ) را يادداشت كنيم و ميانگين آن را بگيريم ، ميانگين آن را پارامتر جامعه مي گويند . درپارامتر تعداد افراد مورد بررسي (تعداد مشاهدات ) را با N ، ميانگين را با M ، انحراف معيار را با 6  (سيگما ) ، واريانس را با 6 2  و همبستگي را با  ρنشان مي دهند . 2ـ3ـ7 ـ اندازه گيري    : مشخص كردن ارزش هر متغير بر حسب قواعد خاص ، به منظور كمي كردن آنها را اندازه گيري مي گويند . مهمترين كار در هر تحقيق و پژوهش مخصوصاً در مرحله ي تجزيه و تحليل داده ها مشخص كردن سطح اندازه گيري متغيرهاست. سطح اندازه گيري متغيرها به رابطه ي بين مقولات هر متغير با يكديگر سروكار دارد. بدون مشخص كردن سطح اندازه گيري متغيرها نمي توانيم اندازه ي حقيقي متغيرهاي مورد بررسي را بدست آوريم واگر نتوانيم اندازه ي واقعي متغيرهاي مورد بررسي را بدست آوريم ، فنون آماري كارآيي نخواهند داشت . چون كه هر تكنيك آماري متناسب با سطح اندازه گيري معيني است و

نمي توان آن را با هر سطح اندازه گيري به كاربرد . اولين بار شخصي به نام استيونس(stevens ) در سال 1949 بحث طبقه بندي سطوح مختلف اندازه گيري رامطرح نمود. اوسطوح اندازه گيري را به چهاردسته تقسيم نمودكه عبارتند از : 1ـ اسمي 2ـ ترتيبي 3ـ فاصله اي يا حدودپذير 4ـ نسبي يا صفرپذير 2ـ3ـ7ـ1 ـ سطح اندازه گيري اسمي    : سطح اندازه گيري به رابطه ي بين مقولات هر متغير با يكديگر اشاره دارد . ساده ترين كار در هر علمي ، طبقه بندي ( classification )  است . در سطح سنجش اسمي بود يا نبود متغير بررسي مي شود. يعني مشاهدات را برحسب اعداد، نمادها، علائم و برچسب ها طبقه بندي مي كنيم . سطح اندازه گيري اسمي پائين ترين سطح اندازه گيري متغيرهاست . بعبارت ديگر پائين ترين سطح سنجش است كه در آن نمي توان از كم و زياد بودن ، كوچك و بزرگ بودن و علامت صحبت كرد، زيرا اعداد در اين سطح اندازه گيري جنبه ي كيفي دارند نه كمي و براي سهولت در عمل به كار برده  مي شوند . اولين كاري كه براي سطح سنجش اسمي مي توانيم انجام دهيم تناسب است . تناسب براي مقايسه يك توزيع فراواني با توزيع فراواني ديگر بكار برده مي شود . پس در سطح سنجش اسمي احتياج به تحليل جدولي داريم . متغيرهاي جنسيت (زن ، مرد ) ، رنگ چشم ( آبي ، سبز ، مشكي و … ) ، وضعيت تأهل ( مجرد ، متأهل و … ) ، مذهب ( كاتوليك ، پروتستان ، ارتدوكس و…) در سطح سنجش اسمي قرار دارند . 
2ـ3ـ7ـ2 ـ سطح اندازه گيري ترتيبي   : در سطح سنجش ترتيبي اولاً مقولات متغير طبقه بندي شده اند و طبقات نسبت به هم مرتب شده اند ثانياً ميان مقولات آن متغير ترتيب معني داري وجود دارد . ولي فاصله ي دقيق بين اين مقولات مشخص نيست . پس يكي از مشكلات سطح اندازه گيري

ترتيبي ، نسبي بودن فاصله ي بين مقادير آن است . هرگاه بخواهيم شدت يا ضعف صفتي را بسنجيم از مقياس ترتيبي استفاده مي كنيم .مثلاً گويه ي زير را در نظر بگيريد :           درآمد من كفاف مخارجم را مي دهد .كاملاً موافقم   þ      موافقم  þ      بي نظرم  þ        مخالفم  þ         كاملاً مخالفم   þ    در اينجا ما مي توانيم بگوييم مثلاً كاملاً موافق بيشتر از موافق است ، ولي نمي توانيم بگوييم چه قدر بيشتر است. يعني فاصله ي بين اين دو گزينه مشخص نيست . همچنين در سطح سنجش ترتيبي ما        نمي توانيم عمليات رياضي مثل  جمع ، تفريق ، ضرب و تقسيم

انجام دهيم . متأسفانه متغيرهاي اجتماعي و رواني ، عموماً در سطح سنجش ترتيبي قرار دارند و اندازه گيري اين متغيرها در سطح سنجش ترتيبي صورت مي گيرد و به ندرت از اين سطح تجاوز مي كند . متغيرهاي طبقه ي اجتماعي (بالا ، متوسط ، پائين ) و گرايش سياسي (زياد ، متوسط ، كم ) در سطح سنجش ترتيبي قرار دارند . 2ـ3ـ7ـ3 ـ سطح اندازه گيري فاصله اي   :   در سطح سنجش فاصله اي ، علاوه بر داشتن اطلاعات مربوط به متغيرهاي اسمي و ترتيبي يعني طبقه بندي ومرتب بودن طبقات نسبت به هم ، اطلاعاتي هم در مورد تفاوت ميان مقولات وجود دارد . بعبارت ديگر فاصله ي دقيق بين مقولات مشخص است . متغيرهاي سن ، ميزان سواد و درجه ي دما در سطح سنجش فاصله اي قرار دارند . نكته ي قابل ذكر در اينجا اين است كه در سطح سنجش فاصله اي صفر اختياري يا قراردادي است . مثلاً دماسنج در اسفند ماه صفر درجه ي سانتي گراد ، در فروردين ماه 20 درجه ي سانتي گراد ودر تيرماه 40 درجه ي سانتي گراد را

نشان دهد، نمي توانيم قضاوت كنيم كه دما در تيرماه دقيقا دوبرابر دما در فروردين ماه است يا نمي توانيم قضاوت كنيم كه چون دما در اسفند ماه صفر درجه بوده ، پس اين نشانه ي عدم وجود گرماست . زيرا رقم صفر به دماي انجماد آب اشاره دارد و در هيچ حالتي ، رقم صفر مبين فقدا

ن دما نيست از چهار عمل اصلي در رياضي يعني جمع ، تفريق ، ضرب و تقسيم در سطح سنجش فاصله اي فقط ما قادر به انجام جمع و تفريق هستيم .2ـ3ـ7ـ4 ـ سطح اندازه گيري نسبي ياكسري  :  متغيري در سطح سنجش نسبي است كه اولاً مقولات آن طبقه بندي شده باشد. ثانياً مقولات آن نسبت به هم مرتب شده باشند. ثالثاً فاصله ي بين مقولات آن برابر باشد. رابعاً داراي صفر مطلق  باشد. متغيرهاي وزن ، ميزان خودكشي ( صفرنفر ، يك نفر ، دونفر و… ) ، تعداد دانش آموزان كلاس ، قد افراد ، ارتفاع ساختمان (30 متر ، 50 متر و … ) فاصله ي روستا تا شهر   ( 20 كيلومتر ، 30 كيلومتر و …) و ميزان در آمد در سطح سنجش نسبي هستند . در اينجا چون صفر مطلق ( صفر حقيقي ) وجود دارد ، اندازه ها دقيقاًَ برابر است . مثلاً ارتفاع يك ساختمان  40 متري دقيقاً چهار برابر يك ساختمان 10 متري است . در سطح سنجش نسبي ما قادر به انجام هر چهار عمل اصلي رياضي يعني  جمع ، تفريق ، ضرب و تقسيم هستيم . عمليات رياضي قابل انجام صفر حقيقي معلوم بودن  فاصله ي طبقات نسبت به هم مرتب بودن طبقات نسبت    به هم بزرگتر يا كوچكتر برابري طبقه بندي سطح اندازه گيريـــــــــــــ ندارد ندارد ندارد ندارد دارد دارد اسميــــــــــــــ ندارد ندارد دارد دارد دارد دارد ترتيبيجمع وتفريق ندارد دارد دارد دارد دارد دارد فاصله ايجمع ،تفريق ، ضرب و تقسيم دارد دارد دارد دارد دارد دارد نسبي

 

 

عوامل مؤثر بر سطح اندازه گيري متغير ها :  مهمترين عاملي كه براي سطح اندازه گيري متغيرها تأثير مي گذارد سوالات و فرضيات تحقيق و چگونگي جمله بندي سؤالات پرسشنامه است . مثلاً اگر از پاسخگويان سوال كنيم ، سطح تحصيلات شما چيست ؟ و مقولات پاسخ هاي ما عبارت باشند از : ابتدايي  þ       راهنمايي þ        دبيرستان   þ           ديپلم   þ            فوق ديپلم   þ   ليسانس þ       دكترا و بالاتر  þ              تحصيلات حوزوي þسطح اندازه گيري متغير ما اسمي خواهد بود . ولي اگر از پاسخگو سؤال كنيم ، چند كلاس سواد داريد ؟ مثلاً او بگويد 12 كلاس يا 9 كلاس ، در اين صورت سطح اندازه گيري متغير ما فاصله اي خواهد بود . حال ممكن است اين سوال پيش آيد كه كدام سطح اندازه گيري بهتر است . در پاسخ به اين سوال كه كدام سطح اندازه گيري بهتر است ، بايد گفت كه ، هرچه سطح اندازه گيري متغير بالاتر باشد ( بالاترين سطح سنجش در درجه اول سطح سنجش نسبي است ، در مرحله ي بعد فاصله اي، بعد ترتيبي و سپس اسمي است ) 1- عمليات رياضي بيشتري مي توان با آن انجام داد . 2ـ از فنون آماري پيشرفته تر و داراي اعتبار بيشتري مي توان براي آن استفاده كرد. 3ـ دست محقق براي انجام روش هاي تحليل بازتر است . 4ـ متغيري كه در سطح سنجش بالاتري قرار دارد اطلاعات به مراتب بيشتري نسبت به متغيري كه در سطح سنجش پايين تري قرار دارد در اختيار محقق قرار مي دهد . 5ـ متغيري كه درسطح سنجش بالاتري قرار دارد مي توان به سطح پايين تر تبديل كرد و اندازه گيري كرد ، ولي عكس آن مقدور نيست . آماره هاي سطح سنجش اسمي را مي توان براي متغيرهاي در سطح سنجش بالاتر بكار برد. مثلاً براي متغيرهاي سطح سنجش فاصله اي مي توان از نما ، ميانه و ميانگين استفاده كرد ، ولي عكس آن مقدور نيست. مثلاً براي متغير اسمي ( جنسيت ) نمي توان از  آماره هاي سطح سنجش فاصله اي ( مثلاً ميانگين ، واريانس و… ) استفاده كرد، زيرا بي معني است . 

2ـ3ـ8 ـ قابليت اعتماد و اعتبار : 2ـ3ـ8ـ1 ـ قابليت اعتماد   : قابليت اعتماد يا پايايي از سويي نشان دهنده ي دقت و ثبات و از سويي ديگر نشان دهنده ي ميزان اشتباه وسيله ي اندازه گيري است . بعبارت ديگر اگر محققان ديگر همان موضوع را با همان روش بررسي كنند ، يا اينكه يك محقق در مشاهدات مختلفي كه از يك موضوع دارد به نتايج مشابهي برسد ، آن آزمون داراي قابليت اعتماد است . يعني قابليت اعتماد همان ثبات اندازه ها در دفعات اندازه گيري است . دامنه ي ضريب قابليت اعتماد بين صفر تا يك متغير است. هرچه ضريب قابليت اعتماد به يك نزديك تر

باشد، نشان دهنده ي دقت و ثبات وسيله اندازه گيري و به طبع آن  بالا بودن قابليت اعتماد گويه است و هرچه اين ضريب به صفر نزديك تر باشد ، نشان دهنده ي ميزان اشتباه وسيله ي اندازه گيري و پايين بودن قابليت اعتماد گويه خوا هد بود.  حال ممكن است اين سوال پيش

آيد كه چكار كنيم كه قابليت اعتماد گويه هاي پرسشنامه بالا رود براي بالا بردن قابليت اعتماد گويه هاي پرسشنامه بايد به نكات زير توجه نمود : 1ـ سوالات پرسشنامه بايد روشن و واضح و به دور از هر گونه ابهام باشد.2ـ بايد بجاي شاخص هاي يك گويه اي از شاخص هاي چند گويه اي استفاده نمود . دقت داشته باشيد كه هرچه تعداد سوالات يك آزمون بيشتر باشد ، قابليت اعتماد آن بيشتر است. مثلاًَ آزموني با 100 سوال داراي قابليت اعتماد بيشتري نسبت به آزموني با 50 سوال است . در صورتي كه كيفيت و ماهيت آزمودني ها يكسان باشد بااستفاده از فرمول زير كه توسط اسپيرمن ـ براون ارائه شده مي توان رابطه ي بين قابليت اعتماد گويه ها و طول تست را بدست آورد . 
 r tt   = قابليت اعتماد تست اصلي                                                       n  = ضريب افزايش طول تست rttn = قابليت اعتماد پس از n برابر شدن تعداد سوالات تست اصلي مثال : قابليت اعتماد يك تست 40 سوالي برابر با 70 / . است . حال اگر تعداد سوالات را دوبرابر كنيم قابليت اعتماد چه قدر خواهد شد ؟                                              82/ . =                                                                            اگر بخواهيم بدانيم چند سوال بايد به آزمون اضافه كنيم تا قابليت اعتماد به ميزان دلخواه ما برسد از فرمول زير استفاده مي كنيم :                مثال : قابليت اعتماد سوالات پرسشنامه اي با 40 سوال برابر با 70/0 است . حال مي خواهيم

قابليت اعتماد اين پرسشنامه را به 85/0 برسانيم ، چند سوال ديگربايد طرح نماييم ؟ 
                                                                بايد تعداد سوالات پرسشنامه به 8/96( 8/96= 42/2× 40 ) برسد تا قابليت اعتماد اين پرسشنامه به 85/0 برسد .البته بايد به اين نكته توجه نمود كه تعداد سوالات نبايد خيلي هم زياد باشد ( برخي از محققين تعداد سوالات مناسب براي يك پرسشنامه را بين 80 تا 120 سوال ذكر كرده اند . البته تعداد سوالات به موضوع تحقيق و متغيرهاي مستقل بستگي دارد ) زيرا امكان دارد پاسخگو خسته شود و تعدادي از سوالات را بدون خواندن جواب دهد يا اصلاً جواب ندهد . 3ـ زمان انجام مصاحبه هم روي قابليت اعتماد گويه ها مؤثر است . 4ـ روش كدگذاري يكي ديگراز عوامل مهم در قابليت اعتماد گويه هاست . مثلاً اگر كدگذاران متعدد به يك سوال واحد ، كدهاي متفاوتي بدهند قابليت اعتماد آن پايين مي آيد . 5ـ ماهيت متغير مورد بررسي هم ، روي قابليت اعتماد گويه ها تأثير دارد . شيوه هاي مختلفي براي محاسبه ي قابليت اعتماد وجود دارد كه مهمترين اين روش ها عبارتند از :1ـ روش دو نيمه كردن 2ـ روش آلفاي كرانباخ 3ـ روش دوباره آزمايي 4ـ روش كودر ـ ريچاردسون 2ـ3ـ8ـ1ـ1 ـ روش دو نيمه كردن   : در اين روش سوالات پرسشنامه را به دو نيمه ي مساوي تقسيم مي كنيم. مثلاً سوالات فرد در ي

ك نيمه و سوالات زوج در نيمه ي ديگر و سپس ضريب همبستگي ميان دو نيمه را محاسبه مي كنيم . هرچه همبستگي دونيمه بيشتر باشد ، دقت اندازه گيري آزمون هم بيشتر است . در آخر هم با استفاده از فرمول زير قابليت اعتماد آزمون را محاسبه مي كنيم .   11َ r   = ضريب قابليت اعتماد در كل آزمون r11 = ضريب همبستگي بين  دونيمه ي سوالات مثال ـ پرسشنامه اي را با 100 سوال به 60 پاسخگوارائه كرديم . پس از پاسخگويي به سوالات ضريب همبستگي ميان دو نيمه از سوالات پرسشنامه را محاسبه نموديم . ضريب همبستگي بين اين دو نيمه از سوالات برابر با 85/0 شد . حال قابليت اعتماد آزمون را محاسبه كنيم . 

اجراي روش دو نيمه كردن :1ـ ابتدا منو analyze   ، سپس فرمان scale ودر مرحله بعد فرمان Reliability analysis  را كليك  مي كنيم  . 2ـ متغيرهاي نيمه اول سوالات را مشخص كرده، به بخش Item  منتقل مي كنيم . 3ـ متغيرهاي نيمه دوم سوالات را مشخص كرده، به بخش Item  بعد از متغيرهاي اول منتقل مي كنيم .4ـ در كادر جلو Model گزينه يSplit-half  را كليك مي ك

نيم .  5ـ گزينه يstatistics   را كليك مي كنيم . 6ـ در پنجره ي  statistics  گزينه هاي Item ، scale و correlations را انتخاب كرده، سپس  برروي گزينه ي continue و سپس ok كليك مي كنيم . 2ـ3ـ8ـ1ـ2 ـ روش آلفاي كرانباخ   :  آلفاي كرانباخ بوسيله ي فرمول زير محاسبه مي شود . 

 


                     = ra= a 
 = مجموع واريانس هاي تك تك زير مجموعه ها s2 = واريانس نمره هاي كل آزمون مقدار آلفاي كرانباخ بين صفر تا يك متغير است . هرچه اين مقدار به يك نزديك تر باشد قابليت اعتماد مقياس هم بيشتر است . آلفاي كرانباخ بايد حداقل 70 /0 باشد (برخي هم ملاك را 50/0 گذاشته اند ). مثال : اگر پرسشنامه اي داراي 100 سوال و پنج زير مجموعه سوال باشد ، بطوري كه واريانس نمره هاي كل آزمون 80 و واريانس هر زير مجموعه به شرح زير باشد :  6                      8                    4                   5                 10 مقدار ضريب آلفاي كرانباخ چه قدر است ؟                                                                 73/ . =(          -1  )                                                                                                                                         اجراي روش آلفاي كرانباخ :1ـ ابتدا منو analyze و سپس فرمان  scale را كليك مي كنيم . 2ـ فرمان reliability analysis را كليك مي كنيم تا پنجره آن باز شود . 3ـ متغيرهاي مورد نظر را انتخاب كرده و سپس آنرا به بخش item   منتقل مي كنيم  . 4ـ در كادر جلو model گزينه ي Alpha را انتخاب كرده و سپس گزينه ي  statistics را كليك  مي كنيم  . 5ـ در پنجره ي statistics  گزينه هاي correlations            if Item                 correlation                      deleted                                                                             deleted                                        deleted                 x1         
x2
x3
x4
x5Reliabity coefficienes  N     of  cases =45                              N  of  item =5                                   Alpha =. 839 Reliability 

تفسير : نتايج بدست آمده نشان مي دهد كه ضريب آلفاي كرانباخ براي همه متغيرهايي كه قرار است سازه ي رضايتمندي فرد را اندازه بگيرند 83/0 است ، كه نشان دهنده ي قابليت اعتماد بالاي سوالاتي است كه رضايتمندي فرد را اندازه مي گيرند . اين ضريب به محقق مي گويد مي توان مطمئن بود كه سوالات مطرح شده براي سنجيدن رضايتمندي فرد ، دقيق اندازه مي گيرند . از آنجايي كه مقدار آلفاي كل كمتر از مقدار آلفاي x    است مي توان براي بالا بردن مقدار آلفا x  را حذف كرد . با حذف x   مقدار آلفاي كل به 90/ . خواهد رسيد . 
2ـ3ـ8ـ1ـ3 ـ روش دوباره آزمايي   : اساس اين روش بدين صورت است كه ابتدا سوالات آزمون مورد نظر توسط پاسخگويان مورد نظر پاسخ داده مي شوند . سپس بعد از گذشت مدتي (حدود 15 الي 30 روز ) در شرايط مشابه همان سوالات توسط همان افراد پاسخ داده مي شوند . در مرحله ي بعد ضريب همبستگي ميان پاسخ ها را محاسبه مي كنيم . اين همبستگي نمايانگر قابليت اعتماد سوالات پرسشنامه است . اگر همبستگي بالايي (حداقل 70/0 )  بين پاسخ هاي افراد در در دو زمان وجود داشته باشد ، نتيجه مي گيريم كه سوالات تحقيق داراي قابليت اعتماد است . در اينجا چيزي را كه مي خواهيم بفهميم دقت اندازه گيري است . يعني مي خواهيم بفهميم اگر تك تك پاسخگويان را دوباره با روش مورد نظر بيازماييم دقت نتايج تكرار شده چه قدر است . روش دوباره آزمايي داراي نقاط ضعفي است كه عبارتند از : 1ـ ممكن است نتوانيم پاسخگويان قبلي را پيدا كنيم ، يا پاسخگويان حاضر به همكاري دوباره نشوند . 2ـ ممكن است پاسخگويان از حافظه ي خود كمك گيرند  و پاسخ هاي قبلي خود را تكرار كنند و اين باعث مي شود كه قابليت اعتماد سوالات بطور كاذب خيلي بالا رود . 3ـ روش دوباره آزمايي نيازمند زمان ، هزينه و نيروي انساني زيادي است . 

2ـ3ـ8ـ1ـ4 ـ روش كودرـ ريچاردسون   :كودر و ريچاردسون دوفرمول بنامهاي  kR      ,  r      kR                        r براي محاسبه قابليت اعتماد سوالات پرسشنامه ارائه نمودند . 
الف ـ محاسبه ي قابليت اعتماد با استفاده از فرمول     kR : p= نسبت افرادي كه به هرسوال پاسخ صحيح داده اند (نسبت پاسخ هاي مثبت ) .q = نسبت افرادي كه به هر سوال پاسخ هاي غلط داده اند (نسبت پاسخ هاي منفي ) .s2= واريانس كل سوالات n= تعداد سوالات آزمون از اين فرمول هنگامي مي توان براي محاسبه ي قابليت اعتمادسوالات استفاده نمود كه نمره گذاري سوالات بصورت صفر ويك (يعني پاسخ درست نمره ي يك وپاسخ غلط نمره ي صفر ) باشد . ب ـ محاسبه قابليت اعتماد با استفاده از فرمول         kR : 


n= تعداد سوالات آزمون  = ميانگين سوالات s2= واريانس كل سوالات از اين فرمول هنگامي مي توان استفاده كرد كه، اولاًواريانس نمرات كل و ميانگين نمرات و تعداد سوالات را داشته باشيم . ثانياً درجه ي دشواري سوالات يكسان باشد . ثا لثاً نمره گذاري سوالات به صورت صفر و يك باشد . مثال ـ پرسشنامه اي با 50 سوال را به تعدادي از آزمودني ها ارائه نموديم كه نتايج آن در زير آورده شده است .ضريب قابليت اعتماداين پرسشنامه رامحاسبه كنيد . 
    x =  4     σ 2=  8      


سوالات برخي از آزمونها درسطح سنجش اسمي (بلي/خير،درست /غلط و …) نيست بلكه درسطح سنجش ترتيبي است. براي چنين آزمون هايي كرانباخ با استفاده از فرمول كودر و ريچاردسون براي 
محاسبه ي قابليت اعتماد فرمول زير را ارائه نموده است :     = واريانس كل سوالات 2ـ3ـ8ـ2 ـ اعتبار   : اعتبار  به معني اين است كه آيا روش يا وسيله ي اندازه گيري كه براي سنجش موضوع انتخاب شده مناسب است و آيا موضوع را بخوبي مي سنجد يا خير. به عبارت ديگر ما همان چيزي را مي سنجيم كه قصد سنجش آن را داريم يا چيز ديگ

ري را مي سنجيم . بطوركلي مي توان اعتبار را به دو دسته تقسيم نمود كه عبارتند از : الف- اعتبار دروني ب – اعتبار بيروني 

2ـ3ـ8ـ2ـ1 ـ اعتباردروني   يااعتبارمنطقي  : اعتبار دروني بيانگر ميزان كنترل متغيرهاي ناخواسته  يا ميزان دقت يافته هاي تحقيق است. هرچه در يك تحقيق متغيرهاي ناخواسته ي كمتري وجود داشته باشد و تغييرات متغيروابسته ناشي از متغيرهاي مستقل باشند اعتبار دروني يافته هاي تحقيق بيشتر است . اعتبار دروني خود شامل اعتبار محتوايي ، اعتبار سازه اي و اعتبار تجربي مي باشد .   الف  ـ اعتبارمحتوايي   : «اعتبار محتوايي معرف بودن يا كفايت نمونه گيري محتواي ( ماده ، مطلب ، موضوع ) وسيله ي اندازه گيري است . معتبرسازي محتوايي درپاسخ به اين پرسش است كه آيا مواد يامحتواي  اين وسيله ي اندازه گيري معرف محتوي يا مجموعه خصوصيات مورد اندازه گيري     است .»    براي اينكه محقق اعتبار محتوايي پرسشنامه (يا مصاحبه ) راتأمين كند بايد سوالات رابراساس اهداف و فرضيات تحقيق مطرح نمايد . اعتبارمحتوايي خود شامل اعتبار صوري و اعتبار نمونه گيري مي شود . اعتبارصوري   : در اعتبار صوري محقق بطورذهني ارزيابي مي كند وسيله ي اندازه گيري بكاررفته شده چه قدر آن چيزي را كه فكر مي كرده ، اندازه گيري مي كند . اعتبار نمونه گيري  :  اعتبار نمونه گيري عبارت است از اينكه آيا معرف هاي انتخاب شده توسط محقق ، مفهوم مورد نظر را دقيقاًًَ بررسي مي كند يا خير . ب ـ اعتبار سازه اي    : سازه ها مفاهيمي فرضي اند كه از نظريات استنباط مي شوند ولي مدعي وصف دقيق واقعيت هاي مشاهده پذير نيستند . اعتبار سازه اي هم عبارت است از اينكه آزمون مورد نظر به چه چيزي دلالت مي كند و تا چه اندازه صفت مورد نظر را اندازه مي گيرد . براي اعتبار سازه اي روش هاي متعددي وجود دارد كه عبارتند از:  1ـ همبستگي با ساير آزمون هاي داراي اعتبار 2ـ همخواني دروني 3ـ تحليل عامل 1ـ همبستگي با ساير آزمون هاي داراي اعتبار : اگر آزمون مورد نظر محقق با آزمونهاي

معتبر ديگر داراي همبستگي بالايي باشد پي مي بريم كه اين آزمون  براي سنجش و اندازه گيري سازه ي مورد نظر محقق مناسب خواهد بود . به اين نوع اعتبار ، اعتبارهمگرا   مي گويند . 2ـ همخواني دروني :  در اين روش محقق ضريب همبستگي هر سوال با كل تست را محاسبه   مي كند .3ـ تحليل عامل   : تحليل عامل روشي است كه به كمك آن و با توجه به متغير هاي م

ورد بررسي و پاسخ هاي آزمودنيها ، زير بناي متغيروابسته و ماهيت عوامل حاصله را شناسايي مي كنيم . به عبارت ديگر تحليل عامل روشي است كه با كمك آن بررسي مي كنيم كه آيا مي توان با متغيرهاي اساسي كمتري (عاملها ) به تبيين موضوع مورد بررسي پرداخت.؟  پس كار تحليل عامل كاهش تعداد زيادي متغير به تعداد كمي متغير اساسي است . مراحل تحليل عامل : تحليل عامل داراي چهار مرحله است كه عبارتند از : الف ـ انتخاب متغيرهايي كه بايد تحليل شوند و تهيه ماتريس همبستگي : هنگامي كه مي خواهيم متغيرهايي را براي تحليل انتخاب كنيم ، بايد به دو نكته بسيار مهم توجه داشته باشيم . اول اينكه نبايد متغيري علت متغير ديگر باشد ، يعني رابطه ي بين هيچ كدام از متغيرها نبايد علّي باشد . دوم اينكه متغيرها بايد با همديگر همبستگي قابل قبولي (حداقل 30 /0  ) داشته باشند تا در تحليل باقي بمانند ، زيرا در تحليل عاملي هدف اين است كه چند متغير با هم تركيب شوند و يك عامل ساخته شود . اگر متغيري با متغيرهاي ديگر همبستگي قابل قبولي (حداقل 30/0) نداشته باشد بايد آن را از ماتريس همبستگي حذف كرد . همچنين اگر متغيرهايي بايكديگر همبستگي خيلي بالايي داشته باشند ، آنها نيز بايد كنار گذاشته شوند . راههاي مختلفي براي اينكه ببينيم مجموعه اي از متغيرها در ماتريس همبستگي براي تحليل عامل مناسب هستند يا خير وجود دارد . يكي از راهها استفاده از آماره ي   KMO   است . مقدار اين آماره نبايد كمتر از 70 /0 باشد ( البته برخي از صاحبنظران مقدار بالاي 50/0 را نيز با كمي احتياط كافي دانسته اند ) . اگر مقداراين آماره بيشتر از 70/0 باشد نتيجه مي گيريم كه همبستگي هاي موجود براي تحليل عامل بسيار مناسب است . بعد از حذف متغيرهاي اضافي هنگامي كه بخواهيم ماتريس همبستگي را تهيه كنيم ، بايد عددي را در قطر اصلي ماتريس قرار دهيم اين عدد مي تواند عدديك يا عدد صفر يا عددي بين صفر تا يك باشد . به اين عدد اشتراك  مي گويند . اشتراك همان واريانس مشترك بين هر متغير و عامل هاست . براي بدست آوردن

ضريب اشتراك بايد همبستگي بين هركدام از متغيرها در عاملها را به توان دو رساند و سپس با هم جمع نمود . مثلاً در جدول 2ـ2 ضريب اشتراك براي متغير معدل دبيرستان عبارت است از :   53 / . = (15/ . ) +( 14/ . ) + ( 70/ . ) اشتراك را با h نشان مي دهند ومقدار آن بين 0 تا 1 در نوسان است . هرچه اين ضريب به عدد يك نزديكتر شود ، نشانگر اين است كه عامل هاي انتخاب شده واريانس متغير مورد نظر را بيشتر تبيين        مي كند . وقتي ضريب اشتراك صفر باشد ، بدين معني است كه هيچ مقداري از واريانس متغير مورد نظر، توسط عامل هاي مشترك تبيين نمي شود . ووقتي ضريب اشتراك يك باشد ، بدين معني است كه عامل هاي مشترك، همه واريانس مت

غير مورد نظر را تبيين مي كنند . در اينجا بايد به يك نكته توجه نمود و آن اين است كه متغيري كه روي تمام عامل ها بار داشته باشد ضريب اشتراك آن پايين مي آيد . ب ـ استخراج عامل ها : « عامل ، يك سازه ، يك هستي فرضي و يك متغير نهفته است كه فرض  مي شود زير بناي آزمونها ، مقياس ها ، ماده ها ودر حقيقت تمامي انواع ابزارهاي اندازه گيري به شمار مي رود .»   يا به عبارت ديگر «عامل  يك متغيرفرضي است كه بريك ياچند متغير موردمشاهده تأثير ميگذارد » .بار عاملي هم همبستگي يك متغير با يك عامل است كه مقدار آن بين منفي يك تا مثبت يك در نوسان است .تعداد عامل هايي كه در يك تحليل عامل ممكن است به وجود آيد ، برابر تعداد متغيرهاست . ولي اين تعداد عامل كارآيي چنداني ندارد واكثر آنها بي معني هستند . يكي از راههايي كه به كمك آن مي توانيم تشخيص دهيم كداميك از عامل ها را حفظ  كنيم ، مقادير ويژه  است . مقادير ويژه آن مقدار از واريانس كل است كه بوسيله ي  يك عامل تبيين      مي شود .يا به عبارت   ديگر ، مقادير ويژه مجموع مجذور بارهاي عاملي است كه مقدار واريانس تبيين شده را نشان مي دهد . براي بدست آوردن مقادير ويژه ، همبستگي هرعامل را با تك تك متغيرها به توان دو مي رسانيم ، سپس با هم جمع مي كنيم . مثلاً مقدار ويژه براي عامل اول در جدول 2ـ2 عبارت است از : 

                                      جدول  2-2- متغير هاي مؤثر بر پيشرفت تحصيلي متغير عامل اول عامل دوم عامل سوم معدل دبيرستان 70/0 14/0- 15/0طبقه ي اجتماعي 50/0 30/0 18/0انگيزه ي تحصيلي 44/0 19/0 10/0ميزان ساعات مطالعه در روز 60/0 42/0 27/

0تعداد دانش آموزان در كلاس 55/0 38/0 39/0جنسيت 34/0 21/0 25/0تحصيلات پدرومادر 30/0 19/0 15/0   
80/1 = (30 / . ) + ( 34/ . ) + ( 55/ . ) + ( 60/ . ) +( 44/ . ) + ( 50/ . ) + ( 70/ . )معمولاً مقادير ويژه ي اولين عامل بيشتر از يك مي شود . عاملي بهتر است كه مقدار ويژه ي آن بيشتر باشد . بايد تنها عامل هايي را نگه داريم كه مقدار ويژه ي آن حداقل يك باشد . عام

ل اول ، عاملي است كه بيشترين واريانس متغير وابسته را تبيين مي كند . عامل دوم ، عاملي است كه بعد از عامل اول بيشترين واريانس متغير وابسته را تبيين مي كند و همين طور عامل هاي بعدي بعد از عامل هاي قبل از خود بيشترين واريانس متغير وابسته را تبيين مي كنند . اين كار تا جايي ادامه مي يابد كه تعداد      عامل هاي استخراج شده با تعداد متغيرها برابر گردد . بعد از استخراج عامل ها ، نوبت به چرخش آنها مي رسد . ج ـ چرخش   عامل ها : اهداف محقق در تحليل عاملي از چرخش عبارتند از : الف ـ در استخراج اوليه ي عامل ها قبل از چرخش  مشخص نيست كدام متغير متعلق به كدام عامل است، ولي چرخش باعث مي شود كه بفهميم كدام متغير به كدام عامل تعلق دارد . ب ـ چرخش باعث مي شود ساختار عاملي ساده شود . يك ساختار ساده ساختاري است كه در آن تعداد آزمون ها زياد ، ولي تعداد عامل ها كم باشد . وقتي تعداد عامل ها كم باشد تفسيرشان آسان تر     مي شود . ج ـ با چرخش پيچيدگي متغيرها كم مي شود . د ـ قبل از چرخش بخوبي نمي توان معني هر عامل را درك كرد ، ولي بعد از چرخش معني هر عامل كاملاً قابل درك مي شود . روش هاي متعددي براي چرخش عامل ها وجود دارد كه عبارتند از :1ـ چرخش متعامد  2- چرخش مايل  . چرخش متعامد، چرخش است كه در آن زاويه ي بين محورها 90 درجه باقي  مي ماند . از مهمترين روش هاي چرخش متعامد مي توان به چرخش اپتيمال و چرخش واريماكس اشاره كرد . چرخش مايل نيز چرخشي است كه در آن هركدام از محورها  بصورت منفرد و بدون حفظ درجه ي اوليه مي چرخند . از مهمترين روش هاي چرخش مايل         مي توان به روش ابليمين اشاره كرد . تفاوت ديگر بين اين دو روش اين است كه در چرخش متعامد، عامل ها با يكديگر همبستگي ندارند ، ولي در چرخش مايل عامل ها با يكديگر همبست

گي دارند . مايل بودن هم به همين معناست . يعني همبستگي داشتن عامل ها با يكديگر . در اينجا ذكر دو نكته لازم است ، اول اينكه گاهي اوقات پيش مي آيد كه يك متغير روي چند عامل

 باردارد . در چنين مواقعي يا بايد روش چرخش را تغيير دهيم ، يا متغيررا كنار بگذاريم. دومين نكته اين است كه علامت بار عاملي ، فقط نوع رابطه ي بين متغير و عامل را نشان مي دهد ، نه شدت رابطه ي بين متغير و عامل . اگر بار عاملي داراي علامت منفي باشد ، معني آن اين است كه متغير با عامل رابطه ي معكوس دارد و اگر علامت بار عاملي مثبت باشد ، نشانگر اين است كه متغير و عامل با همديگر رابطه ي مستقيم دارد .  د ـ تفسير نتايج و ساختن مقياسي براي

استفاده در تحليل هاي بعدي: براي ساختن مقياس بايد ببينيم زير بناي متغير وابسته مارا چند

عامل تشكيل داده و عوامل حاصل شده داراي چه ماهيتي هستند . 
روش اجراي تحليل عامل :1ـ ابتدا منوي analyze و سپس فرمان data reduction  را كليك مي كنيم . 2ـ در مرحله ي بعد فرمان  factor را كليك مي كنيم تا پنجره ي factor analysis باز شود . در اين پنجره متغيرها رابه بخش variables منتقل مي كنيم . 3ـ بر روي گزينه ي descriptives كليك مي كنيم تا پنجره ي factor analysis : descriptive باز شود . در اين پنجره گزينه هاي زير را انتخاب  مي كنيم : ( براي ارائه ي آمار توصيفي )univariate descriptive                                                  ( براي ارائه مقادير ويژه ، اشتراكها ودرصدواريانس تبيين شده ) initial  solution                 ( براي ارائه ماتريس همبستگي ) coefficients                                                          reproduced                                                                                                   KMO and Bartlett,s  test of sphericity                                                          4ـ روي گزينه يcontinue كليك  مي كنيم ، تا به پنجره ي  factor analysis برگرديم . در اين پنجره بر روي گزينه extraction كليك مي كنيم تا پنجره ي factor analysis : extraction  باز شود . 5 ـ بر روي گزينه ي scree plot كليك مي كنيم ( نمودار scree براي نمايش اهميت نسبي عامل هاي استخراج شده بكار مي رود ) . 6 ـ بر روي گزينه ي continue كليك مي كنيم تا به پ

نجره ي factor analysis  برگرديم . در اين پنجره بر روي گزينه ي rotation كليك مي كنيم تا پنجره ي آن باز شود . 7 ـ در پنجره ي rotation  factor analysis: بر روي روش چرخشي كه مد نظر داريم كليك  مي كنيم . 8 ـ بر روي گزينه ي continue و سپس ok كليك مي كنيم . ج ـ اعتبار تجربي  يا اعتبار عيني :  اعتبار تجربي به رابطه بين ابزار اندازه گيري ونتايج مربوط مي شود . اعتبار تجربي (  كه گاه اعتبار عيني ، گاه پيوسته با معيار و گاه اعتبار وابسته به ملاك ناميده مي شود ) بر دو نوع است : الف ـ اعتبار همزمان ب ـ اعتبار ناهمزمان اعتبار همزمان   : « اعتبار همزمان نوعي روايي وابسته به ملاك است كه از همبستگي بين نمره هاي آزمون و ملاك در شرايطي كه

هر دو اندازه در يك زمان بدست آمده باشند، استفاده مي كند . بعبارت ديگر اين نوع اعتبار ، حالتي از اعتبار پيش بين مي باشد كه در آن به جاي تعيين رابطه ي بين دو آزمون پس از يك فاصله ي زماني ، رابطه ي بين دو آزمون بطور همزمان تعيين مي شود . براي مثال ، آزمون چند وجه   ) شخسيت مينه سوتا يك آزمون تقريباً بلند شخصيت است كه اغلب تا  600 سوال دارد . ... حال فرض كنيد يك پژوهشگر آزمون جديدي براي سنجش شخصيت تهيه كرده است كه نسبت به آزمون فوق كوتاه تر مي باشد . او مي تواند در مواردي كه نمرات افراد استثنايي است براي اطمينان از  آزمون MMPI  استفاده نمايد . در اين حالت آزمون كوتاه يك پيشبيني كننده و MMPIبه عنوان يك ملاك داراي اعتبار همزمان مي باشد . در مواردي كه نتايج هر دو آزمون شبيه به يكديگر باشد ، محقق     مي تواند آزمون كوتاه را جايگزين آزمون بلند نمايد . بنابراين مي توان گفت يكي از اهداف تعيين اعتبار همزمان بين دو آزمون ، جايگزيني يكي به جاي ديگري مي باشد . بديهي است

چنين جانشين سازي هنگامي مفيد خواهد بود كه بين نمرات هردو آزمون رابطه بالايي وجود داشته باشد و ديگر اينكه استفاده از آزمون جديد نسبت به آزمون قديمي داراي مزاياي قابل توجهي باشد ».       اعتبار ناهمزمان يا اعتبار پيش بين   : «اعتبار پيش بين عبارت از بررسي رابطه ي نمرا

ت و نتايج حاصل از مقياس آزمون با عملكرد و رفتار افراد در آينده است . در اين حالت اين سوال وجود دارد كه آيا ابزار اندازه گيري قادر است آنچه را كه ادعا مي كند پيش بيني كند. بعنوان مثال ، يكي از دلايل اجراي كنكور براي داوطلبان شركت در دانشگاه ، گزينش دانشجويان در رشته هايي است كه بتوانند با توجه به استعدادشان ، دوره آموزشي مورد نظر را با موفقيت طي نمايند . بنابراين اگر بين نمرات قبولي كنكور در يك رشته خاص و شاخص پيشرفت تحصيلي دانشجويان آن رشته ( كه معمولا از معدل استفاده مي شود ) همبستگي وجود داشته باشد مي توان گفت آزمون فوق اعتبار پيش بين بالايي دارد  » عوامل مؤثر بر اعتبار دروني : 1ـ تاريخ   : هنگامي كه محققي مي خواهد تحقيقي انجام دهد ، اگر در طول اجراي اين تحقيق يك رويداد    مشابه اي با طرح تحقيق در حال جريان باشد ، علاوه بر متغيرهاي مستقل ، اين رويداد نيز بر روي متغير وابسته تأثير خواهد گذاشت . در نتيجه ، نتايج حاصله خدشه دار خواهد شد . بعنوان مثال محققي مي خواهد در زمان حمله ي آمريكا به عراق ، نگرش مردم ايران را نسبت به دفاع از مملكت بسنجد. مطمئناً در اين تحقيق علاوه بر متغير هاي مستقل ، اين عامل خارجي ( حمله آمريكا به عراق ) روي متغير وابسته ( نگرش مردم ) تأثير خواهد گذاشت . 2ـ گزينش   :گزينش هنگامي به وجود مي آيد كه محقق خواسته يا ناخواسته افرادي را كه در يك يا چند صفت كاملا شبيه به هم اند را براي گروه آزمايش انتخاب كند . در اين صورت نتايج خدشه دار مي شود . 3ـ آزمون مقدماتي   :

در خيلي از تحقيقات براي بدست آوردن برآورد واريانس جامعه و تعيين قابليت اعتماد و اعتبار سوالات پرسشنامه قبل از انجام تحقيق اصلي ، سوالات پرسشنامه را روي تعداد معدودي از آزمودني ها اجرا مي كنند . تجربه اي كه آزمودنيها از اين پيش آزمون بدست     مي آورند ، موجب مي شود آزمودني ها برخي پاسخ ها را در پرسشنامه اصلي تغيير دهند . 4 ـ بازگشت آماري   : هنگامي كه محقق آزمودني هايي را كه در يك صفت ( مثلاً طبقه ي اجتماعي ، هوش ) قوي يا ضعيف هستند ، در يك گروه ( مثلاً در گروه كنترل يا گروه آزمايش ) قرار مي دهد ، در اين صورت افرادي انتخاب ميشوند كه در انتهاي طيف اندازه گيري قرار دارند . حال اگر محقق يك پيش آزمون و پس آزمون انجام دهد ، بعلت تمايل نمرات بسوي ميانگين، عامل رگرسيون نمرات را در پس آزمون تحت تأثير قرار مي دهد . 5 ـ رشد   : رشد به هرگونه تغييراتي اطلاق مي شود كه در طول اجراي يك طرح در آزمودنيها ايجاد شود، مثل تغيرات جسماني، افزايش اطلاعات، تغيرات رواني، افزايش تجربه و. . . اين عوامل بر روي اعتبار دروني تأثير مي گذارد .6 ـ ابزار اندازه گيري   : ابزار اندازه گيري اولاً بايد داراي قابليت اعتماد و اعتبار باشد . ثانياً اين ابزار اندازه گيري در زمان اجراي طرح نبايد تغيير كنند ، در غير اين صورت نتايج دچار تحريف مي شوند .7 ـ افت آزمودني ها  : افت آزمودني ها هنگامي بوجود مي آيد كه تعدادي از آزمودني ها در طول تحقيق از ادامه ي همكاري با محقق منصرف شوند و يا اينكه تعدادي از آزمودني ها در طول تحقيق از مطالعه حذف شوند . 8 ـ سوگيري محقق : اين مسأله هنگامي به وجود مي آيد كه محقق افكار خود را خواسته يا ناخواسته به آزمودني ها تلقين كند ، يا اينكه محقق به خاطر ارزشگذاري اعضاي جامعه نسبت به افراد يا گروه هاي خاص ، يا براي جلوگيري از بوجود آمدن رفتاري عليه افراد يا گروه هاي خاص ، به گروه كنترل در تحقيق نمره اي برابر با گروه آزمايش بدهد . 9 ـ سرايت اعمال آزمايشي  : اگر آزمودنيها در گروه

كنترل و گروه آزمايش با هم ارتباط برقرار كنند ، از شرايط يكديگر با خبر مي شوند . در اين هنگام براي اينكه برتري خود را نشان دهند سعي مي كنند اعمال خود را بهتر از واقع جلوه دهند . بنابراين شرايط متغير وابسته در گروه ها ( گروه كنترل و گروه آزمايش )‌به هم سرايت مي كند ، در نتيجه تفاوت بين گروهها يا كم مي شود يا اينكه از بين مي رود . 10 ـ استفاده از روش هاي آماري

نامناسب : 11 ـ ابهام در جهت تأثير علّي بين متغيرها: اين مسأله هنگامي به وجود مي آيدكه جهت 

تأثير علّي بين متغيرها مشخص نباشد . مثلاً دو متغير افت تحصيلي و فرار از مدرسه را در نظر

بگيريد مشخص نيست افت تحصيلي عامل فرار از مدرسه است ، يا فرار از مدرسه عامل افت تحصيلي     است .2ـ3ـ8ـ2ـ2 ـ اعتبار بيروني  :اعتبار بيروني بااين امر سروكار دارد كه نتايج  بدست آمده  قابل تعميم به گروهي مشابه گروه مورد مطالعه يا گروهي بزرگتر از گروه مورد مطالعه هست يا خير . ممكن است اعتبار دروني يك تحقيق در حد مطلوبي باشد ، ولي اين لزوماً به اين معني نيست كه اين تحقيق داراي اعتبار بيروني خوبي هم هست . اعتبار بيروني شامل اعتبار آماري و اعتبار محيطي مي باشد. الف ـ اعتبار آماري   : اعتبار آماري به نسبت حجم نمونه به حجم جامعه مربوط مي شود . ب ـ اعتبار محيطي يا اكولوژيك   : به مسأله ي تجانس يا عدم تجانس جامعه آماري مربوط مي شود .  عوامل مؤثربراعتباربيروني : عواملي كه اعتبار بيروني را پايين مي آورند عبارتند از :1ـ عدم تعريف دقيق متغير مستقل و متغير وابسته بر روي اعتبار بيروني تحقيق تأثير منفي مي گذارد . 2 ـ عدم اندازه گيري دقيق متغير وابسته اعتبار بيروني را خدشه دار مي كند . 3 ـ اگر نمونه ي آماري نماينده ي يك جامعه ي آماري نباشد اعتبار بيروني دچار خدشه مي شود . 4 ـ زمان : يك تحقيق ممكن است در يك زمان بخصوصي انجام پذيرفته باشد ، مثلاً بحران اقتصادي يا در زمان جنگ . بنابراين نتايج يك تحقيق در يك زمان خاص را نمي توان به زمان هاي ديگر تعميم داد .5 ـ موقعيت : نتايج يك تحقيق ممكن است در يك موقعيت ديگر كاربرد نداشته باشد . 6 ـ استفاده از آزمونهايي كه قدرت اكتشافي كمي دارند ، اعتبار بيروني را خدشه دار مي كند . 7 ـ نقص در فرضيات بر اعتبار بيروني تحقيق اثر منفي دارد . 8 ـ بالا گرفتن مقدار خطا   اعتبار بيروني تحقيق را كاهش مي دهد . 9 ـ اعتبار پايين مقياس مورد استفاده ، بر روي اعتبار بيروني تأثير منفي دارد . 10ـ عدم كنترل متغيرهاي خارجي (مداخله گر ) نيز بر روي اعتبار بيروني تأثير منفي مي گذا

رد . 11 ـ معرف نبودن جامعه ، باعث كاهش اعتبار بيروني تحقيق مي شود .  12 ـ اثر تعاملي زمان ، نوع و دفعات اندازه گيري متغير وابسته : «در برخي از طرح هاي آزمايشي ، پژوهشگر به دو يا چند اندازه گيري از متغير وابسته در فاصله ي زماني كوتاهي بسنده مي كند . اين امر مي

تواند تعميم نتايج را از نظر اعتبار بروني در طويل المدت تحت تاثير قرار دهد  » 13 ـ اثر نو بودن محيط آزمايشي : «حالت نو بودن وضعيت جديد آزمايشي ممكن است آزمودني ها را تحت تاثير قرار دهد . بعبارت ديگر اگر در نتيجه نهايي ، ميان گروه آزمايشي و گواه تفاوتي مشاهده شود اين تفاوت ممكن است بعلت نو بودن شرايط آزمايشي و اثري كه بر آزمودني ها گذارده است باشد و نه به واسطه عمل آزمايشي . بنابراين ، اين امر بر اعتبار بروني اثر مي گذارد . اين اثر را اثر هاثورن    نيز مي گويند  ».  خلاصه انواع اعتبار در شكل 2ـ3 ارائه شده است .

 


2ـ3ـ 9 ـ آزمون هاي پارامتري و ناپارامتري 2ـ3ـ9ـ1 ـ آزمون هاي پارامتري   : آزمون هاي پارامتري آزمونهايي هستند كه به فرض نرمال بودن توزيع جامعه استوار هستند و مي توان با استفاده از آنها پارامتر هاي جامعه را برآورد كرد . به همين دليل آنها را آزمون هاي پارامتري يا وابسته به توزيع  مي نامند . آزمونهاي پارامتري داراي پيش فرض هايي هستد كه اين پيش فرض ها عبارتند از : 1ـ توزيع جامعه نرمال باشد يا حجم نمونه به اندازه كافي بزرگ باشد تا عدم نرمال بودن را جبران كند. 2ـ مشاهدات استقلال داشته باشند . 3ـ واريانس ها برابر باشند. 4ـ متغير مورد اندازه گيري در سطح سنجش فاصله اي يا نسبي باشد. 5ـ مقادير پرت در توزيع  زياد نباشد ،  زيرا اين مقادير ميانگين ودر نتيجه نتايج را شديداً تحت تأثير قرار خواهند داد . از آزمون هاي پارامتري مي توان به ضريب

همبستگي پيرسون ، تحليل واريانس            و… اشاره نمود . 2ـ3ـ9ـ2 ـ آزمون هاي ناپارامتري   : آزمونهاي ناپارامتري ، آزمون هايي هستند كه به فرض نرمال بودن توزيع جامعه متكي نيستند  ، به همين علت گاهي آزمونهاي بدون توزيع يا توزيع آزاد نيز خوانده مي شوند . گرچه تاريخ آمار ناپارامتري به اوايل قرن هجدهم ميلادي برمي گردد ، ولي اصطلاح «ناپارامتري » براي اولين بار در سال 1942 در رساله ي دكتراي يك آماردان به اسم ولفويتز بكار رفته است . بعد از آن يك شيمي دان به نام ويلكاكسون در سال 1945 و سپس آمارداني بنام من وسپس آماردان ديگري بنام

ويتني در سال 1947 از آمار ناپارامتري استفاده نمودند . آزمون هاي ناپارامتري براي متغيرهاي اسمي شامل آزمون هاي كي دو ، مك نمار ، في ، يولس ، لامبدا،                 تاوگودمن

وكروسكال ، وي كرامر ، توافق پيرسون ، ضريب عدم اطمينان ، ضريب كاپاي كوهن و … و براي متغيرهاي ترتيبي شامل : آزمون ويلكاكسون ، من ـ ويتني ، كروسكال - واليس ، كندال ، رواسپيرمن ، گاما ، دي سامرز و… مي باشد . آزمون هاي ناپارامتري هنگامي بكار برده مي شوند كه:1ـ متغير مورد بررسي در سطح سنجش اسمي يا ترتيبي باشد ، يا اينكه متغير فاصله اي باشد ولي توزيع آن در جامعه، طبيعي ( نرمال ) نباشد . 2ـ حجم نمونه در تحقيق كوچك باشد. 3ـ در داده ها مقادير پرت زياد باشد ، در اين حالت استفاده از آزمون هاي نا پارامتري نتايج را خيلي تحت تأثير قرار نمي دهد ،  زيرا اكثر آزمون هاي ناپارامتري نسبت به مقادير پرت وچولگي مقاوم هستند زيرا از شاخص هايي مثل ميانه استفاده مي كنند . 4ـ مشاهدات استقلال نداشته باشند. 5ـ واريانس ها برابر نباشند . مقايسه ي روش هاي پارامتري و ناپارامتري : نقاط ضعف آزمونهاي ناپارامتري در مقابل آزمون هاي پارامتري :1ـ كارايي آزمون هاي ناپارامتري به علت اينكه بخشي از اطلاعات را ناديده مي گيرند كمتر از    آزمون هاي پارامتري است. بعنوان مثال آزمون هاي ناپارامتري فقط ترتيب رتبه داده ها را بحساب مي آورند ولي از مقادير اطلاعات استفاده نمي كنند . به عنوان نمونه براي اينكه با استفاده از ضريب همبستگي اسپيرمن يا كندال به نتايج مشابه اي كه با يك نمونه ي 91 نفري با استفاده از ضريب همبستگي پيرسون بدست آمده برسيم ، نياز به يك نمونه 100 نفري هست . در جدول 2ـ3 كارايي آزمون هاي ناپارامتري در مقايسه با آزمونهاي پارامتري ارائه  شده است . 2ـ آزمون هاي ناپارامتري در مقايسه با آزمون هاي پارامتري نسبت به نابرابريها حساسيت كمتري دارند. براي جبران اين حساسيت بايد حجم نمونه را بالا برد . 3ـ احتمال يافتن اختلاف هاي واقعي ، يعني تفاوت هايي كه در جامعه وجود دارد در آزمون هاي ناپارامتري كمتر از آزمون هاي

پارامتري است . 4ـ آزمونهاي ناپارامتري براي متغيرهاي اسمي و ترتيبي كه درسطح سنجش پايين تري قرار دارند بكاربرده مي شوند ، ولي آزمون هاي پارامتري براي متغيرهاي فاصله اي و نسبي كه در سطح سنجش بالاتري قرار دارند بكار برده مي شوند . 

 

مزاياي آزمون هاي ناپارامتري بر آزمون هاي پارامتري :  1ـ استفاده از آزمونهاي ناپارامتري راحت تر از استفاده از آزمونهاي پارامتري است . 2ـ آزمون هاي ناپارامتري نسبت به آزمون هاي پارامتري ، راحت تر فهميده مي شوند.                            3ـ آزمونهاي ناپارامتري پيش فرضي درباره ي شكل توضيح متغير ها ندارند و بطور كلي به فرضيات كمتري احتياج دارند . 4ـ آزمون هاي

ناپارامتري پيش فرضي درباره ي شكل توزيع متغيرها ندارند .  

كارآيي آزمون ناپارامتري در مقايسه با آزمون پارامتري معادل آن آزمون ناپارامتري آزمون پارامتري 63%95%63% ( اگر 6 = D + A باشد كارايي آن تا 95/ . افزايش مي يابد .) 1ـ آزمون علامت 2ـ آزمون ويلكاكسون 3ـ آزمون مك نمار آزمون تي  با نمونه هاي جفت ( وابسته )
95/ . 1ـ آزمون من ـ ويتني آزمون تي با نمونه هاي مستقل  95% 1ـ آزمون كروسكاضريب همبستگي پيرسون  


 3-‌1- نمونه گيري  : وقتي مي خواهيم اطلاعاتي را درباره ي جامعه ي آماري جمع آوري كنيم ، دوراه پيش رو داريم :1 ـ استفاده از روش سرشماري                  2 ـ استفاده از روش نمونه گيري سرشماري يعني اندازه گيري همه افراد جامعه آماري. از روش سرشماري هنگامي استفاده مي شود كه جامعه ي آماري محدود و قابل شمارش باشد .ولي در جوامعي كه نامحدود وغيرقابل شمارش اند، بايد از روش نمونه گيري استفاده كرد . نمونه گيري يعني درصدي از يك جامعه ي را بعنوان   نماينده ي آن جامعه انتخاب كنيم . هدفي را كه در نمونه گيري دنبال مي كنيم اين است كه از روي نمونه ي آماري پارامتر يا پارامترهاي جامعه ي آماري را برآورد كنيم . حال ممكن است اين سوال پيش آيد كه چرا نمونه گيري مي كنيم و از سرشماري استفاده نمي كنيم ؟ درپاسخ بايد گفت كه نمونه گيري در مقايسه با روش سرشماري داراي مزايايي است كه اين مزايا عبارتند از : 1ـ جمع آوري اطلاعات از تمام جامعه ي آماري زمان زيادي را مي طلبد ، درحالي كه با نمونه گيري در زمان صرفه جويي مي شود . 2ـ با استفاده از روش نمونه گيري امكان جمع آوري اطلاعات كامل و بيشتري درمورد جامعه ي آماري نسبت به روش سرشماري وجود دارد . 3ـ گاهي پيش مي آيد كه به اطلاعات نياز فوري داريم ، در اين هنگام روش نمونه گيري بر روش سرشماري برتري دارد .4ـ استفاده از روش سرشماري به نيروي انساني مخصوصاً نيروي انساني متخصص زيادتري نيازمند است . درحالي كه روش نمونه گيري به نيروي متخصص كمتري نيازمند است . 5ـ در روش سرشماري به علت نياز به نيروي انساني متخصص و محدود بدون امكان بكارگيري نيروهاي متخصص ، دقت و كيفيت كار نسبت به روش نمونه گيري كمتر است . 6ـ استفاده از روش نمونه گيري نيازمند هزينه ي كمتري نسبت به هزينه ي سرشماري است . البته استفاده از روش نمونه گيري معايبي نيز دارد . يكي ازاين معايب اين است كه ، دقت نتايج بدست آمده از روش نمونه گيري، صددرصد نيست ودقت آن به دقت نمونه گيري بستگي دارد . اگر جامعه ي آماري نامتجانس باشد، نياز به دقت بالا و استفاده از نيروي ماهر بيشتر مي شود، زيرا بايد نمونه هايي انتخاب شوند كه معرف جامعه آماري باشند ، در غير اين صورت نتايج قابل تعميم به جامعه آماري نخواهد بود . 3ـ2 ـ روش هاي نمونه گيري : روش هاي نمونه گيري به دو دسته تقسيم مي شوند : 1 ـ روش نمونه گيري احتمالي                            2 ـ روش نمونه گيري غير احتمالي 3-2ـ1ـ نمونه گيري غير احتمالي   : در اين روش انتخاب نمونه ها براساس قوانين احتمالات صورت نمي گيرد و نمونه ها براساس قضاوت شخصي محقق انتخاب مي شوند . بنابراين تعميم پذيري نتايج در اين نوع نمونه گيري كم و نامشخص مي باشد،  زيرا شانس انتخاب شدن هريك از اعضاي جامعه ي آماري نامعلوم است . بنابراين از روش هاي نمونه گيري غير احتمالي در موارد زير استفاده مي شود : 1ـ هنگامي كه نخواهيم نتايج نمونه را به جامعه تعميم دهيم . 2ـ زماني كه چارچوب نمونه گير

ي موجود نباشد ، يا اينكه تهيه ي آن غير ممكن باشد ، يا هزينه و زمان زيادي بطلبد . 3ـ در هنگام انجام پيش آزمون  ، زيرا در چنين مواقعي هدف اصلاح كاستي هاي پرسشنام

ه ، تعيين واريانس صفت موردنظر درجامعه ي آماري براي تعيين حجم نمونه ، محاسبه ي قابليت اعتماد گويه ها و … مي باشد . نمونه گيري غير احتمالي شامل روش نمونه گيري سهميه اي، تصادفي، زنجيره اي و گروهي مي باشد .3ـ 2ـ1ـ 1 ـ نمونه گيري سهميه اي   : از روش نمونه گيري سهميه اي وقتي استفاده    مي شود كه ساخت جامعه ي آماري مشخص باشد و تحقيق كمتر جنبه علمي داشه باشد . اساس اين روش نمونه گيري بدين صورت است كه ، محقق جامعه ي آماري رابه چندين طبقه تقسيم مي كند . سپس سهم هر طبقه را مشخص مي كند ودر مرحله ي آخر ، آن قدر از نمونه هايي كه در دسترس هستند انتخاب مي كند كه از اندازه ي مورد نظر براي هر طبقه كامل شود . 3ـ2ـ1ـ2ـ نمونه گيري تصادفي   : در نمونه گيري تصادفي به اندازه ي حجم نمونه هر فردي از جامعه ي آماري كه به طور تصادفي در دسترس بود ، بعنوان نمونه انتخاب مي شود . در نمونه گيري تصادفي انتخاب نمونه ها براساس ضابطه ي كنترل شده اي صورت نمي گيرد . مثلاً هنگامي كه خبرنگاران در خيابان بر طبق نظر خود با هركسي كه مي خواهند مصاحبه مي كنند از اين روش استفاده مي كنند . 3ـ2ـ1ـ3ـ نمونه گيري زنجيره اي : در اين روش ابتدا محقق چند نفر را كه داراي خصوصيات مورد نظر او هستند ، پيدا كرده و بعد از انجام مصاحبه يا پركردن پرسشنامه با آنها ، ازآنها مي خواهد افراد ديگري را كه داراي همان خصوصيات هستند، به محقق معرفي كند . از اين روش هنگامي استفاده  مي شود كه : الف ـ چارچوب نمونه گيري وجود نداشته باشد. ب ـ نمونه ها به آساني قابل شناسايي نباشد ، مثل معتادان و بيماران ايدزي .ج ـ نمونه ها از يكديگر شناخت داشته باشند و با يكديگر در ارتباط باشند . 13-3ـ 2ـ1ـ4 – نمونه گيري گروهي   : در اين روش ابتدا گروه مشخصي كه معرف جامعه آماري باشند تعيين مي شود ،

سپس اطلاعات مورد نياز از اين گروه اخذ مي گردد. در نمونه گيري هايي كه به روش غير احتمالي صورت مي گيرند بعلت اينكه نمونه ها معرف جامعه مورد تحقيق نيستند ، نتايج قابليت تعميم كمي دارند و نمي توان با اطمينان بالايي نتايج بدست آمده را به جامعه تعميم داد ، لذا نتايج جنبه علمي ندارند .  3ـ2ـ2 ـ نمونه گيري احتمالي    : از آنجاييكه شيوه هاي درست نمونه گيري ، يكي از ا

صول شيوه ي تحقيقات درست است و شرايط جامعه هاي آماري با يكديگر تفاوت دارند ، محققين شيوه هاي گوناگوني را براي نمونه گيري احتمالي ذكر كرده اند كه اين شيوه ها عبارتند از :1ـ نمونه گيري اتفاقي ساده 2 ـ نمونه گيري طبقه اي 3ـ نمونه گيري منظم يا سيستماتيك 4 ـ نمونه گي

ري چندمرحله اي 5 ـ نمونه گيري خوشه اي 3ـ2ـ2ـ1 ـ نمونه گيري اتفاقي ساده   : در نمونه گيري اتفاقي ساده براي همه ي افراد جامعه ي آماري شانس مساوي براي انتخاب شدن در نظر گرفته مي شود . اين روش نمونه گيري به دو صورت انجام مي گيرد : الف ـ وقتي كه افراد جامعه ميان آنها به تعداد نمونه ي مورد نياز انتخاب مي كنيم . ب ـ وقتي كه تعداد افراد جامعه آماري زياد باشد روش بالا مشكل است ، بنابراين بايد از جدول اعداد تصادفي استفاده كنيم . نمونه گيري اتفاقي ساده بر دو نوع است كه عبارتند از : الف ـ با جايگزيني                        ب ـ بدون جايگزيني اگر بعد از انتخاب هر نمونه ، آن نمونه را در داخل جامعه ي آماري قرار داده و سپس نمونه ي ديگر را انتخاب كنيم ، از نمونه گيري اتفاقي با جايگزيني   استفاده كرده ايم . در اين روش ممكن است يك نمونه چند بار انتخاب شود . ولي اگر بعد از انتخاب هر نمونه، آن نمونه را به داخل جامعه ي آماري بر نگردانيم، از نمونه گيري اتفاقي بدون جايگزيني  استفاده كرده ايم. وقتي مي توان از روش نمونه گيري اتفاقي استفاده كردكه ، اولاً همه ي افراد جامعه ي آماري شانس مساوي براي انتخاب شدن داشته باشند . ثانياً ، فهرست همه ي افراد جامعه ي آماري را داشته باشيم و اين فهرست كامل افراد جامعه آماري اريب نباشد ، زيرا اگر اين فهرست اريب باشد ، نمونه ي آماري انتخاب شده نيز اريب خواهد بود . ثالثاً ، تغييرات صفت متغير درجامعه آماري بايد كم باشد تا نمونه اي كه انتخاب مي شود ، معرف جامعه ي مورد مطالعه باشد . رابعاً ، جمعيت از لحاظ جغرافيايي متمركز باشد . براي افزايش دقت نمونه گيري اتفاقي ساده دو راه وجود دارد كه عبارتند از:الف ـ افزايش حجم نمونه                  ب ـ استفاده از روش نمونه گيري طبقه اي 3ـ2ـ2ـ2ـ نمونه گيري طبقه اي   : نمونه گيري طبقه اي هنگامي مناسب است كه بتوانيم جامعه  آماري را نسبت به صفت مربوطه طوري تقسيم كنيم كه افراد در داخل طبقات از نظر صفت مربوطه شبيه به هم باشند . يعني واريانس صفت مورد مطالعه در داخل هر طبقه كم ، ولي بين طبقات زياد باشد . بعبارت ديگر  نمونه گيري طبقه اي هنگامي به كار برده مي شود كه ، جامعه ي آماري مورد مطالعه داراي اجزاء گوناگوني باشد ، يعني متجانس نباشد . بنابراين براي اينكه تغييرات آنها در درون گروه ها كم شود ، جامعه ي آماري را به طبقاتي كه همگن تر باشد ، يعني داراي ويژگي هاي مشابهي باشند

تقسيم مي كنيم ، بطوري كه هر طبقه همچون يك جامعه ي آماري خاص باشد . در مرحله ي بعد از هريك از طبقات تعدادي نمونه انتخاب مي كنيم . مشكلي كه ممكن است د

ر نمونه گيري طبقه اي بوجود آيد اين است كه امكان دارد كه  ، جمعيت طبقات با هم برابر نباشد . براي رفع اين مشكل دو كار مي توان انجام داد : الف ـ نسبت هر طبقه به كل جامعه ي آماري را مشخص كنيم و تعداد نمونه اي كه از اين طبقه انتخاب مي كنيم ، به اندازه ي اين نسبت باش

د . به اين نوع نمونه گيري ، نمونه گيري طبقه اي   متناسب   گفته مي شود . ب ـ يا اينكه به نسبت هر طبقه نسبت به كل جامعه ي آماري توجهي نكنيم و از همه ي طبقات به            يك اندازه نمونه انتخاب كنيم . در اين صورت با نمونه گيري طبقه اي نامتناسب                                                     سرو كار خواهيم داشت . مثلاً وقتي كه  مي خواهيم در يك دانشگاه تحقيقي در زمينه ي گرايش دانشجويان نسبت به مواد مخدر انجام دهيم ، چون هر دانشكده داراي ساخت متجانسي است ، كاري كه مي كنيم اين است كه، هر دانشكده را در يك طبقه قرار مي دهيم ، سپس از هريك از طبقه ها تعدادي نمونه انتخاب مي كنيم . نمونه گيري طبقه اي نسبت به نمونه گيري اتفاقي ساده داراي مزايايي است . مزيتي كه نمونه گيري طبقه اي بر نمونه گيري اتفاقي ساده دارد اين است كه ، اولاً در نمونه گيري طبقه اي نحوه ي گزينش نمونه ها ساده تر است . ثانياً دقت آن بيشتر از روش           نمونه گيري اتفاقي ساده است ، زيرا همان طور كه مي دانيد كل تغييرات يك متغير شامل تغييرا ت بين طبقات و تغييرات درون طبقات مي شود . در نمونه گيري طبقه اي فقط تغييرات درون طبقات در اشتباه معيار تأثير دارد ولي تغييرات بين طبقات هيچ تأثيري در اشتباه معيار ندارد . ولي در نمونه گيري اتفاقي ساده تغييرات در درون طبقات و

تغييرات بين طبقات در اشتباه معيار تأثير مي گذارند . همچنين تفاوت نمونه گيري طبقه اي با نمونه گيري سهميه اي اين است كه ، در نمونه گيري طبقه اي چارچوب نمونه گيري موجود است ، ولي در نمونه گيري سهميه اي چارچوب نمونه گيري موجود نمي باشد . نمونه گيري طبقه اي داراي معايبي است كه عبارتند از : 1ـ در اغلب اوقات در مورد متغيري كه طبقه بندي بر اساس آن انجام مي دهيم اطلاعات وجود ندارد. 2 ـ شيوه ي انجام آن مشكل است . 3ـ وقتي ك

ه جمعيت پراكنده باشد و هيچ فهرست نمونه گيري نداشته باشيم فاقد كارآيي است . 4 ـ براي داشتن يك نمونه ي نمايا، بايد نسبت گروه هاي مختلف در جامعه و نمونه، تقريباً مشابه باشد، ولي به خاطر خطاي نمونه گيري هميشه چنين نيست . 3ـ2ـ2ـ3ـ نمونه گيري منظم يا سيستماتيك   : نمونه گيري سيستماتيك با نمونه گيري اتفاقي ساده داراي وجه اشتراك و وجه اختلاف است . وجه اشتراك نمونه گيري سيستماتيك با نمونه گيري اتفاقي ساده اين است كه، اولاً در هردو بايد ليست كامل افراد جامعه مورد مطالعه را داشته باشيم . ثانياً ، در هر دو نوع نمونه گيري تغييرات صفتي كه مورد مطالعه است نبايد شديد باشد . وجه اختلاف آنها اين است كه ، اولاً در نمونه گيري اتفاقي ساده انتخاب هر عضومستقل از انتخاب ساير اعضاي جامعه است ، ولي در نمونه گيري منظم عكس آن صادق است . ثانياً ، انجام نمونه گيري اتفاقي ساده مشكل تر از انجام نمونه گيري سيستماتيك است .نكته اي كه بايد به آن توجه داشت اين است كه اگر صفتي در جامعه بصورت تناوبي توزيع شده باشد، نبايد از روش نمونه گيري سيستماتيك استفاده نمود.  طريقه ي انجام نمونه گيري سيستماتيك به شرح زير است : 1ـ در ابتدا حجم نمونه (n) و حجم جامعه آماري  (N) را تعيين مي كنيم . 2ـ سپس فاصله ي نمونه گيري را طبق فرمول روبه رو تعيين مي كنيم     مثلاً اگر حجم    جامعه ي آماري برابر با 20000 و حجم نمونه برابر با 500 باشد ، در اين صورت فاصله ي نمونه گيري عبارت خواهد بود از :    اين فاصله ي نمونه گيري نشانگر اين است كه بايد از روي اسامي جامعه ي آماري چهل تا چهل تا افراد را انتخاب كنيم . 3ـ در مرحله سوم بايد مبدأ شمارش را براي جلوگيري از دخل و تصرف در نمونه تعيين مي كنيم . براي اين كار ، اعداد 1 تا 40 را روي كاغذ نوشته ، سپس از ميان آنها يك عددرا به صورت قرعه كشي انتخاب مي كنيم ( فرض كنيد عدد 8 شود ) . 4 ـ در مرحله ي چهارم اعداد ديگر را به اندازه ي فاصله ي نمونه گيري ، چهل تا چهل تا انتخاب مي كنيم . در اين صورت نمونه هاي ما عبارت خواهند بود از :  …                                                                          ،128 ، 88، 48 ، 8

   3ـ2ـ2ـ4 ـ نمونه گيري خوشه اي   : هنگامي از نمونه گيري خوشه اي استفاده       مي كنيم كه ،  اولاً چارچوب نمونه گيري يعني فهرست كامل جامعه ي آماري را نداشته باشيم ، يا تهيه آن هزينه و زمان زيادي بخواهد يا غير ممكن باشد . ثانياً ، جامعه ي آماري داراي گروه هاي همگن ومتجانس نباشد. ثالثاً ، جامعه ي آماري وسيع و گسترده باشد .

در روش نمونه گيري خوشه اي ابتدا از خوشه ها ودر مرحله ي بعد از واحدهاي درون خوشه ها نمونه گيري مي كنيم . پس واحد نمونه گيري دراين روش نمونه گيري گروهي، از اعضاي جامعه ( بخش ، شهرستان ، واحد مسكوني و… ) است . در نمونه گيري خوشه اي لازم نيست حتماً تعدا

د نمونه ها در هر خوشه برابر باشند بلكه چيزي كه لازم است اين است كه تشابه نمونه هاي هر خوشه بيشتر از تشابه آن نمونه ها با نمونه هاي ديگر در ساير خوشه ها باشد . يعني اولاً ، واريانس هر خوشه ماكزيمم باشد . ثانيا ، تعداد نمونه ها در هر خوشه كم ولي تعداد خود خوشه ها زياد باشد تا دقت نمونه گيري زياد شود . ولي اگر حجم خوشه ها زياد باشد ولي خود خوشه ها كم باشد افراد هر خوشه تشابه زيادتري با هم خواهند داشت و دقت نمونه گيري كم خواهد داشت . نمونه گيري خوشه اي با نمونه گيري طبقه اي و نمونه گيري اتفاقي ساده تفاوت هايي دارد كه عبارتند از : الف ـ تفاوت نمونه گيري خوشه اي با نمونه گيري طبقه اي در اين است كه ، در نمونه گيري طبقه اي هر طبقه شامل گروه هاي متجانسي است ، ولي در نمونه گيري خوشه اي هر خوشه شامل گروه هاي  غير متجانس پابرجايي است كه قبلاً شكل گرفته اند . ب ـ تفاوت نمونه گيري خوشه اي و نمونه گيري اتفاقي ساده در اين است كه ، در نمونه گيري خوشه اي ما فهرست كامل افراد جامعه را نداريم ، در حالي كه در نمونه گيري اتفاقي ساده فهرست كامل افراد جامعه را داريم . برتري كه نمونه گيري خوشه اي با نمونه گيري اتفاقي ساده دارد ، يكسان بودن توزيع صفت در خوشه هاست . يعني افراد درون خوشه ها همگن هستند و مزيتي كه نمونه گي

ري اتفاقي ساده بر نمونه گيري خوشه اي دارد ، دقت آن است . يعني دقت نمونه گيري

اتفاقي ساده بيشتر از نمونه گيري خوشه اي است ، زيرا در نمونه گيري خوشه اي واريانس ص

فت مورد نظر در درون گروهها ( خوشه ها)  معمولاً كم است . البته در نمونه گيري خوشه اي . ثالثاً ، قرارگرفتن افراد در داخل يك خوشه مستقل از هم باشد و رابعاً ،واريانس هر خوشه زياد باشد بطوري كه هر خوشه تا حد ممكن معرف كل جامعه آماري باشد و واريانس هر خوشه با خوشه هاي ديگر كم باشد ، دقت آن در برآورد ميانگين جامعه برابر دقت نمونه گيري اتفاقي ساده بدون جايگزيني خواهد بود. بنابراين برخلاف نمونه گيري طبقه اي كه بايد واريانس هر طبقه كم ،

ولي واريانس بين طبقات زياد باشد ، در نمونه گيري خوشه اي بايد واريانس هر خوشه زياد و واريانس هر خوشه با خوشه هاي ديگر كم باشد . نمونه گيري خوشه اي داراي معايبي است كه عبارتند از : 1 ـ به علت زياد بودن مراحل نمونه گيري ، احتمال خطا زياد است . 2ـ دقت نمونه گيري خوشه اي، كمتر از دقت ساير روش هاي نمونه گيري احتمالي است . زيرا، اولاًمناطق از نظر مسائل اجتماعي و ساخت جغرافيايي متفاوتند . ثانياً ، تغييرات مورد بررسي در       نمونه ها، معرف تغييرات مورد مطالعه در جامعه نيست . 3ـ وقت گير و پرهزينه است . 3ـ2ـ2ـ5 ـ نمونه گيري چند مرحله   : « در نمونه گيري چند مرحله اي ، افراد جامعه با توجه به سلسله مراتبي ( از واحدهاي بزرگتر به كوچكتر ) از انواع واحدهاي جامعه انتخاب مي شوند. براي مثال در برآورد توانايي رياضي دانش آموزان پايه پنجم ابتدايي در يك منطقه ي آموزش و پرورش ، مي توان دانش آموزان را در سه مرحله با استفاده از واحدهاي نمونه گيري مختلف زير به صورت زير انتخاب كرد : واحد مرحله ي اول :       دبستان                  دبستان 1                      دبستان2 و . . .          دبستان10 واحد مرحله ي دوم :      كلاس               كلاس 1و2                كلاس 3و4 و . . .     كلاس 19و 20 واحد مرحله ي سوم : دانش آموز 1، 2، 3 ،4 ،5، 6 ،7 ، 8 ، 9 ، 10 و . . .55، 56 ، 57 ، 58 ، 59 ، 60    در مثال فوق ، ابتدا جامعه ي دانش آموزان ابتدايي پايه پنجم ، به دبستان ها تقسيم شده اند .         در اين مرحله كه مرحله اول نمونه گيري است ، از ميان دبستان هاي انتخاب شده دو كلاس       (واحد مرحله ي دوم =n2 ) انتخاب مي شود . در اينجا از دبستان شماره ي يك ، كلاس هاي 1و2 پايه ي پنجم و از دبستان شماره ي دوم كلاس هاي 3و4 پايه ي پنجم و بالاخره از دبستان دهم كلاس هاي 19 و20 پايه ي پنجم بطور تصادفي انتخاب شده اند . در مجموع 60 دانش آموز    از 20 كلاس و 10 دبستان انتخاب شده است  . »  ...« نمونه گيري چند مرحله اي در مقايسه با نمونة گيري خوشه اي از دقت بيشتري برخوردار است ، زيرا در نمونه گيري چند مرحله اي واحدهاي نمونه ي مرحله ي نهايي در سطح جامعه پراكنده شده و تغييرات متغير مورد بررسي در نمونه ، معرف تغييرات مورد مطالعه در جامعه است . در حالي كه در           نمونه گيري خوشه اي چنين امري ميسر نمي باشد  .» 

3ـ3 ـ تعيين حجم نمونه   : براي تعيين حجم نمونه چند را پيش رو داريم كه عبارتند از

:1ـ استفاده ازمحاسبات آماري 2ـ  استفاده ازجدول تعين حجم نمونه 3ـ استفاده از نظر محقق 3ـ3ـ1 ـ تعيين حجم نمونه براساس محاسبات آماري :متداولترين روش محاسبه ي حجم نمونه ، استفاده از محاسبات آماري است . در اين روش پژوهشگر ابتدا توسط يك آزمون مقدماتي ، پارامترهاي جامعه ي آماري را مشخص مي كند . پس از آن با استفاده از فرم

ول هايي كه جهت تعيين حجم نمونه وجود دارد ، مقدار حجم نمونه را بدست          مي آورد. مراحل اين روش به شرح زير است :  الف ـ برآورد واريانس : براي تعيين نمونه  بايد واريانس جامعه معلوم باشد . ولي از آنجايي كه واريانس جامعه  مشخص نيست ، يا آنرا از طريق آزمون مقدماتي  برآورد مي كنيم ، يا اينكه از واريانس برآورد شده در تحقيقات قبلي استفاده مي نماييم .ب ـ سطح معني داري يا سطح اطمينان : ميزان سطح اطميناني كه در تحقيق براي تعميم نتايج از  نمونه ي آماري به جامعه ي آماري تعيين مي كنيم ، بر روي تعيين حجم نمونه ي ما تأثير بسزايي دارد . در علوم رفتاري حداقل سطح اطمينان 95% پذيرفته شده است ، ولي تا 9/99% قابل افزايش است . هرچه اين سطح اطمينان را بالاتر ببريم ، مثلاً به جاي سطح اطمينان 95% از سطح اطمينان 99% استفاده كنيم ، احتمال صحت گفتار ما (فرضيه ي ما ) كمتر مي شود ، ولي دقت و اطمينان ما به نتايج و همچنين ميزان حجم نمونه بيشتر مي شود و در نتيجه ميانگين نمونه ي آماري ما به ميانگين جامعه ي آماري  نزديك تر مي شود . ج ـ پيدا كردن فرمولي براي تعيين حجم نمونه : اگرروش نمونه گيري مورد استفاده ، روش نمونه گيري طبقه اي باشد ، براي تعيين حجم نمونه بايد از فرمول زير استفاده كرد :  sh = انحراف معيار هر طبقه                                                              v = واريانس مطلوب t = اندازه ي متغير در توزيع نرمال است .كه با توجه به سطح معني داري معين مي شود . N= كل جمعيت NH = جمعيت هر طبقهWH= نسبت هر طبقه به كلحجم هر يك از طبقات هم از فرمول زير به دست مي آيد:ni = (wH) (n) اگر روش نمونه گيري ساير روشها ( بجز طبقه اي ) باشد ، بايد براي تعيين حجم نمونه از فرمول هاي زير استفاده نمود : 

 t= اندازه ي متغير در توزيع نرمال است كه با توجه به سطح معني داري تعيين مي شود .p= احتمال وجود صفت در نمونه (يا نسبتي از جامعه كه داراي صفت مورد نظر است ). q = احتمال عدم وجود صفت در نمونه ( يا نسبتي از جامعه كه فاقد صفت مورد نظر است ).                                                            d= فاصله ي اطمينان يعني فاصله اي كه ميانگين با اين احتمال در آن قرار مي گيرد . يعني اندازه ي  dبه اندازه ي فاصله ي بين ميانگين نمونه وميانگين جامعه است . s = انحراف معيار نمونه                                                 n= حجم نمونه s = اشتباه استاندارد در نمونه از دو فرمول فوق هنگامي استفاده مي شود كه نسبت حجم نمونه به حجم جامعه   مساوي يا كمتر از پنج درصد باشد . ولي هنگامي كه نسبت حجم نمونه به حجم جامعه   بيشتر از پنج درصد باشد ، از فرمول هاي زير استفاده مي شود :                                                                                                                                                                                                                                                                                                                         

 


s2= واريانس نمونه                                                                          


e = مقدار اشتباه برآورد                                                  

دـ تعيين حجم نمونه و ارزيابي آن براي مشخص كردن اينكه ، آيا اين تعداد نمونه در پرتو امكانات هست يا خير ؟وقتي كه مقدار حجم نمونه مشخص شد ، بايد ببينيم براي اين تعداد نمونه ، نيروي انساني متخصص و كافي ، زمان كافي و هزينه ي لازم مثل هزينه ي رفت و آمد ، هزينه ي پرسشگران ، هزينه ي پيدا كردن نمونه ها ، هزينه ي تكثير ، هزينه ي رفت و آمد و … را دارا هستيم يا خير . اگر حجم نمونه بيش از امكانات محقق باشد ، مي توان حجم نمونه را با افزايش خطاي مجاز پايين آورد .  3ـ3ـ2 ـ تعيين حجم نمونه بر اساس جدول : يكي ديگر از راههاي تعيين حجم نمونه استفاده از جداولي است كه براي همين منظور تهيه شده است . در اين جداول با توجه به حجم جامعه ، حجم نمونه تعيين شده است . يك نمونه از اين جداول به وسيله كرجسي و مورگان تهيه شده است كه در جدول 3ـ1 ارائه شده است . جدول 3ـ1  جدول تعيين حجم نمونه از يك جامعهحجم جامعه ي آماري حجم نمونه ي آماري حجم جامعه ي آماري حجم نمونه ي آماري حجم نمونه ي آماري حجم جامعه ي آماري1200                               291 220                                 140 10                                 101300                               297 230                                   144 15                                 141400                               302 240                                   148 20                                   91500                              306 250                                  152       25                                 241600                              310 260                                    155 30                                  281700                              313 270                                   159 35                                  321800                             317 280                                   162 40                                 361900                             320 290                                  165 45                                402000                             322 300                                  169   50                                442200              

              327 320                                  175     55                                482400                            331 340                                 181 60                                 52                                2600                            335 360                                 186 65                                 562800    

 

 

                       338 380                                 191 70                                593000                          341 400                                196 75                                63 3500                          346 420                                201 80                               664000                         351 440                                205 85                              70  4500                          354 460                               210     90                               735000                         357 480                               214 95                              766000                        361 500                               217 100                            807000                        364 550                               226 110                             868000                            367 600                             234 120                            929000                            368 650                             242 130                            9710000                         370 700                             248   140                           10315000                         375 750                             254 150                          10820000                         377 800                           260 160                          113 30000                         379 850                            265 170                          118  40000                        380 900                             269 180                          12350000                         381 950                             274   190                         12775000                         382 1000                          278 200                         132  100000                      384 1100                         285 210                        136   » . 3ـ3ـ3ـ براساس نظر محقق : در اين روش محقق با در نظر گرفتن عواملي مثل بودجه ، زمان ، نيرويانساني ماهر ، امكانات و  … درصدي از جامعه را بعنوان نمونه انتخاب مي كند . برخي از محققين حداقل نمونه را 10 درصد جامعه ذكر مي كنند . 3ـ4ـ عوامل مؤثر برحجم نمونه : مهمترين عوامل مؤثر بر حجم نمونه عبارتند از : 1ـ سطح معني داري : هرچه محقق سطح معني داري ( احتمال مرتكب شدن خطاي نوع اول ) را بالاتر در نظر بگيريم به حجم نمونه بيشتري نياز دارد . 2ـ تعداد متغيرهاي مورد بررسي : با افزايش تعداد متغيرهاي مورد بررسي ، حجم نمونه نيز افزايش    مي يابد . 3ـ سطح سنجش متغيرهاي مورد بررسي : هرچه سنجش متغيرهاي مورد بررسي پايين تر باشد ، به نمونه هاي بيشتري نياز است . مثلاً هنگامي كه متغيرهاي مورد بررسي در سطح سنجش اسمي باشد، نسبت به زماني كه متغيرها در سطح سنجش فاصله اي يا نسبي باشند ، نياز به نمونه بيشتري است . 4ـ نحوه ي كنترل متغيرهاي ناخواسته : هرچه تعداد متغيرهاي ناخواسته اي كه محقق قادر به كنترل آنها نباشد ، در يك تحقيق بيشتر باشد ، نياز به حجم نمونه بيشتري است ، تامقداري خطا در تحقيق كاهش يابد . 5ـ ميزان پراكندگي متغير مورد بررسي : هرچه جامعه ي آماري مورد تحقيق از نظر صفت مورد بررسي متجانس تر باشند ، نياز به نمونه ي كمتري است . ولي هرچه جامعه ي آماري نامتناجس تر باشد براي اينكه نمونه  مورد نظر معرف جامعه باشد ، نياز به نمونه هاي بيشتري است . 6 ـ حجم جامعه ي آماري : بطور معمول با افزايش حجم جامعه ي آماري ، حجم نمونه ي آماري نيز افزايش مي يابد . ( البته نه به نسبت حجم جامعه به نمونه) . 3ـ5ـ خطاي نمونه گيري  : در نمونه گيري هميشه خطايي به نام نمونه گيري وجود دارد كه علت اين خطا ، يا اختلاف ميان آزمودنيها ، يا اشتباه نمونه گيري است . خطاي نمونه گيري با تعداد نمونه رابطه ي معكوس دارد ، زيرا با افزايش حجم نمونه ، خطاي نمونه گيري كاهش مي يابد و با ناهمگوني افراد رابطه ي مستقيم دارد . زيرا هرچه افراد نمونه ، ناهمگوني تر باشند ، خطاي نمونه گيري هم بيشتر است .  اگر از يك جامعه به طور تصادفي نمونه هاي زيادي را انتخاب كنيم ، بعلت خطاي نمونه گيري همگي داراي ويژگي هاي يكساني نيستند و ميانگين آنها با هم متفاوت است .  اگر يك جامعه داراي پراكندگي زيادي باشد ، ميانگين هايي كه از روي اين جامعه بدست مي آيد، بيشتر از ميانگين هايي كه از يك جامعه با پراكندگي كم بدست مي آيد ، با هم تفاوت دارند . اگر ميانگين نمونه هايي را كه از يك جامعه مي گيريم ، محاسبه كنيم ، توزيع اين ميانگين يك توزيع طبيعي خواهد شده ، ميانگين ، ميانگين هاي نمونه هاي انتخاب شده ، برابربا ميانگين جامعه خواهد بود . طبق ويژگي هاي توزيع طبيعي ميانگين يك نمونه با 26/68 درصد اطمينان ، نمره ها بين 1±  انحراف معيار از ميانگين جامعه قرار دارند . اين بدان معني است كه 26/68 درصد شانس وجود دارد ، ميانگين جمعيت نمونه به اندازه ي يك واحد خطاي معيار كمتر يا بيشتر از ميانگين جمعيت آماري باشد . طبق ويژگي هاي توزيع طبيعي ، ميانگين هاي يك نمونه با 95 درصد اطمينان ،  بين 96/1± انحراف معيار ميانگين جامعه ،  با 5/95 درصد اطمينان بين 2± انحراف معيار از ميانگين جامعه ، با 99 درصد اطمينان بين 58/2±  انحراف معيار از ميانگين جامعه ، با 73/99 درصد اطمينان بين 3 ± انحراف معيار ميانگين جامعه ، با 9/99 درصد اطمينان بين 29/3±  انحراف معيار از ميانگين جامعه قرار دارند . رابطه ي بينt ( اندازه ي متغير در توزيع نرمال كه هميشه نسبت به سطح اطمينان مشخص     مي شود ) و سطح اطمينان در جدول 3ـ2 ارائه شده است. 

                                  سطح اطمينان اندازه z يا t ( اندازه متغير در توزيع نرمال )                        26/68% 1                                                               95% 96/1                         5/95% 2                            99% 58/2                       73/99% 3                         9 /99%   29/3
 توزيع نرمال داراي انواع مختلفي است كه تفاوت آنها فقط در انحراف معيار و ميانگين آنهاست . توزيع نرمال استاندارد يكي از انواع توزيع نرمال است . توزيعي كه ميانگين آن صفر و انحراف معيار يك باشد توزيع نرمال استانداردناميده مي شود.منحني نرمال داراي ويژگي هايي است كه عبارتند از : 1ـ متقارن است ، يعني مشاهدات سمت چپ و راست ميانگين قرينه يكديگر هستند . توزيع نرمال به دليل ويژگي متقارن بودن ، نسبت نمره هاي بين   تا z3+ با نسبت نمره هايي كه بين    تا z3ـ قرار دارند ، برابر است . 2ـ شكل توزيع نرمال به ميانگين و انحراف معياربستگي دارد . تغيير در مقدار ميانگين سبب مي شود كه منحني به سمت راست يا چپ كشيده شود و تغيير در مقدار انحراف معيار سبب تغيير در شكل منحني (پخي ، كشيدگي يا نرمال بودن ) مي شود . 3ـ مساحت زير منحني نرمال مساوي با يك است ، كه نيمي كمتر از ميانگين و نيمي بيشتر از ميانگين است . بعبارت ديگر منحني نرمال از ناحيه ي ميانگين به دو نيمه مساوي تقسيم مي شود كه سهم هر نيمه برابر با 5/ . است . 4ـ دنباله ي منحني نرمال در هر دوسو ، موازي محور  x هاست . 5ـ منحني نرمال از ديدگاه تئوريكي شامل ± ∞ است ، ولي در عمل شامل  3±  انحراف معيار است . 6-در توزيع نرمال هر سه معيار مركز گرايي يعني ميانه ، نما و ميانگين با هم برابر هستند بيشترين تمركز نمره ها در نقطه ميانگين است .4ـ1 رسم نمودار    : اطلاعات جدول فراواني را مي توان بصورت نمودار نشان داد . نمايش داده ها به صورت نمودار داراي مزيت هايي بر نمايش داده ها به صورت جدول فراواني است كه عبارتند از : 1ـ اطلاعات آن سريعتر درك مي شود. 2ـ مقايسه نمودارها با يكديگر راحت تر و آسان تر از مقايسه جداول فراواني با يكديگر است . 3ـ نمودار تصوير روشن تري از داده ها ارائه مي دهند . 4ـ نمودار نسبت به جدول فراواني ويژگي داده ها را آسانتر توصيف مي كنند . نمودار ابزاري است براي نمايش و توصيف داده ها ، كه از دو محور تشكيل شده است :الف ـ محور عمودي يا محور y ها ب ـ محور افقي (عرضها) يا محور x ها . به محل تقاطع دو محور x و y مبدأ مختصات گفته مي شود و با o  نشان داده مي شود . طول نقاط واقع در سمت راست مبدأ مختصات و عرض نقاط بالاي مبدأ مختصات مثبت و طول نقاط واقع در سمت چپ مبدأ مختصات و عرض نقاط پايين مبدأ مختصات منفي است . spss  داراي 17 نوع نمودار است كه مهمترين آنها عبارتند از : 1ـ نمودار هيستوگرام 2ـ نمودار ستوني 3ـ نمودار دايره اي 4ـ نمودار جعبه اي 5ـ نمودار چند ضلعي 6ـ نمودار فراواني تراكمي يا اُجيو 7ـ نمودار سريهاي زماني 8ـ نمودار شاخه و برگ 4ـ2 انواع نمودار براي متغيرهاي اسمي و ترتيبي : نمودارهايي كه مي توان براي متغيرهاي اسمي و ترتيبي رسم كرد عبارتند از : الف ـ نمودار ميله اي ( ستوني )                   ب ـ نمودار دايره اي 4ـ2ـ1 ـ نمودار ميله اي يا ستوني   : نمودار ميله اي را مي توان براي متغيرهاي اسمي ترتيبي رسم نمود . براي رسم نمودار ميله اي بايد مراحل زير را انجام داد : 1ـ نموداري شامل يك محور عمودي و يك محور افقي رسم كنيد بطوري كه محور عمود    محور افقي باشد . 2ـ محور عمودي را y و محور افقي را x نامگذاري كنيد . 3 ـ اگر با تحليل يك متغيري سرو كار داشتيد ، گروه هارا درمحور افقي (محور x ها) و فراواني درصدها يا نسبت ها را در محور عمودي (محور y ها ) قرار دهيد . ولي اگر با تحليل دو متغيري سروكارداشتيد متغير مستقل را در محور افقي ( محور x ها ) و متغير وابسته را در محور عمودي ( محور y ها ) قرار دهيد . 4 ـ ارتفاع هر ميله هم به اندازه فراواني هر طبقه از متغير است .  در نمودار ميله اي پهناي هر ستون را مي توان به اندازه ي دلخواه تعيين كرد زيرا در مقياس هاي اسمي و ترتيبي مساحت دقيقي براي متغيرهاي گسسته وجود ندارد . ولي بلندي هرستون بايد حتماً به اندازه ي فراواني هركدام از مقوله ها باشد . مثال ـ توزيع فراواني 50 نفر از دانشجويان رشته جامعه شناسي در جدول 4ـ1 ارائه شده است ، نمودار ميله اي آن را رسم نماييد .جدول 4ـ1 ـ جنسيت دانشجويان : فراواني ، درصدهاجنسيت فراواني درصد مرد 30 60 زن 20 40 

سوال ـ آيا مي توان براي متغير سن نمودار ميله اي رسم كرد ؟ خير چون متغير سن يك متغير فاصله اي است ، ولي نمودار ميله اي براي متغير هاي اسمي يا ترتيبي مناسب است . اگر براي متغير سن نمودار ستوني رسم كنيم تعداد زيادي ستون ايجاد مي شود كه كارايي چنداني نخواهد داشت . همچنين از سويي ديگر ، اگر سن خاصي مثلاً 29ـ25 ساله نداشته باشيم ، در spss محل خالي براي اين گروه سني ايجاد نخواهد شد و چونكه فاصله بين ستون ها ايجاد نمي شود ، ما متوجه عدم وجود گروه سني 29ـ25 ساله نخواهيم شد .


روش اجراي نمودار ميله اي : 1ـ ابتدا منو analyze و سپس فرمان descriptive statistics را كليك مي كنيم . 2ـ فرمان frequencies را كليك كرده و متغير مورد نظر را به بخش variable منتقل مي كنيم. 3ـ گزينه ي charts و سپس bar charts را كليك مي كنيم. 4ـ در آخر هم گزينه يcontinue و سپس ok را كليك مي كنيم . اگر بخواهيم فراواني هر ستون در بالاي آن درج شود ابتدا دوبار نشانگر ماوس را روي نمودار كليك مي كنيم ، سپس                   گزينه يformat را كليك مي كنيم . سپس گزينه يbar label styles  وبعد گزينه ي framed را كليك كرده و در آخر گزينه ي apply all و بعد close را كليك مي كنيم. 5 ـ در آخر هم پنجره ي جديد باز شده رامي بنديم.  4ـ2ـ2 ـ نمودار دايره اي   يا قطاعي : نمودار دايره اي ، نموداري است كه درصد فراواني ها را به صورت قطعاتي از سطح دايره و متناسب با درصدهاي مذكور نشان مي دهد . در اين نمودار اندازه ي هر قطعه تحت تأثير تعداد نمونه ي حالت هاي مربوط به آن است . در نمودار دايره اي ، بزرگ يا كوچك كردن فراواني ها به يك نسبت ، تغييري در شكل نمودار بوجود نمي آورد.از اين نمودار هنگامي استفاده مي كنيم كه تعداد حالت هاي متغير كم باشد و متغير مورد بررسي در سطح سنجش اسمي يا ترتيبي باشد . مراحل رسم نمودار دايره اي : 1ـ يك دايره رسم كنيد . 2ـ براي اينكه بدانيم هرقطعه چه سطحي از دايره را اشغال مي كند ، ابتدا 360 يعني درجات محيط دايره رابر كل فراواني ها تقسيم ، سپس نتيجه ي بدست آمده را در فراواني هر طبقه ضرب مي كنيم . 

مثال : مذهب تعدادي از پاسخگويان در يك تحقيق در جدول 4ـ2 ارائه شده است                          با توجه به اين اطلاعات نمودار دايره اي پاسخگويان بر حسب نوع مذهب را رسم كنيد . جدول 4ـ2ـ جدول توزيع پاسخگويان بر حسب  نوع مذهب برحسب نوعنوع مذهب فراواني ارتدوكس 15پروتستان 15 كاتوليك 30 جمع 60 

 


روش اجراي نمودار دايره اي : 1ـ منو graphs و سپس فرمان  pie را كليك مي كنيم . 2ـ گزينه ي summaries for groups of cases و سپس گزينه ي   define را كليك        مي كنيم. 3ـ متغير مورد نظر را به بخش define slices منتقل كرده و، گزينه ي ok را كليك مي كنيم . اگر بخواهيم درصدها به نمودار اضافه شود، ابتدا دوبار نشانگر ماوس را روي نمودار كليك           مي كنيم ، سپس گزينه ي  chart را كليك مي كنيم وبعد بر روي گزينه ي options كليك      مي كنيم . 4ـ گزينه ي  percents را كليك مي كنيم . 5- ليست مربوط به position  را باز مي كنيم و گزينه هاي test outside  و number inside را كليك مي كنيم.6ـ بر روي گزينه ي ok كليك مي كنيم و سپس پنجره ي جديد باز شده را مي بنديم .  4ـ3 ـ انواع نمودار براي متغيرهاي فاصله اي و نسبي : مهمترين نمودارهايي كه مي توان براي متغيرهاي فاصله اي و نسبي رسم نمود عبارتند از : 1ـ نمودار هيستوگرام 2ـ نمودار فراواني تراكمي 3ـ نمودار چند ضلعي 4ـ نمودار شاخه و برگ 5ـ نمودار جعبه اي 4ـ3ـ1ـ نمودار هيستوگرام     : نمودار هيستوگرام ، نموداري است شامل ستون هاي چسبيده به هم ،كه نحوه ي توزيع مقادير داده ها را نشان مي دهد . در اين نمودار عرض هر مستطيل برابر با     فاصله ي طبقات ، مساحت مستطيل ها متناسب با فراواني طبقه و وسط هر مستطيل منطبق بر نماينده ي طبقه است . مراحل رسم نمودار هيستوگرام به شرح زير است : 1ـ محورهاي مختصات را رسم كنيد .2ـ محور افقي (محور x ها ) را به فواصل مساوي و به اندازه ي بيشترين عدد رسم نماييد . فاصله ي بين اعداد روي اين محور برابر فاصله ي طبقات (I) است،  بنابراين روي اين محور با فواصل مساوي حد پايين و حد بالاي حدود واقعي طبقات را بنويسيد . اگر داده ها گروه بندي شدهبودند، محور افقي به  حد وسط طبقات اختصاص دهيد .در اين نمودار عرض ستون ها برابر با عرض طبقات           ( فاصله ي بين حدبالاي دوطبقه ) و طول ستون ها برابر با فراواني گروهها يا مقادير است . 3ـ محور عمودي (محور y ها ) را به فواصل مساوي و به اندازه ي بيشترين فراواني رسم كنيد . مثال 5 ـ نمرات در س 30 نفر از دانشجويان يك كلاس در درس آمار در جدول 4ـ3 ارائه شده است . نمودار هيستوگرام نمرات دانشجويان در درس آمار را رسم نماييد . 

نمرات حدواقعي طبقات حدوسط طبقات فراواني11ـ8 5/1ـ5/7 5/9 615ـ12 5/15 5/13 1519ـ16 5/19ـ5/15 5/17 9     
   


روش اجراي نمودار هيستوگرام : براي اجراي نمودار هيستوگرام هم مي توان از منو analyze استفاده كرد وهم از منو graphs .الف ـ روش اجرا از منو analyze   : 1ـ ابتدا بر روي منو analyze كليك مي كنيم  . 2ـ فرمانdescriptive statistics   وسپس فرمان   frequencies   را كليك كرده و بعد متغير مورد نظر را به بخش variable منتقل مي كنيم  . 3ـ گزينه يcharts و سپس histograms  را كليك مي كنيم. 4ـ در آخر هم گزينه ي continueو سپس ok را كليك مي كنيم. اگر  بخواهيم مقادير فراواني بر روي نمودار ظاهر شوند، اقدامات زير را انجام مي دهيم:1- بر روي نمودار دو بار كليك مي كنيم.2- بر روي گزينه ي Format و سپس Bar Label Style  كليك مي كنيم.3- در پنجره ي Bar Label Style  بر روي گزينه ي Framed  سپس گزينه ي Apply All كليك مي كنيم.4- سپس پنجره ي باز شده را مي ببنديم.ب ـ روش اجرا از منو graphs  : 1ـ ابتدا منو graphs و سپس گزينه ي histogram  را كليك مي كنيم  . 2ـ متغير مورد نظر را به بخش variable منتقل مي كنيم. 3ـ گزينه ي display normal curve را انتخاب كرده و سپس بر روي گزينه ي ok            كليك مي كنيم. 4ـ3ـ2 ـنمودار چند ضلعي يا پليگون   : نمودار چند ضلعي روش ديگري براي به نمايش در آوردن اطلاعات است. اين نمودار از تعدادي نقاط كه توسط خطوط راست به يكديگر وصل مي شوند تشكيل شده است . 
مراحل رسم نمودار چند ضلعي : 1ـ محور هاي مختصات را رسم مي كنيم. 2ـ در محور افقي (محور xها) اگر متغير مورد بررسي  گروه بندي شده نبود، مقادير متغير و اگر متغير گروه بندي شده بود ، حد وسط طبقات (نماينده ي طبقات ) را قرار مي دهيم . روش محاسبه ي حد وسط طبقات بدين صورت است كه، حد پايين و حد بالاي هر طبقه را باهم جمع و سپس حاصل جمع را بر عدد 2 تقسيم مي كنيم. مثلاً در جدول 4ـ4 حد وسط طبقه اول عبارت است از :  هنگامي كه حد وسط طبقه ي اول را محاسبه كرديم براي محاسبه ي حدوسط طبقه ي دوم ، حد وسط طبقه ي اول را با فاصله ي طبقات جمع كنيم تاحد وسط طبقه ي دوم بدست آيد . در مثال ما حد وسط طبقه ي دوم عبارت است از :    . حدوسط طبقه ي سوم هم عبارتند از: حد وسط طبقه ي دوم بعلاوه فاصله ي طبقات . به همين ترتيب حد وسط ساير طبقات را محاسبه         مي كنيم  . در محور افقي دو طبقه ي اضافي با فراواني صفر براي ختم شدن نمودار به محور x ها در نظر         مي گيريم . 3ـ در محور  عمودي ( محور yها) مقادير فراواني رامي نويسيم .4ـ اولين طبقه را در نظر بگيريد ، حد وسط طبقه ي آن عدد152 و فراواني آن عدد 9 است . ازحدوسط طبقه ي اول يعني عدد 152 موازي با محور عمودي y ها خط چين به سمت بالا رسم       مي كنيم  تا به فراواني 9 برسيم .سپس از محور عمودي در فراواني 9 موازي با  محور افقي  خط چيني رسم مي كنيم تا همديگر را در يك نقطه قطع كنند. آنگاه محل تقاطع اين دوخط را با نقطه پر رنگ مشخص مي كنيم. به همين ترتيب براي ساير طبقات محل تلاقي حد وسط طبقات و فراواني ها را مشخص مي كنيم. پس از آن همه ي طبقاتي را كه بدين صورت مشخص كرده ايم، را به وسيله ي خطي به يكديگر وصل مي كنيم.


جدول 4ـ4 توزيع قد پاسخگويانطبقات F حدوسط طبقات 154-150 9 152159-155 11 157164-160 15 162169-165 13 167174-170 11 172179-175 8 177184-180 11 182189-18513 187194-190 9 192

 

4ـ3ـ3ـ نمودار فراواني تراكمي    : نمودار فراواني تراكمي گا هي نمودار طاق رومي ogiveنيز ناميده مي شود. زيرا شكل منحني كه از تراكم فراواني ها بدست مي آيد به شكل طاق است . از نمودار فراواني تراكمي هنگامي استفاده مي كنيم كه بخواهيم موقعيت آزمودنيها را در توزيع فراواني داده ها بدانيم . مراحل رسم نمودار فراواني تراكمي : 1ـ نموداري شامل يك محور عمودي و يك محور افقي رسم كنيد بطوري كه نسبت محور افقي به عمودي 4 به 3 باشد . 2ـ در محورعمودي (محور y ها) فراواني تراكميfci  يا درصد فراواني تراكمي داده را مي نويسيم . فراواني تراكمي هر طبقه بدين صورت بدست مي آيد كه فراواني همان طبقه ، با مجموع فراواني هاي طبقات پايين تر از آن جمع را جمع مي كنيم . محور عمودي بايد حداقل به اندازه ي فراواني انتخاب شود و فاصله ي نسبت ها هم بايد مساوي باشد . 3ـ در محور افقي (محور x ها)، اگر داده ها گروه بندي شده باشد، حد بالاي حدود واقعي  طبقات را قرار مي دهيم . البته در روي اين محور حدپايين حدود واقعي طبقه ي اول با فراواني صفر را نيز مشخص مي كنيم تا از طريق آن منحني را به محور افقي وصل كنيم . واگر داده ها گروه بندي نشده باشند در روي محور افقي مقادير متغير را مي نويسيم . 4ـ اولين طبقه را در نظر مي گيريم حد بالاي اين طبقه عدد154 است . از عدد 154  خطي بصورت خط چين موازي با محور عمودي به طرف بالا رسم مي كنيم و آنرا تاجايي ادامه مي دهيم كه به فراواني تراكمي متناظر با آن  يعني 9 برسيم . سپس از محور عمودي در فراواني موازي با محور افقي خط چين رسم مي كنيم تا اين دو خط چين همديگر را در يك نقطه قطع كنند . 5ـ محل تلاقي اين نقاط را مشخص مي كنيم. سپس همه ي نقاطي را كه بدين صورت مشخص كرده ايم را بوسيله خطي به يكديگر وصل مي كنيم. 


طبقات حدود واقعي طبقات فراواني فراواني تراكمي fci درصدفراواني تراكمي 154-150 5/154-5/149 9 9 9%159-155 5/159-5/154 11 20 20%164-160 5/164-5/159 15 35 35%169-165 5/169-5/164 13 48 48%174-170 5/174-5/169 11 59 59%179-175 5/179-5/174 8 67 67%184-180 5/184-5/179 11 78 78%189-185 5/189-5/184 13 91 91%194-190 5/194-5/189 9 100 100%


4ـ3ـ4 ـ نمودار جعبه اي   :  نمودار جعبه اي براي خلاصه كردن مجموعه ي بزرگي از داده ها بكار برده مي شود . از طريق اين نمودار مي توان به تغييرپذيري داده ها، تقارن يا عدم تقارن داده ها، ميانه (چارك دوم )، چارك اول و سوم ، دامنه ي بين چاركي ، حداكثر و حداقل داده ها ، نقاط پرت و انتهايي داده ها پي برد . در اين نمودار خود مستطيل نشان دهنده ي دامنه ي بين چاركي يعني فاصله ي بين چارك سوم و چارك اول و خط داخل جعبه نشان دهنده ي ميانه (محل تجمع داده ها ) است . اگر خط ميانه در وسط مستطيل باشد پي مي بريم كه داده ها قرينه اند. ولي اگر خط ميانه در طرف پايين مستطيل باشد ، داده ها داراي چولگي مثبت و اگر در طرف بالاي مستطيل باشد داده ها داراي چولگي منفي اند . نقاط دو سوي جعبه هم حداقل و حداكثر داده ها را نشان مي دهند . همچنين در اين نمودار مقادير پرت بوسيله ي o(كه حرف اول outlierاست )نمايش داده مي شود و اعداد كنار آن هم شماره ي آن مورد است . مقدار پرت در اين نمودار ، مقداري است كه فاصله ي آن تا جعبه حداقل 5/1 برابر طول جعبه باشد . همچنين در اين نمودار مقادير انتهايي به وسيله   نشان داده  مي شوند . مقادير انتهايي هم مقاديري هستند كه، فاصله ي آنها تا جعبه حداقل 3 برابر طول جعبه باشد . (مانند شكل 4ـ7 ) 


مثال ـ وزن 30 نفر از دانش آموزان يك كلاس ثبت شده است كه اطلاعات آن در زير آورده       شده است . 
حال نمودار جعبه اي آن را رسم مي كنيم . 

روش اجراي نمودار جعبه اي : 1ـ ابتدا منو graphs  وسپس فرمان boxplot  را كليك مي كنيم تا پنجره ي آن باز شود . 2ـ در پنجره ي boxplotگزينه هايsimple و summaries of separate variablesرا      كليك مي كنيم. 3ـ بر روي گزينه ي defineكليك مي كنيم. 4ـ متغيري را كه مي خواهيم در محور عمودي ظاهر شود را به بخش variableو متغيري كه          مي خواهيم در محور افقي ظاهر شود را به بخش category axis منتقل كرده و سپس بر روي گزينه ي ok كليك مي كنيم. 4ـ3ـ5 ـ نمودار شاخه و برگ   : نمودار شاخه و برگ مناسب مجموعه كوچكي از داده ها است . براي رسم اين نمودار بايدداده ها را به دو قسمت تقسيم نمود . قسمت اول شاخه است، كه معمولاً اولين رقم است و مي تواند يك رقم يا بيش از يك رقم باشد . همچنين شاخه را مي توان بصورت صعودي يا نزولي مرتب كرد . قسمت دوم برگ است، كه آخرين رقم يا يكان  عدد است و هميشه يك رقمي است . تعداد ارقام مربوط به برگها به اندازه ي تعداد فراواني هاست . براي جدانمودن شاخه و برگ از يكديگر  خطي عمودي در سمت چپ برگ و سمت راست شاخه بين شاخه ها و برگ ها كشيده مي شود . در سمت راست اين خط برگها از چپ به راست بصورت صعودي مرتب مي شود . (در spssبجاي خط از نقطه براي جدا كردن شاخه و برگ از يكديگر استفاده مي شود.) گاهي اوقات پيش مي آيد كه فاصله ي داده ها در برگ خيلي زياد است و داده هارا بخوبي نشان   نمي دهد . در چنين مواقعي براي رفع اين مشكل ، فاصله ي داده ها را به دو قسمت 4ـ1 و 9ـ5 تقسيم كرده و براي قسمت اول (4-1) علامت * و براي قسمت دوم (9ـ5 )     علامت ● به كار برده مي شود . مثلاً فاصله بين 89ـ80 زياد مي باشد ، براي رفع اين مشكل براي فاصله 84ـ80  در شاخه علامت   *8  و براي فاصله 89ـ85 در شاخه علامت  ● 8  بكار برده مي شود . مثال ـ وزن 30 نفر از دانشجويان يك كلاس به شرح زير است : 82 ، 80، 79 ،  77، 76 ، 75 ، 72، 69  ،  68،   67، 63  ، 62  ، 61 ، 59 ، 58  ،  57،   55، 54  ، 52، 50                                             98، 96  ، 93، 91،90 ،89 ، 88، 87  ،  85، 83،نمودار شاخه و برگ اين داده ها را رسم نماييد . از روي اين نمودار مي توان نقاط پرت ، شكل توزيع و مركز توزيع داده ها را به خوبي نشان داد . 

روش اجراي نمودار شاخه و برگ : 1ـ ابتدا منو ي analyze و سپس فرمان descriptive statistics  را كليك مي كنيم. 2ـ فرمان explore را كليك كنيد تا پنجره ي آن باز شود. 3ـ متغير مورد نظر را به بخش dependet list منتقل كرده و در بخش display گزينه ي plot  را انتخاب مي كنيم.4ـ سپس گزينه ي plot  در قسمت پايين پنجره explore را كليك كرده تا پنجره ي plots باز شده و سپس در بخش descriptive گزينه ي stem- and-leaf را انتخاب مي كنيم. 5ـ در بخش boxplot   بر روي گزينه ي none   كليك مي كنيم. 6ـ بر روي گزينه ي continue و سپس ok كليك مي كنيم. 5ـ1 فرضيه چيست : فرضيه حدس وگمان محقق است درباره ارتباط بين متغيرهاي مورد بررسي كه بتوان درستي آن را بررسي كرد . 5ـ2 ـ انواع فرضيه هاي آماري : فرضيه هاي آماري به دسته تقسيم مي شوند : 1ـ فرضيه صفر (يا فرض صفر ) 2ـ فرضيه مخالف (يا فرض مخالف ) 5ـ2ـ1 ـ فرض صفر  : فرض صفر يا فرض اوليه را با H0 نشان مي دهند . فرض صفر اصل را براين قرار مي دهد كه هيچ ارتباط يا هيچ اختلافي بين متغيرهاي مورد بررسي وجود ندارد و اگر رابطه يا اختلافي هم هست، ناشي از اتفاق يا خطاي نمونه گيري است . ما همواره در آزمون فرض آماري ، فرض صفر را آزمون مي كنيم . فرض صفر همواره صحيح فرض مي شود، مگر اينكه شواهد و مدارك ، خلاف آن را ثابت كند . ما به راحتي مي توانيم نادرستي فرضيه اي را اثبات كنيم. به اين صورت كه اگر نتايجي را كه بدست آورده ايم، موافق فرضيه ي مورد نظر  نبود ، فرض صفر را رد مي كنيم، ولي اثبات درستي فرضيه خيلي سخت است  . اگر نتايج بدست آمده موافق فرضيه ي ما باشد ، تنها معنايي كه دارد اين است كه فرضيه ي ما رد نشده است ،. ولي اثبات هم نشده است ، زيرا ممكن است يك ساعت يا يك سال يا … ديگر فرضيه ي ما رد شود يا رد نشود . بنابراين هيچ وقت نمي توانيم يا نبايد بگوييم فرض صفر را پذيرفته ايم، بلكه بايد بگوييم فرض صفر را  رد نكرده ايم، زيرا شواهد موجود به اندازه ي كافي قوي نيستند . وقتي فرض صفر را رد نمي كنيم معني آن اين است كه، مدارك وشواهد و كافي براي نتيجه گيري نداريم، يا شواهد كافي براي اينكه بگوييم اين فرضيه غلط است، در دست نداريم . هنگامي كه فرض صفررا رد نمي كنيم، بايد در نتيجه گيريمان دقت كافي را مبذول داريم. مخصوصاً زماني كه حجم نمونه ي آماري ما كم باشد ، زيرا هنگامي كه حجم نمونه ي آماري كم است توان كافي براي پيدا كردن اختلاف ها را نداريم . ولي هنگامي كه حجم نمونه زياد  است توان زيادي را براي تشخيص اختلاف ها و حتي اختلاف هاي كوچك داريم . فرض صفر در آمار شبيه اصل برائت درمجامع قضايي است، بدين صورت كه ممكن است شخص را به اتهام قتل بازداشت كنند، ولي نتوانند دلايل و شواهد كافي براي محكوم كردن شخص پيدا كنند، ولي اين پيدا نكردن شواهد دليل بر بي گناهي شخص نيست، بلكه فقط نتوانسته اند شواهد كافي براي اثبات گناه كاربودن شخص پيدا كنند . پس فرض صفر همان فرض بي گناهي متهم است .  5ـ2ـ2 ـ فرضيه جانشين يا مخالف    : فرض مخالف را با H1 يا  A   H نشان مي دهند . فرض مخالف همان فرضيه ي تحقيق است . اگر فرض صفر را رد كنيم، دليلي براي رد فرضيه ي تحقيق نداريم و اين بدين معني است كه  فرضيه ي ما رد نگشته است، ولي اثبات هم نشده است، چون ممكن است در آينده رد شود يا رد نشود . فرض مخالف همان فرضيه ي مجرم بودن متهم است . 5ـ3ـ آزمون معني داري :   آزمون معني داري به ما مي گويد، آيا رابطه اي كه بين متغيرهاي مورد بررسي در نمونه ي آماري وجود دارد، در جامعه ي آماري هم همين را بطه وجود دارد يا خير ، اين رابطه ي مشاهده شده ناشي از تصادف و شانس  يا خطاي نمونه گيري است . گاهي ممكن است كه روش هاي همبستگي ، همبستگي بالايي را بين متغيرهاي مورد بررسي نشان دهد، ولي آزمون هاي معني داري ، اين همبستگي را ناشي از شانس يا خطاي نمونه گيري بداند.حال سوال  اين است كه چه كار بايد كرد ؟ پاسخ ساده است، اولويت با آزمون هاي معني داري است. حتي اگر همبستگي بالايي بين متغيرهاي مورد بررسي هم وجود داشته باشد، ولي آزمون معني داري اين همبستگي را ناشي از شانس يا خطاي نمونه گيري بداند ، بايد از آزمونهاي معني داري پيروي كرد و به همبستگي بين متغيرها توجه زيادي نكرد . 

5ـ4 ـ انواع خطا : خطا بر دو نوع است كه عبارتند از :الف ـ خطاي نوع اول                     ب ـ خطاي نوع دوم  5ـ4ـ1ـ خطاي نوع اول   :  خطاي نوع اول، خطاي رد كردن است.  بدين معني كه      H0¬¬¬¬¬¬¬¬ ( مبني بر عدم تفاوت يا ارتباط ) را نبايد رد كنيم ، ولي ما آنرا رد مي كنيم . آلفا(α)علامتي است كه براي نشان دادن احتمال خطاي نوع اول به كار مي رود، به همين دليل گاهي خطاي نوع اول را خطاي آلفا(a) هم مي نامند. احتمال خطاي نوع اول بستگي به نظر پژوهشگر و موضوع تحقيق دارد. به عبارت ديگر احتمال خطاي نوع اول بستگي به سطح معني داري (a) دارد ، بدين صورت كه، وقتي پژوهشگر سطح معني داري را 05/0تعيين مي كند ، احتمال خطاي نوع اول هم 5 درصد است. يعني در پنج درصد مواقع فرضيه ي صفر را كه را نبايد رد كنيم ، به اشتباه  رد مي كنيم . هرچه سطح معني داري را كوچكتر در نظر بگيريم احتمال خطاي نوع اول هم كمتر مي شود. پس هنگامي كه سطح معني داري را يك درصددر نظر بگيريم، احتمال خطاي نوع اول كمتر از زماني است كه معني داري را پنج درصد در نظر بگيريم . خطاي نوع اول اين است كه متهم بي گناه ، محكوم به گناهكار بودن شود . براي كم كردن احتمال بروز خطاي نوع اول بايد حجم نمونه را افزايش داد .5ـ4ـ 2 ـ خطاي نوع دوم    : خطاي نوع دوم، خطاي پذيرفتن است. بدين معني كه ، هنگامي كه فرض صفر غلط است و بايد رد شود فرض صفر را رد نمي كنيم. يعني درحالي كه تفاوتي بين داده ها وجود دارد(رد فرض صفر )، ما به غلط نتيجه مي گيريم كه تفاوتي در داده ها وجود ندارد (پذيرش فرض صفر ) .  علامتي كه براي نشان دادن احتمال خطاي نوع دوم بكار مي رود بتا (β) است ، به همين دليل گاهي خطاي نوع دوم را خطاي بتا  مي نامند . هرچه سطح معني داري را كوچكتر در نظر بگيريم احتمال خطاي نوع اول كاهش، ولي احتمال خطاي نوع دوم افزايش          مي يابد(البته در صورتي كه حجم نمونه ثابت باشد. پس هنگامي كه حجم نمونه ثابت باشد بين خطاي نوع اول و نوع دوم رابطه ي معكوس وجود دارد ، يعني افزايش احتمال خطاي نوع اول باعث كاهش احتمال خطاي نوع دوم وكاهش احتمال خطاي نوع اول باعث افزايش احتمال خطاي نوع دوم مي شود . احتمال ارتكاب خطاي نوع دوم به عواملي بستگي دارد كه اين عوامل عبارتند از :1ـ حجم نمونه : هرچه حجم نمونه كمتر باشد احتمال ارتكاب خطاي نوع دوم بيشتر است ، بنابراين براي اينكه احتمال ارتكاب خطاي نوع دوم را كم كنيم، بايد حجم نمونه راافزايش دهيم .زيرا با افزايش حجم نمونه، دقت تحقق افزايش مي يابد و با افزايش دقت، مقدار خطا كاهش مي يابد. 2ـ سطح معني داري : هرچه سطح معني داري افزايش يابد، احتمال ارتكاب خطاي نوع دوم كاهش مي يابد زيرا بين احتمال ارتكاب خطاي نوع اول و خطاي نوع دوم را بطه ي معكوس وجود دارد(البته در صورتي كه حجم نمونه ثابت باشد) و از آنجايي كه احتمال ارتكاب خطاي نوع اول برابر سطح معني داري است، بنابراين هرچه سطح معني داري را بزرگتر در نظر بگيريم احتمال ارتكاب خطاي نوع دوم كاهش مي يابد . 3ـ  ميزان تأثير متغيرهاي مستقل و ميزان پراكندگي متغير وابسته : هرچه تأثير متغيرهاي مستقل بيشتر باشد و متغير وابسته پراكندگي (واريانس ) بيشتري داشته باشد احتمال ارتكاب خطاي نوع دوم كاهش مي يابد . 4ـ اعتبار و قابليت اعتماد ابزار اندازه گيري تحقيق : هرچه اعتبار و قابليت اعتماد ابزار اندازه گيري تحقيق بيشتر باشد ، انحراف معيار كاهش مي يابد و هرچه انحراف معيار متغير مورد بررسي كوچكتر باشد ، توان آزمون بيشتر و احتمال ارتكاب خطاي نوع دوم كمتر مي شود . احتمال مرتكب شدن خطاي نوع دوم آزمون هاي ناپارامتري بيشتر از آزمون هاي پارامتري است . توان يك آزمون احتمال قبول فرض مخالف ((H1است ، هنگامي كه اين فرض واقعاً درست است يا احتمال رد كردن فرض صفر است ، هنگامي كه فرض صفر غلط است و مقداري آن بين صفر تا يك متغير است . هرچه توان بيشتر باشد احتمال  رد كردن فرض صفري كه غلط است بيشتر مي شود . β  ـ  1  = توان آزمون  پس توان آزمون همان ميزان قابليت ممكن براي دور ماندن از خطاي نوع دوم است . هر عاملي كه موجب كاهش خطاي نوع دوم شود ، توان آزمون را بالا مي برد .هرچه توان يك آزمون بيشتر باشد احتمال ارتكاب خطاي نوع دوم كمتر مي شود و از آنجايي كه توان آزمون هاي يك دامنه بيشتر از آزمونهاي دو دامنه است بنابراين احتمال ارتكاب خطاي نوع دوم ، آزمون هاي يك دامنه كمتر از آزمون هاي دو دامنه است .5ـ نوع آزمون : رابطه ي بين فرض صحيح و فرضي كه محقق پذيرفته در جدول 5ـ1 ارائه شده است . جدول 5-1-جدول رابطه ي بين فرض صحيح و فرض پذيرفته شده توسط محقق

5ـ5 ـ سطح معني داري   : احتمال مرتكب شدن خطاي نوع اول را سطح معني مي نامند و آنرا با a نشان مي دهند . بنابراين سطح معني داري برابر است با، احتمال خطاي نوع اول . بدين معني كه اگر 05/0 =a باشد، احتمال خطاي نوع اول هم 5 درصد است . هرچند كه سطح معني داري اختياري است و به نظر محقق بستگي دارد ، ولي معمولا در علوم رفتاري سطح معني داري قابل قبول را 05/0 يا 01/0 در نظر مي گيرند . اگر سطح معني داري 05/0 باشد معني آن اين است كه در 95 مورد از 100 مورد نمونه ما ، رابطه ي مشاهده شده واقعي است ودر 5 مورد از 100 مورد رابطه ي مشاهده شده ناشي از شانس و تصادف است.  به عبارت ديگر پنج درصد از پيامدها منجر به رد فرضيه صفر (H0)مي شود. در نرم افزارهاي آماري براي اينكه در مورد نتيجه ي بدست آمده نتيجه گيري شود، علاوه بر محاسبه و ارائه ي آماره ي آزمون ، عددي تحت عنوان sig ( يا p-value) ارائه مي شود .به كمك اين sig ديگر احتياجي به مراجعه به جداول آماري نيست . اين sig ( يا p-value ) كمترين مقدار a است كه مي توان فرضيه ي صفر را رد كرد . هرچه مقدار sig كمتر باشد ، شواهد قوي تري عليه فرضيه ي صفر وجود دارد و اطمينان  ما به درست بودن فرضيه ي مخالف و در نتيجه رابطه ي مشاهده شده بين متغيرها بيشتر است. مثلاً، هنگامي كه در سطح معني داري 01/0 رابطه ي بين دومتغير تأييد شود و در مورد دومتغير ديگر رابطه ي بين آنها در سطح 05/0 تأييد شود، اطمينان به وجود رابطه ي بين دو متغير اول بيشتر از رابطه ي بين دو متغير دوم است . هنگامي كهsig مساوي يا كمتر از سطح معني داري (05/0 يا 01/0 يا … ) باشد، فرض صفر رد مي شود و نتيجه مي گيريم كه با احتمال 95( يا 99) درصد اطمينان بين متغيرها رابطه ي معني دار وجود دارد . ولي اگر مقدار عددي sig بيشتر از سطح معني داري باشد ، فرض صفر را نمي توانيم رد كنيم بنابر اين نتيجه مي گيريم كه با 95( يا 99) درصد اطمينان رابطه ي ( يا همبستگي ) بين متغيرها معني دار نيست پس دليلي بر درست بودن فرضيه ي تحقيق نداريم . سطح معني داري راگاهي سطح اطمينان  ، سطح اعتماد يا مرز اهميت نيز مي نامند .  5ـ6 ـ ناحيه ي بحراني    : ناحيه اي است كه اگر پيامدها در آن قرار گيرند، بايد فرضيه صفر  (H0)را رد كنيم به همين علت گاهي ناحيه رد(rejection  region )ناميده مي شود . ناحيه بحراني به وسيله ي سطح معني داري  (a)مشخص مي شود. مثلاً اگر سطح معني داري برابر با يك در صد (α=%1)  باشد ، معني آن اين است كه فقط يك درصد پيامدها منجر به رد فرض صفر        مي شود . 5ـ7 ـ آزمون يك دامنه و دو دامنه : 5ـ7ـ1 ـ آزمون يك دامنه  : فرضيه اي مستلزم آزمون يك دامنه است كه، در آن جهت رابطه يا اختلاف صفت مانند افزايش يا كاهش ، كمتر يا بيشتر ، مثبت يا منفي بودن و … مورد نظر باشد مانند فرضيه هاي زير :  1ـ مردان بيشتر از زنان گرايش به انحراف دارند . 2ـ بين ميزان تحصيلات پاسخگويان و گرايش آنان به انحراف رابطه ي منفي و معني دار وجود دارد . در آزمون يك دامنه چون يك ناحيه براي رد فرض صفر وجود دارد و ناحيه ي بحراني از يك بخش تشكيل شده است، جهت داراست . معني جهت دار بودن اين است كه مثبت يا منفي بودن             رابطه ي، تغييرات مقدارهاي بين دو متغير را نشان مي دهد . آزمون يك دامنه شامل آزمون چپ دامنه و آزمون راست دامنه است . آزمون راست دامنه آزموني است كه ناحيه ي بحراني در منتهي اليه سمت راست منحني قرار دارد (مانند 5ـ2 و 5ـ4 ) آزمون كروسكال ـ واليس يك آزمون راست دامنه است . آزمون چپ دامنه ، آزموني است كه ناحيه بحراني در منتهي اليه سمت چپ منحني قرار دارد        (مانند 5ـ1 و 5ـ3 ) .احتمال يك آزمون يك دامنه، دو برابر احتمال يك آزمون دو دامنه است. يعني اگر با اندازه ي  t يك درصد  در يك آزمون يك دامنه قضاوت كنيم بايد از اندازه ي tدو درصد  استفاده كنيم ويا اگر با اندازه ي  tپنج درصد در يك آزمون يك دامنه قضاوت كنيم بايد از اندازه  يt   ده درصد استفاده كنيم . 

5ـ7ـ2 ـ آزمون دو دامنه  :اگر هدف يك آزمون مشخص كردن رابطه يا تفاوت بين دومقدار ( مساوي يا عدم مساوي بودن ) ، بدو ن توجه به جهت تغييرات آنها باشد ، مستلزم آزمون دو دامنه است . آزمون دو دامنه غير جهت دار است . معني غير جهت دار بودن اين است كه، ميزان رابطه يا تغييرات بين متغيرها را بدون نشان دادن جهت آنها ( مثبت يا منفي بوده ) نشان مي دهد . مثل فرضيه ي ، هوش افراد ورزشكار و افراد غير ورزشكار تفاوت معني داري وجود دارد . زماني از فرضيات غير جهت دار استفاده مي شود كه، محقق از جهت رابطه يا تفاوت بين متغير مستقل و متغير وابسته آگاه نباشد و جهت رابطه ي متغيرها در تحقيقات قبلي متناقض هم باشند. يعني در يك تحقيق رابطه ي بين متغيرها مثبت و در تحقيق ديگر منفي بدست آمده باشد . در آزمون دو دامنه ، ناحيه ي بحراني از دو بخش تشكيل شده است، كه يكي در منتهي اليه سمت راست منحني و ديگري در منتهي اليه سمت چپ منحني قرار دارد  . بعبارت ديگر در آزمون دو دامنه دو، ناحيه ي براي فرض صفر وجود دارد . ناحيه بحراني براي آزمون دو دامنه به ازاي 01/0a =   و 05/0a = در شكل 5ـ5 و 5ـ6 ارائه شده است . 

6ـ 1 ـ آزمون نرمال بودن متغيرها : براي اينكه ببينيم توزيع متغير مورد بررسي در جامعه نرمال است يا خير ، دو راه پيش رو داريم : الف ـ استفاده از تجربه ي ديگران و تحقيقات قبلي. ب ـ با استفاده از يك آزمون مقدماتي  در جامعه ي آماري ، آزمون نرمال بودن متغيرها را انجام دهيم . آزمون نرمال بودن باتوجه به سطح سنجش متغيرهاي مورد بررسي متفاوت است .اين آزمونها عبارتند از : الف ـ آزمون نرمال بودن براي متغيرهاي اسمي ، آزمون مربع خاي (x2) است . ب ـ آزمون نرمال بودن براي متغيرهاي ترتيبي ، آزمون كلموگوروف ـ اسميرنوف است . ج ـ آزمون نرمال بودن براي متغيرهاي فاصله اي و نسبي ، آزمون هاي خطاي استاندارد ميانگين و آزمون T استيودنت است . 6ـ2 ـ آزمون نرمال بودن متغيرهاي اسمي : آزمون نرمال بودن متغيرهاي اسمي ، آزمون مربع خاي است كه توسط يك آماردان انگليسي بنام سركارل پيرسون  در سال 1900 ميلادي بكاربرده شده است . (اين آزمون را در قسمت آمار استنباطي مناسب براي متغيرهاي اسمي توضيح خواهيم داد .) 6ـ3 ـ آزمون نرمال بودن متغيرهاي ترتيبي : آزمون نرمال بودن متغيرهاي ترتيبي ، آزمون كلموگوروف ـ اسميرنوف است كه توسط يك رياضي دان روسي بنام كلموگوروف   در سال 1933 پيشنهاد شده است .  اين آزمون بر دو نوع است :الف ـ آزمون يك نمونه اي كلموگوروف ـ اسميرنوف .ب ـ آزمون دو نمونه اي كلموگوروف ـ اسميرنوف .6ـ3ـ1ـ آزمون يك نمونه اي كلموگوروف ـاسميرنوف : در متغيرهاي ترتيبي، هنگامي كه حجم نمونه كمتر از 40 باشد، امكان اينكه فراواني هاي مورد انتظار كوچكتر از 5 باشد زياد است. درچنين مواقعي بجاي استفاده از آزمون كي دو، از آزمون يك نمونه اي كلموگوروف ـ اسميرنوف استفاده مي شود .فرمول آزمون يك نمونه اي كلموگوروف ـ اسميرنوف عبارت است از : 
  =Dc مقدار محاسبه شده .  فراواني تجمعي نسبي محاسبه شده            =فراواني تجمعي نسبي مورد انتظار اگر مقدار محاسبه  (مقدار جدول ) باشد، فرض صفر را ردمي كنيمو اگر   باشدفرض صفر را مي پذيريم . مقدار Dt  هم با استفاده از حجم نمونه و سطح معني داري و به روش زير بدست مي آيد :  براي پيدا كردن اين مقادير از جدول شماره ي يك استفاده مي شود. در اين جدول ، مقادير D براي حجم تا 35 نمونه آورده شده است . اگر حجم نمونه 35 يا كمتر 35 باشد، مقادير جدول را با مقدار محاسبه شده مقايسه مي كنيم، ولي اگر حجم نمونه ي بيشتر از 35 موردباشد از سطر over 35   و با استفاده از فرمولهاي ارائه شده در اين سطر مقادير جدول را محاسبه مي كنيم . مثلاً با 95 درصد اطمينان و حجم نمونه ي 200 مقدار Dt  عبارت است از :   فرض صفر در آزمون يك نمونه اي كلموگوروف ـاسميرنوف اين است كه، بين فراواني هاي مشاهده شده و فراواني هاي مورد انتظار تفاوتي وجود ندارد. به عبارت ديگر توزيع جامعه نرمال است. و فرض مخالف در اين آزمون اين است كه كه بين فراواني هاي مورد مشاهده و فراواني هاي مورد انتظار تفاوت وجود دارد. بعبارت ديگر توزيع جامعه نرمال نيست . توان آزمون يك نمونه اي كلموگوروف ـ اسميرنوف بعلت اينكه در آن فراواني هاي مشاهده شده به صورت جداگانه بكاربرده مي شوند ، بيشتر از آزمون كي دو است . مثال ـ از 200 دانشجو راجع به ميزان  رضايت از درآمدخانواده سوال شده است كه نتايج آن در زيرارائه شده است .  سوال اين است كه آيا ميزان رضايت دانشجويان از درآمد خانواده يكسان است ياخير ؟ 

ميزان رضايت از درآمدخانواده فراواني مشاهده شده (ni)   فراواني مورد انتظار (nith)    Dخيلي كم 
كم 
تاحدوديزياد 
خيلي زياد 50
40
7020
20 40
40
4040
40 50
90
160180
200 40
80
120160
200        
جمع 200
                           تفسير : با توجه به نتايج بدست آمده نتيجه مي گيريم كه با 95 درصد اطمينان يكسان بودن رضايت دانشجويان از درآمدخانواده رد مي شود . (رد فرض صفر ) بعبارت ديگر توزيع نرمال نمي باشد . 


روش اجراي آزمون يك نمونه اي كلموگوروف ـ اسميرنوف  : 1ـ منو analyze و سپس فرمان nonparametric test را كليك مي كنيم . 2ـ فرمان1-sample k-sراانتخاب مي كنيم تاپنجره ي one-sample kolmogorov-smirnov test براي اجراي آزمون باز شود .3ـ در اين پنجره متغير مورد نظر را به قسمتtest variable list : منتقل كرده و سپس روي گزينه ي   norml در قسمت   test distribution كليك مي كنيم . 4ـ گزينه ي continue و سپس ok را كليك مي كنيم. روش تفسيرخروجي :الف  ـ راه اول اين است كه به مقدار kolmogorov- smirnov z در جدول نگاه مي كنيم ، اگر مقدار آن كوچكتر از 96/1 + و بزرگتر از 96/1- بود (بين 96/1 ± ) نتيجه مي گيريم، با 95 درصد اطمينان بين فراواني هاي مشاده شده و مورد انتظار تفاوتي وجود ندارد. به عبارت ديگر توزيع جامعه نرمال است. ولي اگر مقدار آن كوچكتر از 96/1 – و يا بزرگتر از 96/1+ بود نتيجه مي گيريم، با 95 درصد اطمينان بين فراواني هاي مشاهده شده و مورد انتظار تفاوت وجود دارد ، بعبارت ديگر توزيع جامعه نرمال نيست . ب ـ راه دوم اين است كه به مقدار Asymp.sig.(2 tailed) نگاه كنيم اگر مقدار آن كمتر از 5./ . بود ، نتيجه مي گيريم توزيع جامعه نرمال نيست . ولي اگر مقدار آن بيشتر از 5./ . بود ، نتيجه          مي گيريم، توزيع جامعه نرمال است .  6ـ3ـ2 ـ آزمون دو نمونه اي كلموگوروف ـ اسميرنوف :آزمون دو نمونه اي كا - اس    (k-s)  براي متغيرهاي ترتيبي كه بين 7ـ3 مقوله داشته باشند و حجم نمونه (n) براي هرعضوآن بيشتر از 40 نمونه باشد، مورد استفاده قرار مي گيرد . اگر حجم نمونه ها كمتر از 40 باشد، بايد حتماً حجم نمونه ها با هم برابر باشند  .اين آزمون هم در فرضيه هاي يك دامنه وهم دو دامنه مورد استفاده  قرار مي گيرد وكارايي آن در اين آزمون 90-85 درصد آزمون تي استيودنت است . در اين آزمون احتمال وقوع آماره ي Dدر مورد فرضيه هاي يك دامنه (جهت دار ) با درجه آزادي    از روي توزيع مربع خاي (جدول شماره ي 3) و بر اساس فرمول زير محاسبه مي شود .  ولي در اين آزمون احتمال وقوع آماره ي D درمورد فرضيه هاي دو باله از روي توزيع مقدارهاي D (جدول شماره 2 ) محاسبه مي شود . مراحل اجراي اين آزمون در فرضيه هاي دودامنه به صورت زير انجام مي گيرد . 1ـ ابتدا فراواني تراكمي هرگروه را محاسبه مي كنيم. فراواني تراكمي با جمع زدن فراواني هر طبقه، با طبقات ماقبل آن طبقه بدست مي آيد . 2ـ سپس درصدفراواني تراكمي هر كدام از گروه ها را محاسبه مي كنيم. درصدفراواني تراكمي به صورت زير  محاسبه مي شود:                                                                    فراواني تراكمي هر طبقه                                                          100×                                                 درصد فراواني تراكمي                                                                             تعداد كل 3ـ در مرحله ي بعد درصد فراواني تراكمي گروه اول را از درصد فراواني تراكمي گروه دوم           تفريق مي كنيم. 4ـ قدر مطلق بيشترين تفاوت (صرف نظر از علانت منفي يا مثبب آن )را مشخص مي كنيم. سپس مقدار حداكثر تفاوت مشاهده شده بين گروه ها را از فرمول زير مشخص مي كنيم.
  
DC=حداكثر تفاوت مشاهده شده بين گروهها =Cpn1 درصد فراواني نسبي تراكمي گروه اول Cpn2 = درصد فراواني نسبي تراكمي گروه دوم 5ـ مقدار حداكثر تفاوت مشاهده شده بين گروهها (DC) را با عددجدول K-S دو نمونه اي مقايسه مي كنيم. مقدار بحراني براي D در سطح معني داري 05/0 از فرمول  ودر سطح 01/0 از فرمول   بدست مي آيد . n1= حجم نمونه ي گروه اول n2=حجم نمونه ي گروه دوم Dt= مقدار بحراني جدول مقدار بحراني به ما مي گويد كه، تا مقدار بحراني را مي توان ناشي از تصادفي بودن دانست . اگر حداكثر تفاوت مشاهده شده بين گروه هاي مورد مطالعه (DC)،  كوچكتر از مقدار بحراني جدول (Dt) باشد، فرض صفر پذيرفته مي شود و نتيجه مي گيريم تفاوت بين گروهها وجود ندارد . ولي اگر حداكثر تفاوت مشاهده شده بين گروهها (DC) بيشتر از مقدار بحراني جدول (Dt) باشد، فرض صفر را رد مي كنيم و نتيجه مي گيريم تفاوت بين گرو هها وجود دارد .مثال ـ از 160 دانشجو دختر و پسر راجع به ميزان رضايت از رشته تحصيلي شان سوال شده است كه نتيجه ي آن در زير ارائه شده است .  گروه اول (دختران ) گروه دوم (پسران ) خيلي زياد 20 15زياد 25 20تاحدودي 10 25كم 15 10خيلي كم 10 0حال اين است كه آيا ميزان رضايت اين دوگروه از رشته تحصيلي شان يكسان است ؟ 


جدول 6ـ2 ـ جدول ميزان رضايت پسران و دختران از رشته تحصيلي خود CPn1                           cf            F1   دختران (درصدفراواني     (فراواني              فراوانيتراكمي)             تراكمي )           گروه دوم   CPn2                                cf               F2     پسراندرصدفراواني)   (فراواني            فراواني                                                                                                                             تراكمي)             تراكمي)            گرو ه دوم     CPn1-CPn2 DC           خيلي زيادزيادتاحدوديكم خيلي كم   25/0                       20                     20  56/0                        45                    2568/0                       55                     1087/0                      70                      151                               80                    10         18/0                     15                        1543/0                     35                        2075/0                    60                         2587/0                    70                         10  1                          80                         10 07/013/007/0-00/000/0
13/0                                                        80                                                         80                
مقدار بحراني D به ازاي a=0.05  عبارت است از :  اين عدد به ما مي گويد تا اختلاف 21/0 ناشي از تصادف و شناس است . چون     است، با اين شواهد و مدارك دليلي بر درست بودن فرضيه ي تحقيق (تفاوت به ميزان رضايت پسران و دختران نسبت به رشته تحصيلي) نداريم، بنابراين فرض صفر را     نمي توانيم رد كنيم . پس نتيجه مي گيريم، بين ميزان رضايت از رشته تحصيلي در بين پسران و دختران تفاوتي وجود ندارد . حال فرضيه ي يك دامنه (ميزان رضايت ازرشته تحصيلي در پسران بيشتر از دختران است ) را با احتمال05/0 a=  آزمون مي كنيم .                                               چون فرضيه ي يك دامنه را مي خواهيم آزمون كنيم و جدول شماره ي سه در مورد فرضيه هاي دو دامنه به كار مي رود ، بنابراين بايد احتمال 10/0 را مورد استفاده قرار دهيم، زيرا احتمال يك آزمون يك دامنه ، دو برابر احتمال يك آزمون دو دامنه است . از آنجا كه مقدار جدول (60/4) بزرگتر از مقدار x2 محاسبه شده (70/2)است، فرضيه ي جهت دار، كه طبق آن پسرها رضايت بيشتري از رشته تحصيلي شان نسبت به دخترها دارند، رد مي شود . روش اجراي آزمون دو نمونه اي كلموگوروف ـ اسميرنوف :1ـ منو analyze و سپس فرمان nonparametric را كليك مي كنيم . 2ـ فرمان 2- independent samples  را كليك مي كنيم تا پنجره آن باز شود . 3ـ در اين پنجره متغير وابسته را به بخش test variable list : منتقل كرده و سپس در قسمت  test type گزينه ي kolmogorov -smirnov z  را كليك مي كنيم. 4ـ متغير مستقل را به بخش  grouping variableمنتقل كرده و سپس روي گزينه ي         define groups كليك مي كنيم. 5ـ دراين پنجره ، كدهاي مربوط به هركدام از گروه ها را وارد مي كنيم. 6ـ روي گزينه ي continue و سپس ok كليك مي كنيم. نحوه ي تفسير خروجي : به قسمت Asymp.sig(2-tailed)  نگاه كنيد اگر مقدار آن از 05/0 كمتر بود با 95 درصد اطمينان تفاوت بين گروهها را نتيجه بگيريد ولي اگر مقدار عددي آن از 05/0 بيشتر بود با 95 درصد اطمينان برابري گروهها را نتيجه بگيريد . 6ـ4ـ آزمون نرمال بودن متغيرهاي فاصله اي و نسبي : آزمون نرمال بودن متغيرهاي فاصله اي و نسبي آزمون تي استيودنت و آزمون اشتباه استاندارد ميانگين است .(آزمون تي استيودنت در قسمت آمار استنباطي مناسب براي يك متغير اسمي و يك متغير فاصله اي توضيح داده         خواهد شد .) 6ـ4ـ 1 ـ آزمون اشتباه استاندارد ميانگين  يا خطاي معيار ميانگين :  براي اينكه ببينيم آيا ميانگين برآورد شده ي نمونه ي ما، با ميانگين جامعه اي كه نمونه را از آن انتخاب        كرده ايم، تفاوت دارد يا خير، از آزمون اشتباه استاندارد ميانگين استفاده  مي كنيم . ما نمي توانيم اشتباه استاندارد ميانگين جامعه را بدست آوريم ، بنابراين سعي مي كنيم با مقداري خطا آن را از طريق اشتباه استاندارد ميانگين نمونه برآورد كنيم . هرچه حجم نمونه ي ما بيشتر باشد ، اشتباه استاندارد ميانگين كوچكتر مي شود و ميانگين نمونه ي آماري باميانگين جامعه ي آماري با اطمينان بيشتري مطابقت خواهد كرد .ميانگين نمونه را با    و ميانگين جامعه را با μ و اشتباه استاندارد ميانگين در نمونه را با s    ودر جامعه را با    σنمايش مي دهند . روش محاسبه ي اشتباه استاندارد ميانگين بستگي به حجم نمونه و جامعه آماري دارد . اين روش ها عبارتند از : الف ـ روش محاسبه اشتباه استاندارد ميانگين هنگامي كه نسبت حجم نمونه به حجم جامعه كمتر از پنج درصد  باشد عبارت است از :                                                            ( اشتباه استاندارد ميانگين در نمونه ) n = حجم نمونه                   s = انحراف معيار نمونه 
                                        = σ    ( اشتباه استاندارد ميانگين در جامعه )                                                  =(ميانگين جامعه آماري )      = ميانگين نمونه آماري d   = فاصله اطمينان       فاصله اطمينان در نمونه    فاصله اطمينان در جامعه ب ـ روش محاسبه اشتباه استاندارد ميانگين هنگامي كه نسبت حجم نمونه به جامعه پنج درصد يا بيشتر باشد : N                                                        = حجم جامعه آماري                                                                                                                                                                                                                          روش هاي محاسبه ي اشتباه استاندارد ميانگين در جدول 6ـ3 ارايه شده است . جدول 6ـ3 جدول محاسبه ي اشتباه استاندارد ميانگين در نمونه و جامعه هنگامي كه  هنگامي كه  
  
   
مثال ـ از يك دانشگاه تعداد 81 دانشجو بصورت تصادفي انتخاب شد كه ميانگين قد آنها 170 سانتيمتر و انحراف استاندارد قد آنها 18 سانتيمتر بود . حال مي خواهيم ببينيم قد اين 81 نفر در چه فاصله اي از ميانگين قد كليه دانشجويان اين دانشگاه قرار دارد .  
با 26/68  در صد اطمينان ميانگين جامعه بين  172< μ< 168قرار دارد يعني (2)(1)  ±170 با 95 در صداطمينان ميانگين جام بين 92/173< μ < 08/166  قراردارد يعني (2)(96/1) ±170با 5/95  در صد اطمينان ميانگين جامعه بين  174< μ < 166قرار دارد يعني (2)(2)± 170با99  در صداطمينان ميانگين جامعه بين 16/175< μ < 84/164قرار دارد يعني (2)(58/2)± 170با73/99  در صد اطمينان ميانگين جامعه بين  176< μ < 164قرار دارد يعني (2)(3)± 170با9/99 در صداطمينان ميانگين جامعه بين 58/176< μ <42/163 قرار دارديعني (2)(29/3)±170يعني با يك دهم درصد اطمينان، ميانگين جامعه در فاصله ي بيشتر يا كمتر از 58/6                 (58/6±= 2× 29/3) از ميانگين نمونه ي( 170)ما خواهد بود . روش اجراي آزمون اشتباه استاندارد ميانگين : 1ـ بر روي منو analyze  وسپس فرمان descriptive statistics  كليك مي كنيم . 2ـ بر روي فرمان frequencies كليك كنيد تا پنجره آن باز شود . در اين پنجره متغير مورد نظر را به بخش variable(s)  منتقل مي كنيم. 3ـ گزينه ي statistics را كليك مي كنيم تا پنجره ي آن باز شود . 4ـ گزينه ي S.E.mean در قسمت dispersion را كليك مي كنيم. 5ـ گزينه ي continue و سپس  ok را كليك مي كنيم. 

7ـ1 تحليل يك متغيري  : اگر بخواهيم ويژگي هاي يك متغير مثل سن يا تحصيلات را توصيف كنيم از تحليل يك متغيري استفاده مي كنيم . كارهايي را كه مي توان در تحليل يك متغيري انجام داد در زير ارائه شده است . متغير فاصله اي و نسبي متغير ترتيبي متغير اسمي جدول توزيع فراواني جدول توزيع فراواني جدول  توزيع فراواني روش تحليل 1ـ انحراف معيار 2ـ واريانس 3ـ انحراف متوسط 4ـ كشيدگي 4ـ كجي 6ـ چارك 7- دامنه تغييرات           8- نمره هاي استاندارد
 ميانگين 1ـ دامنه دهكي يا دهدهي 

 ميانه 1ـ ضريب تغييرات 2ـ شاخص تغيير پذيري كيفي (I.Q.V)  

1ـ نما 

1ـ هيستوگرام 2ـ فراواني تراكمي3ـ چندضلعي4ـ شاخه وبرگ 5ـ جعبه اي 1ـ ميله اي 2ـ دايره اي 1- 1- ميله اي2- 2- دايره اي

7ـ2 ـ روش تحليل مناسب براي يك متغيراسمي : روش تحليل مناسب براي يك متغير اسمي،جدول توزيع فراواني است . 7ـ2ـ1 ـ جدول توزيع فراواني   : جدولي است كه براي خلاصه كردن ، سازمان دادن و كاهش داده هاي يك متغير بكار برده مي شود . از طريق جدول توزيع فراواني مي توانيم تشخيص دهيم كه پاسخ هاي جمعيت نمونه چگونه ميان مقولات هر متغير توزيع شده است . همچنين از جدول توزيع فراواني براي يافتن اشتباهات در داده هاي اطلاعاتي استفاده  مي شود. مثلاً، اگر كد غلطي را وارد كرده باشيم، با مطالعه ي جدول توزيع فراواني به راحتي مي توان به وجود اين كد غلط پي برد و قبل از تحليل داده ها اين كد غلط را اصلاح نمود .جدول توزيع فراواني گرچه مي تواند يك متغيري، دو متغيري يا چند متغيري  باشد و براي هر نوع متغيري ( اسمي ، ترتيبي ، فاصله اي و نسبي )  بكار برده شود، ولي اگر تعداد مقولات پاسخ ها زياد باشد ، اين جدول كارايي كمي خواهد داشت . 7ـ2ـ1ـ1ـ جدول توزيع فراواني براي متغيرهاي اسمي و ترتيبي : هنگاهي كه متغير مورد بررسي اسمي يا ترتيبي است ،  جدول توزيع فراواني از چهار ستون تشكيل مي شود كه عبارتند از : الف ـ ستون اول شامل متغير و مقوله هاي آن ب ـ ستون دوم شامل فراواني هر مقوله ج ـ ستون سوم شامل  نسبت هر مقوله د ـ ستون چهارم شامل درصد هر مقوله مثال ـ فرض كنيد در  يك تحقيق جنسيت بعنوان يك متغير ( سوال ) مورد مطالعه قرار گرفته است . در اين تحقيق تعداد نمونه ها شامل چهل زن و شصت مرد بوده اند .جدول توزيع فراواني اين متغير در جدول زير ارائه شده است .


                                  جدول 7ـ1 جدول توزيع پاسخگويان بر حسب جنسيت            جنسيت   فراواني) (fi نسبت)    (pi درصد (p%)                   زن              40               4/0                  40                 مرد            60               6/0                  60                    جمع           100                1                 100                                                                               هنگام نوشتن جدول توزيع فراواني بايد نكات زير را رعايت كرد: 1ـ شماره ي جدول ذكر شود .2 ـ عنوان جدول ذكر شود .3 ـ عنوان ستونهاي جدول ذكر شود.4 ـ در صورتي كه داده ها از جايي اخذ شده است،  مأخذ داده ها حتماً ذكر شود .5 ـ مقوله هاي هر متغير به طور كامل شرح داده شود .6 ـ تعداد كل ذكر شود .همچنين هنگام بررسي جدول توزيع فرواني بايد به نكات زيرتوجه نمود :1ـ مواردي كه هنگام نوشتن جدول توزيع فراواني بايد رعايت گردد، تماماً رعايت شده باشد .2ـ به شكل توزيع نگاه كنيد ،ببينيد  آيا توزيع چولگي دارد يا خير و اگر توزيع داراي چولگي است ، چولگي آن منفي است يا مثبت . اگر اكثر پاسخگويان در قسمت بالاي جدول متمركز باشند، توزيع داراي چولگي منفي است، ولي اگر اكثر پاسخگويان در پايين جدول جمع شده باشند، توزيع داراي چولگي مثبت است . 3ـ نگاه كنيد ، ببينيد پاسخ ها در يك مقوله تمركز دارند يا در چند مقوله و آن مقوله يا               مقوله هاكدامند .7 ـ 2 ـ 1 ـ 2 ـ جدول توزيع فراواني براي متغير هاي فاصله اي و نسبي : جدول توزيع فراواني براي متغير ها فاصله اي و نسبي شامل جدول توزيع فراواني طبقه بندي نشده و جدول توزيع فراواني طبق بندي شده مي باشد .7 ـ 2 ـ 1 ـ 2 ـ 1 ـ جدول توزيع فراواني ساده يا طبقه بندي نشده : هنگامي بايد از جدول توزيع فراواني ساده استفاده كرد كه داده ها داراي دو شرط زير باشند : الف ـ تعداد اعداد ( داده ها ) متغير مورد بررسي كم باشد .ب ـ تفاضل بين بزرگترين و كوچكترين عدد كمتر از 20 باشد .

مراحل ترسيم جدول توزيع فراواني ساده : 1 ـ تهيه ي جدول : ابتدا جدولي با چند ستون شامل ستون متغير ، ستون خط نشان ،  ستون فراواني مطلق ، ستون فراواني نسبي ، ستون درصد فراواني نسبي ، ستون فراواني تراكمي و ستون درصد فراواني تراكمي رسم مي كنيم .در ستون متغير ، نام متغير و در خانه هاي آن به ترتيب از بالا رو به پايين اعداد متغير را بصورت صعودي يا نزولي مي نويسيم. 2 – ستون خط نشان   : در زير ستون خط نشان و در مقابل هر عدد به اندازه ي تعداد دفعاتي كه اعداد طبقه ( يا هر عدد ) تكرار شده، خط نشان مي كنيم.ستون خط نشان اختياري است و مي  توان آن را  در جدول توزيع فراواني ارائه نكرد.3 ـ ستون فراواني مطلق : فراواني مطلق تعداد مشاهدات هر متغير را نشان مي دهد و آنرا با F ( مخفف frequency) نشان مي دهند .در اين ستون به تعداد خط نشان هاي هر طبقه در مقابل همان طبقه عدد قرارمي دهيم. حاصل جمع اين ستون برابربا تعداد كل نمره هاست .    .4ـ ستون فراواني نسبي : فراواني نسبي ، نسبت فراواني مطلق هر طبقه به كل فراواني هاست، كه با f نشان داده مي شود . 5ـ ستون درصد فراواني نسبي : براي بدست آوردن درصد فراواني نسبي ، فراواني نسبي هر طبقه را بر كل فراواني ها تقسيم مي كنيم ، سپس نتيجه ي بدست آمده را در عدد 100 ضرب         مي نماييم . 6ـ ستون فراواني تراكمي : فراواني تراكمي هر طبقه عبارت است از: مجموع فراواني هاي آن طبقه با تمام طبقات قبل از آن . 7ـ ستون درصد فراواني تراكمي : براي بدست آوردن درصد فراواني تراكمي ، فراواني تراكمي هر طبقه را، بر كل فراواني ها تقسيم مي كنيم، سپس نتيجه ي بدست آمده را در عدد 100 ضرب مي نماييم . 

از درصد فراواني تراكمي مي توان براي مقايسه ي توزيع فراواني تراكمي با حجم هاي نامساوي استفاده كرد . مثال ـ نمرات آمار 25 دانشجو در زير ارائه شده است . ،9 ، 17، 15، 13،16، 12 ، 15 ، 20 ، 12 ، 19 ، 20 ، 12 ، 16  ، 14 ، 8 ، 11 ، 16 ، 12 ، 10 ، 18 ، 15                                                                                                                            13، 13 ، 17 ، 15 جدول  توزيع فراواني اين نمرات در جدول 7ـ2 ارائه شده است . 

جدول7ـ2 جدول توزيع نمرات درس آمار دانشجوياننمرات آمار خط نشان فراواني مطلق (F) فراواني نسبي  P درصد فراواني نسبي  Pدرصد فراواني تراكمي  (fci)   درصد فراواني تراكمي Pدرصد8 1 04/0 4% 1 4%
9 1 04/0 4% 2 8%
10 1 04/0 4% 3 12%
11 1 04/0 4% 4 16%
12 4 16/0 16% 8 32%
13 3 12/0 12% 11 44%
14 1 04/0 4% 12 48%
15 4 16/0 16% 16 64%
16 3 12/0 12% 19 76%
17 2 08/0 8% 21 84%
18 1 04/0 4% 22 88%
19 1 04/0 4% 23 92%
20 2 08/0 8% 25 100%
7ـ2ـ1ـ2ـ2 ـ جدول توزيع فراواني طبقه بندي شده : هنگامي كه تعداد داده ها زياد باشد و تفاضل بين بزرگترين و كوچكترين عدد بيشتر از 20 واحد باشد، بايد از جدول توزيع فراواني طبقه بندي شده استفاده كنيم . 

مراحل ترسيم جدول توزيع فراواني طبقه بندي شده : 1ـ تهيه جدول : ابتدا جدولي با چند ستون با عنوان هاي ستون طبقات ، ستون خط نشان ، ستون حدود واقعي طبقات ، ستون نقطه مياني طبقات ، ستون فراواني مطلق ، ستون فراواني نسبي ، ستون درصد  فراواني نسبي  ، ستون فراواني تراكمي و ستون در صد فراواني تراكمي رسم مي كنيم.2 – مرتب كردن اعداد : اعداد را از بزرگ به كوچك ( يا از كوچك به بزرگ ) مرتب        مي كنيم.3 ـ محاسبه ي دامنه ي تغييرات : دامنه ي تغييرات عبارت است از: تفاضل بين بزرگترين و كوچكترين اعداد به اضافه ي يك. 4 ـ تعيين تعداد طبقات : براي تعيين طبقات كه با C( مخفف   class)  نمايش داده مي شود، چند پيشنهاد وجود دارد كه عبارتند از : الف ـ استفاده از قاعده ي استورجس  n = تعداد مشاهدات ب ـ پيشنهاد دوم عبارت است از :  ج ـ پيشنهاد سوم اين است كه تعداد طبقات را بين پنج تا بيست طبقه يا ده تا بيست طبقه در نظر بگيريم . اگر تعداد طبقات كمتر از 5 طبقه در نظر گرفته شود ، طبقات خيلي بزرگ مي شوند و اين باعث كاسته شدن از دقت محاسبات و از بين رفتن بخش زيادي از اطلاعات مي شود و در صورتي كه تعداد طبقات بيشتر از 20 طبقه در نظر گرفته شود، اولاً وقت گير است و ثانياً انجام محاسبات        دشوار مي شود .اگر چه در بالا سه پيشنهاد براي تعيين تعداد طبقات گفته شد، ولي آنچه مسلم است اين است كه تعيين تعداد طبقات به سه عامل زير بستگي دارد : الف ـ تعداد داده ها                                  ب ـ نظر پژوهشگر                        ج ـ ماهيت اندازه گيري 5 ـ تعيين فاصله ي طبقات   : براي تعيين فاصله ي طبقات بايد دامنه ي تغييرات را بر تعداد طبقات تقسيم كنيم ، سپس نزديكترين اعداد نزديك به خارج قسمت را به عنوان فاصله ي طبقات مناسب بر مي گزينيم. I      فاصله ي طبقات                                                                                                     R     دامنه ي تغييرات                                                                                             C      تعداد طبقات 6ـ نوشتن طبقات : كوچكترين اعدادي كه در طبقات مختلف قرار دارند، حد پايين طبقات و بزرگترين اعدادي كه به طبقات مختلف تعلق دارند، حد بالاي طبقات گفته مي شود . اگر نصف اختلاف بين حد بالاي يك طبقه ي و حد پايين طبقه بعدي ( معمولا 5/ . واحد )   را از حد پايين هر طبقه كم و به حد بالاي همان طبقه اضافه كنيم ، حد واقعي هر طبقه يا كراندي طبقه بدست مي آيد. براي نوشتن طبقات ابتدا كوچكترين عدد ( يعني حد پايين اولين طبقه ) را نوشته و بعد فاصله ي طبقاتي را به حد پايين طبقه اول اضافه مي كنيم تا طبقه ي اول شكل بگيرد. سپس فاصله ي طبقاتي را به حد پايين و حد بالاي طبقه ي اول اضافه مي كنيم تا طبقه ي دوم شكل بگيرد. اين كار را تا آخرين طبقه يعني طبقه اي كه بزرگترين عدد در آن قرار بگيرد ادامه  مي دهيم .در اينجا بايد به يك نكته توجه كرد و آن اين است كه، هنگام نوشتن طبقات ، طبقات بايد ناسازگار باشند، يعني هر عدد فقط در يك طبقه قرار داده شود . 7ـ نقطه ي مياني (حدمياني ) : نقطه ي مياني هرطبقه عبارت است از: نصف مجموع حد بالا و پايين هر طبقه . نقطه ي مياني را با علامت MP نشان مي دهند . 8 ـ ستون هاي خط نشان ، فراواني مطلق ، فراواني نسبي ، درصد فراواني نسبي ، فراواني تراكمي و درصد فراواني تراكمي را، مانند جدول توزيع فراواني ساده تكميل مي كنيم.


مثال ـ وزن 35 نفر از دانشجويان يك كلاس اندازه گيري شده كه نتايج آن به شرح زير است: 72                     71                   81                    68                  100                 61                   7465                     90                   84                    76                   74                  70                   8373                    75                    74                    61                    77                 90                   7682                    64                    70                   80                     78                 68                   9663                    84                    91                   73                     76                 71                  75حال جدول توزيع فراواني طبقه بندي شده وزن دانشجويان را رسم مي كنيم.                               جدول 7ـ3 . جدول توزيع فراواني طبقه بندي شده ي وزن دانشجويانطبقات خط نشان حدود واقعي طبقات نقطه ي مياني طبقات فراواني مطلق (F) فراواني نسبي (f) درصد فراواني نسبي P%)) فراواني تراكمي (Fci) درصد فراواني تراكمي (P%)64-61     ////       5/64-5/60 5/62 4 114/0 4/11% 4 42/11%

68-65     /// 5/68-5/64 5/66 3 085/0 5/8% 7 9/19%72-69     //// 5/72-5/68 5/70 5 142/0 2/14% 12 12/34%76-73     ////          ////         5/76-5/72 5/74 10 285/0 5/28% 22 62/62%80-77      /// 5/80-5/76 5/78 3 085/0 5/8% 25 12/71%84-81      //// 5/84-5/80 5/82 5 142/0 2/14% 30 32/85%88-85     5/88-5/84 5/86 0 000/0 000/0% 30 32/85%92-89     /// 5/92-5/88 5/90 3 085/0 5/8% 33 82/93

 

%96-93       / 5/96-5/92 5/94 1 028/0 8/2% 34 62/96%100-97       /   5/100-5/96 5/98 1 028/0 8/2% 35 100%جمع    35 35  7ـ3ـ آمار توصيفي مناسب در تحليل يك متغيري : آمار توصيفي در تحليل هاي يك متغيري شامل اندازه هاي گرايش مركزي و اندازه هاي پراكندگي مي باشد . 7ـ3ـ1ـ آمار توصيفي مناسب براي يك متغير اسمي : 7ـ3ـ1ـ1ـ اندازه هاي گرايش مركزي   : اندازه هاي گرايش مركزي يا معيارهاي مركز گرايي ، مركز توزيع داده ها را نشان مي دهند . تنها معيار مركز گرايي در متغيرهاي اسمي ، نما مي باشد . 7ـ3ـ1ــ1ـ1ـ  نما   : نما كلمه اي فرانسوي است كه به معناي معمول و رايج است . ولي نما در اصطلاح، عددي است كه در يك توزيع فراواني، بيشترين فراواني را داشته باشد وآن را با  MO       نمايش مي دهند . مثلاً، اعداد زير را در نظر بگيريد :4،1،3،2،1در اينجا نما عدد يك است، زيرا بيشترين فراواني را داراست . يك توزيع فراواني در رابطه با نما ممكن است حالات زير را داشته باشد :الف ـ فاقد نما : زماني كه فراواني همه ي نمره ها برابر باشد، توزيع فاقد نماست. مانند مثال زير  : 1،12، 15،10 ، 6ب ـ تك نمايي : زماني كه فراواني يكي از نمره ها، بيشتر از فراواني ساير نمرات باشد، توزيع تك نمايي است .مانند مثال زير : 25،11،23،14،11،15ج ـ دو نمايي   : زماني كه فراواني دو مورد از نمره ها، با هم برابر و از ساير نمره ها بيشتر باشد، توزيع دو نمايي است . در توزيع دو نمايي متقارن ، ميانگين و ميانه برابر است ، ولي نما در طرفين آنها واقع شده است . (مانند شكل 7ـ1 )
اعداد زير را در نظر بگيريد . 14،25،11،23،14،11در اينجا نما دو عدد 11و14 است . د- چندنمايي    : زماني كه فراواني حداقل سه مورد از نمره ها، با هم برابر و از ساير نمره ها بيشتر باشد، توزيع چند نمايي است . 19،30،18،24،12،19،18،14،12دراين مثال نما اعداد 12،18و19 است

. هنگامي كه داده ها گروه بندي شده باشند ، طبقه اي كه بيشترين فراواني را دارد ،طبقه حاوي نماست. بعد از تعيين طبقه ي حاوي نما ، مقدار نما از طريق فرمول زير بدست مي آيد : h   = فاصله يا عرض طبقات                                                                       =  حد پايين طبقه ي حاوي نما                                                        d1 = اختلاف فراواني طبقه ي حاوي نما از فراواني طبقه ي ماقبل d2 =اختلاف فراواني طبقه ي حاوي نما از فراواني طبقه ي

بعد . مثال : ميزان درآمد فراواني  100-0 35200-100 40300-200 70400-300 25500-400 30600-500 50
 

موقعي از نما استفاده مي كنيم  كه ، اولاً متغير مورد نظر در سطح سنجش اسمي باشد، زيرا به مرتب كردن نمرات بستگي دارد . اگر براي متغيرهاي ترتيبي ، فاصله اي يا نسبي از نما استفاده كنيم ، اطلاعات زياد و مفيدي را از دست مي دهيم . دوماً، هنگامي كه حالات موجود در يك متغير زياد باشد. نما در گروه هاي كوچك داراي اعتبار كمي است، زيرا تابع چند عدد است .  براي اينكه ببينيم آماره ي نما براي بيان توزيع فراواني مورد بررسي مناسب است يا نه ، نگاه مي كنيم ، ببينيم چند درصد پاسخگويان در مقوله ي نما قرار مي گيرند. هرچه اين درصد بيشتر باشد آماره ي نما براي بيان توزيع مورد بررسي مناسب تر است .استفاده از نما داراي مزايا و معايبي است كه عبارتند از : الف ـ مزايا : 1ـ اعداد خيلي بزرگ يا خيلي كوچك روي نما تأثيري ندارند.  2ـ تنها معيار مركز گرايي براي متغيرهاي اسمي است . 3ـ از ميان معيارهاي مركز گرايي ، كمترين مفروضات را داراست . 4ـ به سهولت محاسبه مي شود . 5ـ در نما احتياجي نيست كه، حتماً مقادير معناي خاصي داشته باشند . ب ـ معايب : 1ـ فقط يك جنبه ي توزيع را كه همان مقدار مربوط به بيشترين فراواني است، نمايان مي سازد . 2ـ اعمال رياضي را نمي توان با آن انجام داد . 3ـ در توزيع فراواني گروه بندي شده، نما اندازه ي خوبي براي مركز گرايي نيست، زيرا به گروه بندي داده ها بستگي دارد . 4ـ برآورد خيلي ضعيفي از پارامتر جامعه است . 5ـ هنگامي كه حالات موجود در يك متغير كم باشد، نما اعتبارزيادي ندارد،زيرا تابع چند عدد است. 6ـ حالت پايداري ندارد و مي توان هرگونه دخل و تصرفي در آن صورت داد . 7ـ در توزيع هايي كه دو يا چند نما دارند، كارايي نما خيلي پايين مي آيد . 8ـ استفاده ي محدودي از نظر محاسبات آماري دارد . روش اجراي نما : 1ـ ابتدا منو analyze و سپس فرمان descriptive  statistics  را كليك مي كنيم . 2ـ بر روي گزينه ي frequencies كليك مي كنيم و سپس متغير مورد بررسي را به بخش variables منتقل مي كنيم. 3ـ گزينه ي statistics را كليك كرده و سپس گزينه ي Mode را انتخاب مي كنيم. 4ـ گزينه ي continue و سپس گزينه ي ok را كليك مي كنيم. 7ـ3ـ1ـ2  اندازه هاي پراكندگي   : اندازه هاي پراكندگي يا شاخص هاي پراكندگي براي متغيرهاي اسمي عبارتند از : الف ـ ضريب تغييرات ب ـ شاخص تغيير پذيري كيفي (I.Q.V) 7ـ3ـ1ـ2ـ1ـ پراكندگي نسبي واريانس يا ضريب تغييرات   : ضريب تغييرا ت براي مقايسه ي پراكندگي دو متغير اسمي زماني كه ميانگين يكساني نداشته باشند، بكاربرده مي شود . ضريب تغييرات گاهي اوقات پراكندگي نسبي  ، واريانس هم گفته مي شود . فرمول محاسبه ي ضريب تغييرات عبارت است از :    v    ضريب تغييرات s    انحراف معيار        ميانگي

ن اگر ميانگين منفي بود از قدرمطلق ميانگين استفاده مي كنيم.اگر ميانگين و انحراف معيار برابر باشند، ضريب تغييرات برابر با 100 درصد مي شود . هرچه ضريب تغييرات متغيري بيشتر باشد ، نشانگر پراكندگي بيشتر بين اعداد است .راه ديگر محاسبه يضريب تغييرات ا

 

ين است اين است كه، درصد پاسخگوياني كه در مقوله ي نما قرار ندارند را محاسبه كرده و سپس رقم اعشار اين درصد را دو رقم به عقب برگردانيم تا ضريب تغييرات بدست آيد . جدول 7ـ4 را در نظر بگيريد.            جدول 7ـ4  جدول توزيع پاسخگويان بر حسب مذهبمذهب فراواني P درصدكاتوليك 40 20%پروتستان 110 55%ارتدوكس 50 25% در اين جدول 45 درصد افراد پاسخگو در مقوله ي نما قرار ندارند (45=25+20) چون كه در مقوله ي نما (55%MO =   )  55 درصد افراد قرار دارند. پس:                     45/0= Vمثال ـ فرض كنيد حقوق متوسط ماهانه در ايران 150000 تومان با انحراف معيار 25000 تومان و در كانادا 1000 دلار با انحراف معيار 200 دلار باشد . حال سؤال اين است كه تغيير پذيري در ايران بيشتر است يا در كانادا ؟                                       نتيجه نشان مي دهد كه پراكندگي نسبي حقوق سالانه در كشور كانادا، بيشتر از پراكندگي نسبي در كشور ايران است .7ـ3ـ1ـ2ـ2ـ شاخص تغيير پذيري كيفي    : شاخص تغيير پذيري كيفي يا .I   V. ميزان پراكندگي داده ها را،در يك متغير اسمي نشان مي دهد . بعبارت ديگر اين شاخص به مقايسه ميزان تغييرپذيري مشاهده شده يك متغير اسمي با حداكثر تغييري كه امكان وجود دارد ، مي پردازد . اين شاخص زماني استفاده مي شود كه : اولاً متغير مورد بررسي اسمي باشد ثانياً تعداد مقوله هاي آن نسبتاً كم باشد . فرمول محاسبه شاخص تغيير پذيري كيفي عبارت است از :  OV  :  تغيير پذيري مشاهده شده EV   : تغيير مورد انتظار تغيير پذيري مشاهده شده، اختلافاتي است كه در يك توزيع وجود دارد و براي بدست آوردن آن مشاهدات را در همه ي زوج هاي ممكن ضرب مي كنيم و سپس جمع مي زنيم . تغيير مورد انتظار هم، عبارت است از : نهايت درجه تغيير پذيري كه امكان آن هست كه در يك توزيع پيش بيايد. براي محاسبه ي تغيير مورد انتظار ميانگين داده هارا محاسبه مي كنيم و در جدول وارد مي كنيم . هنگامي كه شاخص تغيير پذيري كيفي صفرشود نشان دهنده ي همگني توزيع است و هنگامي كه مقدار آن برابر با يك باشد نشان دهنده ي پراكندگي كامل است . مثال ـ بمنظور بررسي رنگ چشم دانش آموزان يك مدرسه، تعداد 90 نفر از آنها بصورت تصادفي انتخاب شدند كه نتايج آن در زير ارائه شده است . حال مي خواهيم ميزان پراكندگي رنگ چشم اين دانش آموزان را بررسي كنيم .                         جدول 7ـ5 توزيع پاسخگويان برحسب رنگ چشم           رنگ چشم فراواني مشاهده شده  (OV) فراواني مورد انتظار (EV)مشكي 40 30آبي 20 30سبز 30 30جمع 90=n 90=n 2600=(30)20+(30+20)40=  OV2700=(30)30+(30+30)30=EV   .I =  V.7ـ3ـ2 ـ آمار توصيفي مناسب براي يك متغير ترتيبي : 7ـ3ـ2ـ1ـ اندازه هاي گرايش مركزي : معيار مركز گرايي براي يك متغير ترتيبي ميانه است . 7ـ3ـ2ـ1ـ1ـ ميانه  يا نيمساز : مقداري است كه، فراواني ها را به دو گروه مساوي تقسيم         مي كند، بطوري كه نيمي از حالات بالاتر از آن و نيمي پايين تر از آن قرار دارند . ميانه را با Md نمايش مي دهند . محاسبه ي ميانه به دو صورت امكان پذير است كه عبارتند از : الف ـ محاسب

ه ي ميانه براي داده هاي گروه بندي نشده ب ـ محاسبه ي ميانه براي داده ها ي گروه بندي شده محاسبه ميانه براي داده هاي گروه بندي نشده : وقتي تعداد داده ها كم باشد،از اين روش استفاده مي كنيم. در اين روش، ابتدا داده ها را از كوچك به بزرگ يا از بزرگ به كوچك مرتب مي كنيم (نوع مرتب كردن داده ها از كوچك به بزرگ يا از بزرگ به كوچك در مقدار ميانه تأثيري ندارد). سپس ، اگر تعداد داده ها فرد بود  ، عددي كه در وسط قرار مي گيرد ميانه است. مثلاً، اعدا

د زير را درنظر بگيريد . در اينجا عدد4 ميانه است.3،4،7،10،1ولي اگر تعداد داده ها زوج بود ، ميانگين دو عددي كه در وسط قرار مي گيرد ميانه است  .
مثال :                                                                          12، 3،4،7،10،1
محاسبه ي ميانه براي اعداد گروه بندي شده :  هنگامي كه تعداد داده ها زياد باشد، از روش گروه بندي شده استفاده مي كنيم. در اين روش داده ها را در طبقات مختلف قرار مي دهيم و سپس ميانه را از فرمول زير بدست مي آوريم :  l=حدپايين طبقه ي حاوي ميانه  =Fiجمع فراواني هاي قبل از طبقه ي حاوي ميانه  f= فراواني مطلق طبقه ي حاوي ميانه =Md ميانه i= فاصله ي طبقات براي پيدا كردن ميانه در طبقات ، از درصد فراواني تجمعي استفاده مي كنيم . هر طبقه اي كه داراي درصد تجمعي 50 يا بيشترباشد، آن طبقه حاوي ميانه است . مثال ـ درآمد ماهانه ي 200 نفر بصورت تصادفي گرفته شده است، كه در زير ارائه گرديده است . حال مقدار ميانه اعداد زير را محاسبه مي كنيم :                                     جدول 7ـ6 ـ جدول توزيع درآمد ماهانه ي پاسخگوياندرآمدماهانه خانواده به هزار تومان فراواني فراواني تجمعي درصد فراواني تجمعي 79-50 25 25 5/12109-80 30 55 5/27139-110 70 125 5/62
169-140 30 155 5/77199-170 35 190 95229-200 10 200 100ميانه در طبقه ي سوم قرار دارد .  ويژگي هاي ميانه :1ـ تنها معيار مركزگرايي براي متغيرهاي ترتيبي است .2ـ اعداد خيلي كوچك يا بزرگ روي آن تأثير ندارد . بعبارت ديگر تحت تأثير ارزش عددي نمره ها قرار ندارد . در توزيع هاي چوله (توزيع كه داراي مقادير پرت باشد ) مثل درآمد، بهترين روش استفاده از ميانه است . 3ـ فراواني ها را به دو گروه مساوي تقسيم مي كند . 4ـ اگر انحراف هريك از نمره ه

ا را از ميانه  بدون در نظر گرفتن علامت آنها محاسبه كنيم و جمع بزنيم جمع اين انحراف ها مساوي يا كوچكتر از مجموع قدرمطلق (در نظر گرفتن اعداد بدون توجه به علامت آنها ) انحراف هاي نمره ها از هر عدد ديگري است . اعداد 5،4،3،2،1 را در نظر بگيريد . در اين مثال ميانه عدد 3 است . در اينجا مجموع قدرمطلق انحراف نمره ها از ميانه، يعني عدد 6، كوچكتر از مجموع قدرمطلق انحرافهاي نمره ها از ساير اعداد توزيع است . 

معايب ميانه : 1ـ ميانه چيزي در مورد ميزان تفاوت مقدارها به ما نمي گويد .2ـ در محاسبه ي ميانه از عمليات رياضي كمي استفاده مي شود . 3ـ برآورد ضعيفي از پارامتر جامعه است . 4ـ هرچه دامنه ي تغيير نمره ها بيشتر باشد ، كارايي ميانه كمتر مي شود . روش اجراي ميانه : 1ـ ابتدا منو analyze  و سپس فرمان descriptive statistics را كليك مي كنيم. 2ـ فرمان Frequencies را كليك مي كنيم و متغير مورد نظر را به بخش variables منتقل        مي كنيم. 3ـ فرمان statistics را كليك و سپس گزينه ي median را انتخاب مي كنيم. 4ـ گزينه ي continue و سپس okرا كليك مي كنيم. 7ـ3ـ2ـ2ـ اندازه هاي پراكندگي : تنها شاخص پراكندگي براي يك متغير ترتيبي، دامنه  دهدهي يا دهكي است . 7ـ3ـ2ـ2ـ1ـ دامنه دهدهي  يا دهكي : دامنه ي دهدهي يا دهكي شاخص است كه، ميزان پراكندگي متغيرهاي ترتيبي را نشان ميدهد . ممكن است در يك توزيع، اعدادي وجود داشته باشد كه خيلي بزرگ يا خيلي كوچك باشندبه طوري كه با بقيه ي اعداد تفاوت زيادي داشنه باشند . در چنين مواقعي كه دامنه ي تغييرمتغيرهاي يك توزيع زياداست ، از كارايي ميانه كاسته مي شود . در چنين مواقعي بهتر است كه از دامنه دهكي استفاده كنيم. پس كار دامنه ي دهكي از بين بردن تأثير اعداد پرت در توزيع است . بنابراين، براي اينكه تأثير اين اعداد را در توزيع فراواني ازبين ببريم، 10 درصد ازاعداد پايين و 10 درصد از اعداد بالاي توزيع را حذف كرده و 80 درصد مياني توزيع را مورد بررسي قرار مي دهيم . 7ـ3ـ3 آمار توصيفي مناسب براي يك متغير فاصله اي يا نسبي : 7ـ3ـ3ـ1ـ اندازه هاي گرايش مركزي : تنها معيار مركز گرايي براي يك متغير فاصله اي يا نسبي، ميانگين است . ميانگين انواع گوناگوني دارد كه مهمترين آن عبارتند از : 1ـ ميانگين حسابي 2ـ ميانگين وزني 3ـ ميانگين هندسي 4ـ ميانگين مركب 5ـ ميانگين هارمونيك 7ـ3ـ3ـ1ـ1ـ ميانگين حسابي   : ميانگين حسابي، از تقسيم حاصل جمع نمرات بر تعداد آزمودني ها بدست مي آيد و فرمول محاسبه ي آن عبارت است از :  = ميانگين حسابي n= تعداد آزمودني ها يا تعداد مشاهدات X = مقادير = حرف يوناني سيگما كه معني آن جمع كردن است .  = مجموع يك يك مقدارها علامت ميانگين حسابي در نمونه ي آماري M

يا     (ايكس بار ) ودرجامعه ي آماري μ  (مو) است. ولي نحوه ي محاسبه ي ميانگين براي نمونه و جامعه يكسان است . ميانگين حسابي هنگامي مورد استفاده قرار مي گيرد كه اهميت داده هابرابر باشد.  مثال ـ نمرات درسي يك دانشجو در زير ارائه شده است :                                                                                              14،13،5/16، 11،19،15،16

،17،10 ميانگين نمرات اين دانشجو عبارت است از :  7ـ3ـ3ـ1ـ2ـ ميانگين وزني  : ميانگين وزني زماني مورد استفاده قرار مي گيرد كه، اعداد داراي درجه ي اهميت متفاوتي باشند . فرمول محاسبه ي ميانگين وزني عبارت است از :      = ميانگين وزنيW=درجه ي اهميت مقادير x= فراوني مقادير =مجموع درجات اهميت مقادير مثلاً يك دانشجو در امتحانات كنكور سراسري در درس معارف اسلامي نمره 85 ، زبان و ادبيات فارسي 90 ، زبان عربي نمره 40 و زبان انگليسي نمره 50 گرفته است . دراينجا اگر از ميانگين حسابي استفاده كنيم ميانگين نمرات 53 مي شود ولي از آنجايي كه معارف اسلامي داراي درجه اهميت 3 ، ادبيات فارسي 4 ، عربي 2 وزبان انگليسي 2 است ، اين ميانگين نمي تواند اهميت بيشتري را كه براي ادبيات فارسي و اهميت كمتري كه براي زبان عربي و زبان انگليسي است را منعكس كند بنابراين بايد در اينجا از ميانگين وزني استفاده كنيم ، ميانگين وزني نمرات اين دانشجو عبارت است از: 
                 جدول 7ـ7 جدول توزيع نمرات دانشجويان همراه با ضرايب x w  
85904050 3422 25536080100  795 
  7-3-3-1-3 – ميانگين هندسي : ميانگين هندسي n عدد برابر با ريشه ي n ام حاصلضرب آن ها كه     با      ا  نمايش داده مي شود. فرمول ميانگين هندسي عبارت است از:                                                                                                                                                                                                                                                                                                                                                                                     مثال:اعداد زير را در نظر بگيريد:                                             5،5،5،4،4،3،3،2،1،1ميانگين هندسي اين اعداد عبارت اند از:                            3600 = 5*5*5*4*4*3*3*2*1*17-3-3-1-4- ميانگين مرتب يا ميانگين ميانگين ها:ميانگين مركب را با  نمايش            مي دهند.ميانگين مركب به دو صورت محاسبه مي شود كه عبارت اند از:الف- هنگامي كه حجم گروه ها مساوي است.در اين صورت ميانگين مركب از فرمول زير محاسبه مي شود:=  ميانگين مركب                                             = ميانگين نمونه ها       N= ميانگين نمونه ها مثال:چهار گروه د

اريم كه ميانگين هر كدام از گروه هادر جدول 7-8 ارائه شده است. ميانگين گروه A مساوي با 15، ميانگين گروه  Bمساوي با35 ، ميانگين گروه  cمساوي با 40 وميانگين گروه  Cمساوي با 10 است.                                          n       گروه ها200200200200 15354010 گروه A        گروه Bگروه Cگروه D  

 

ب – هنگامي كه حجم گروهها نامساوي است . دراين شرايط ميانگين مركب از فرمول زير محاسبه مي شود :   = ميانگين هر گروه NT= مجموع تعداد كل گروهها nj= فراواني هرگروه


جدول 7ـ9 جدول توزيع گروهها همراه با ميانگين وحجم گروههاگروهها  Nj           
گروه Aگروه Bگروه Cگروه D 15354010 100150200250 1500525080002500

NT=100+150+200+250=700
 

7ـ3ـ3ـ1ـ5ـ مينگين همساز يا هارمونيك    : ميانگين هارمونيك را با   نمايش مي دهند و فرمول محاسبه ي آن عبارت است از :  n= تعداد نمره ها x= نمره ها مثال ـ ميانگين هارمونيك اعداد زير را محاسبه مي كنيم :                        5 ،1،2،3،4نكته : صفر نمي تواند جزو اعداد باشد . خواص ميانگين : 1ـ اگر همه ي مقادير يك متغير را در يك عدد ثابت (مثلاً عدد2) ضرب كنيم ، ميانگين هم در عدد ثابت ضرب مي شود .( يعني ميانگين هم دو برابر مي شود.)  اعداد روبه رو را در نظر بگيريد:  5 ،1،2،3،4ميانگين اين اعداد برابر 3 است. حال اگر اين اعداد را در عدد 2 ضرب كنيم، نتيجه عبارت است از:  10،8،6،4،2در اين صورت ميانگين اعداد جديد برابر با 6 خواهد بود:                                                                                         2- اگر همه ي مقادير يك متغير را در يك مقدار ثابت( مثلاً )2 تقسيم كنيم، ميانگين هم بر آن عدد ثابت( يعني عدد )2 تقسيم مي شود. مثلاً اعداد روبرو را در نظر بگيريد:1،2،3،4،5 ميانگين اين اعداد عدد 3 است. حال اگر اين اعداد را برعدد 2 تقسيم كنيم، نتيجه عبارت خواهد بود از: 5/2،2،5/1،1،5/0 در اين صورت ميانگين اعداد جديد 5/1 خواهد شد .  3ـ اگر همه ي مقادير يك متغير را از يك عدد ثابت (مثلاً عدد)2 كسر كنيم ،ميانگين هم به همان مقدار كم مي شود .4ـ اگر به همه ي مقادير يك متغير ، يك عدد ثابت مثلاً عدد2 اضافه كنيم ،ميانگين اعداد جديد هم به همان اندازه  (يعني 2 واحد) اضافه مي شود . 5ـ مجموع انحراف مقادير از ميانگين برابر صفر است. مثلاً، اعداد روبه رو را در نظر بگيريد: 1،2،3،4،5                                                                                                                                                   در اينجا اگر همه ي اعداد را از ميانگين يعني عدد 3 كم كنيم ، نتيجه برابر با صفر مي شود . در اينجا مجموع ا

نحراف هاي منفي (3-) دقيقا برابر مجموع انحراف هاي مثبت (3+) است . نمرات انحراف از ميانگين12345 2-=3-11-=3-20=3-31=3-42=3-5                                      6ـ خاصيت حداقل مربعات يكي ديگر از خواص ميانگين است . 7ـ ميانگين فقط براي متغيرهاي فاصله اي و نسبي به كار برده مي شود . 8ـ در ميانگين همه ي اطلاعات منظور مي شود . بنابراين ميانگين نسبت به همه ي اعداد موجود در توزيع فراو

اني حساس است و مقادير خيلي كوچك و خيلي بزرگ روي آن تأثير مي گذارد . بنابراين در توزيع هاي چوله ميانگين كارايي زيادي ندارد . مشكلات ميانگين : 1ـ ممكن است چندين توزيع كاملاً متفاوت وجود داشته باشد ، ولي ميانگين آنها يكسان باشد . 2ـ حركت ميانگين در جهت چولگي سريع تر از ساير شاخص هاي گرايش مركزي (نما و ميانه ) است . وقتي در ميان داده ها اعداد خيلي بزرگ يا كوچك (مقادير پرت) وجود داشته باشد ، ميانگين تحت تأثير اين مقادير قرار مي گيرد . بنابراين حذف در چنين مواقعي شاخص خوبي براي تجمع اطلاعات نيست . در چنين مواقعي بهتر است از ميانه استفاده كرد . مقايسه ي نما ، ميانه و ميانگين : 1ـ نما براي متغيرهاي اسمي ، ميانه براي متغيرهاي ترتيبي و ميانگين براي متغيرهاي فاصله اي ونسبي بكار برده مي شود . 2ـ مجموع انحراف نمره ها از ميانگين، هميشه برابر با صفر است. ولي مجموع انحراف نمره ها از ميانه يا نما هميشه برابر با صفر نيست . 3ـ ثبات ميانگين بيشتر از ميانه و نما است . 4ـ با ميانگين عمليات رياضي بيشتري مي توان انجام داد . 5ـ در توزيع هاي چوله بهترين اندازه گرايش مركزي ، ميانه است ولي در توزيع هاي نرمال بهترين اندازه گرايش مركزي ، ميانگين است. 6- در توزيع هاي نرمال هر سه شاخص برهم منطبق اند، ولي در توزيع هاي چوله نما در قله قرار مي گيرد و ميانگين و ميانه در جهت چولگي حركت مي كنند .   روش اجراي ميانگين : 1ـ ابتدا منو analyze و سپس فرمان descriptive statistics  را كليك مي كنيم . 2ـ فرمان frequencies  را كليك كرده و سپس متغير مورد بررسي را به بخش variables منتقل مي كنيم. 3ـ گزينه ي statistics را كليك كرده و سپس گزينه ي mean را انتخاب مي كنيم. 4ـ گزينه ي continue و سپس ok را كليك مي كنيم. 7ـ3ـ3ـ2ـ اندازه هاي پراكندگي: شاخص هاي پراكندگي براي متغيرهاي فاصله اي و نسبي عبارتند از :1ـانحراف متوسط    2ـ واريانس     3ـ انحراف معيار  4ـ نمره هاي استاندارد   5ـ كشيدگي6ـ كجي يا چوگي           7ـ دامنه ي تغييرات       8ـ گشتاورها 7ـ3ـ3ـ2ـ1ـ انحراف متوسط   : ميانگين قدرمطلق  انحرافات مقادير از ميانگين را انحراف متوسط مي گويند و آن را با AD نشان مي دهند . مزيت انحراف متوسط اين است كه انحراف تمامي نمرات و مشاهدات در محاسبه ي آن دخالت دارند . ولي عيب اين شاخص اين است كه، در انحراف متوسط به علت استفاده از قدرمطلق اعداد ، نمي توان عمليات جبري انجام داد . هرچه مقدار انحراف متوسط بزرگتر باشد ، نشانگر پراكندگي بيشتر بين داده هاست و

هرچه مقدار آن كوچكتر باشد نشانگر پراكندگي كمتر بين داده هاست . 


روش محاسبه ي انحراف متوسط : روش هاي محاسبه ي انحراف متوسط عبارتند از : الف ـ محاسبه انحراف متوسط براي داده هاي بدون فراواني و گروه بندي نشده : فرمول محاسبه انحراف متوسط هنگامي كه داده ها گروه بندي نشده اند و فاقد فراواني هستند          عبارت است از : 
   
202122232425 5/2-=5/22-205/1-=5/22-215/0-=5/22-225/0=5/22-235/1=5/22-245/2=5/22-25 5/25/15/05/05/15/2               
 AD= انحراف متوسط     = ميانگين نمرات  n= تعداد نمرات  = علامت قدرمطلق  تفسير : بطور متوسط نمره ها در اطراف ميانگين معادل 5/ 1 نمره پراكندگي دارند.ب ـ محاسبه ي انحراف متوسط براي داده هاي داراي فراواني و گروه بندي نشده :

جدول 7ـ11 جدول توزيع پاسخگويان برحسب سن همراه با فراواني آنهاxi Fi xiFi   
202122232425 81141098 16023188230216200 5/2-=5/22-205/1-=5/22-215/0-=5/22-225/0=5/22-235/1=5/22-245/2=5/22-25 205/16255/1320 
                                                                                         

  
ج ـ محاسبه ي انحراف متوسط براي داده ها ي داراي فراواني و گروه بندي شده :              جدول 7ـ12 جدول توزيع پاسخگويان بر حسب سن همراه با فراواني آنها X Fi MP FIMP   
21-2023-2225-24 191417 5/205/225/24 5/3893155/416 92/1-=42

/22-5/2008/0=42/22-5/2208/2=42/22-5/24 48/3612/136/3596/72                                                 1121 
 N= تعداد نمرات  MP= نقطه ي مياني طبقه     = ميانگين نمرات Fi= فراواني هر طبقه MP   =                                                                   هرچه واريانس بزرگتر باشد ، پراكندگي مقادير هم بيشتر است و هرجه واريانس كوچكتر باشد ، تشابه داده ها بيشتر اس

ت و مقادير متغير به ميانگين نزديك تر مي شوند . اگر همه ي اعداد با هم برابر باشند ، واريانس داده ها صفر مي شود . پس هنگامي كه داده ها تغيير نكنند ، متغير فاقد واريانس است و كار زيادي با آن نمي توان انجام داد . 7ـ3ـ3ـ2ـ2 واريانس  : واريانس   عبارت است از : مجموع مجذورات انحراف نمره ها از ميانگين تقسيم بر تعداد نمره ها .به همين دليل گاهي اوقات واريانس را ميانگين مجذورها مي نامند . واريانس ميزان پراكندگي داده ها را در اطراف ميانگين نشان مي دهد . علامت واريانس براي     نمونه ي آماري s2 يا v  و براي جامعه ي آماري σ2  (سيگما ) است . اگر همه ي اندازه هاي يك جامعه را داشته باشيم، مي توانيم واريانس آن را محاسبه كنيم. ولي در اكثر اوقات تمام اندازه هاي يك جامعه را نداريم، بنا بر اين سعي مي كنيم بامحاسبه ي واريانس نمونه يا واريانس نمونه ها ، واريانس جامعه را برآورد مي كنيم . واريانس نمونه بهترين برآورد از واريانس جامعه است . هرچند كه واريانس نمونه( s2) بهترين برآورد از واريانس جامعه(σ 2 )است ، ولي يك برآوردگر اريب از واريانس جامعه (σ 2 ) است . با اين حال اگر حجم نمونه بزرگ باشد ، مي توانيمs  را برآورد معقولي از σ بدانيم.

محاسبه واريانس : روش هاي محاسبه واريانس عبارتند از : الف ـ محاسبه ي واريانس براي داده هاي بدون فراواني و گرو ه بندي :جدول 7ـ13  توزيع پاسخگويان بر حسب سن    
202122232425 5/2-=5/22-205/1-=5/22-215/0-=5/22-225/0=5/22-235/1=5/22-245/2=5/22-25 25/625/225/025/025/225/6                                                                                           فرمول محاسبه ي واريانس براي داده هاي فاقد فراواني وگروه بندي نشده عبارت است از :
از اين فرمول وقتي استفاده مي شود كه بخواهيم از شاخص هاي آماري براي توصيف استفاده كنيم . از دو فرمول زير وقتي استفاده مي شود كه بخواهيم واريانس جامعه را برآورد كنيم .  علت اينكه در مخرج فرمول گاهي n و گاهي n-1  استفاده شده، بخاطر اين است كه n-1 در نمونه هاي كوچك ، باعث مي شود كه برآورد واريانس جامعه از روي واريانس نمونه، داراي تورش

كمتري گردد . ولي در نمونه هاي بزرگ تفاوت زيادي نمي كند كه در مخرج  n قرار دهيم يا n-1 .   ب- محاسبه واريانس براي داده هاي داراي فراواني ولي گروه بندي نشده : جدول 7ـ14 توزيع پاسخگويان برحسب سن همراه با فراواني آنهاxi Fi     
202122232425 81141098 16023188230216200 25/625/225/025/025/225/6 5075/2415/225/2050    5/148 

ج ـ محاسبه ي واريانس براي داده هاي داراي فراواني و گروه بندي شده :                   جدول 7ـ15 جدول توزيع پاسخگويان برحسب سن همراه با فراواني آنها xi Fi MP FiMP    
21-2023-2225-24 191417 5/205/225/24 5/389315 9/1-1/01/2 61/301/041/4 59/6814/097/74   1121 7/143 

                                                                                              حد پايين طبقه +حدبالاي طبقهMP =                                                                                                                    2                     خواص واريانس : 1ـ اگر يك مقدار ثابت (مثلاً عدد3)را به تمام مقادير متغير مورد بررسي اضافه كنيم، واريانس هيچ تغييري نمي كند . 2ـ اگر يك مقدار ثابت( مثلاً عدد 3)راتمام مقادير متغير مورد بررسي كم كنيم، واريانس هيچ تغييري نمي كند .3ـ هنگامي كه همه ي مقادير متغير را در يك مقدار ثابت (مثلاً 3) ضرب كنيم، واريانس توزيع جديد 32 برابر واريانس توزيع قديم مي شود . به عبارت ديگر واريانس توزيع جديد 9 برابر واريانس توزيع قديم مي شود . 4ـ هنگامي كه همه ي مقادير متغير را بر يك مقدار ثابت (مثلاً عدد 3) تقسيم كنيم، واريانس توزيع جديد 32 برابر از وريانس توزيع قديم كوچكتر مي شود . مثلاً، اگر همه ي اعداد يك مجموعه را بر عدد 3 تقسيم كنيم، واريانس آنها بر 9 تقسيم مي شود . روش اجراي واريانس : 1ـ ابتدا منو analyze و سپس فرمان descriptive statistics  را كليك مي كنيم . 2ـ فرمان frequencies  را كليك كرده و سپس متغير مورد بررسي را به بخش variables منتقل مي كنيم. 3ـ گزينه ي statistics را كليك كرده و سپس گزينه ي variance را انتخاب مي كنيم. 4ـ گزينه ي continue و سپس ok را كليك مي كنيم. 7ــ3ـ3ــ2ـ3 ـ انحراف معيار  :انحراف معيار ريشه ي دوم يا جذر واريانس است . علامت انحراف معيار در نمونه ي آماري sوsd ودر جامعه ي آماري σ است . انحراف معيار مانند واريانس، ميزان پراكندگي داده ها را در اطراف ميانگين نشان مي دهد . هرچه انحراف معيار كوچكتر باشد ، نشانگر اين واقعيت است كه نمونه هاي مورد مطالعه از لحاظ ويژگي مورد سنجش متجانس تر هستند و تغيير پذيري آنها كمتر است . يعني اختلاف بين نمونه ها كمتر است و ميانگين پراكندگي داده ها را بهتر نشان مي دهد . و هنگامي كه انحراف معيار بزرگ باشد، عكس اين حالات رخ مي دهد . البته بايد به اين نكته توجه داشت عوامل متعددي بر اندازه ي انحراف م

عيار تأثير دارند. يكي از اين عوامل واحد اندازه گيري متغير مورد بررسي است . مثلاً، انحراف معيار درآمد پاسخگويان هنگامي كه با واحد ريال ذكر شود، بزرگتر از انحراف معيار درآمد پاسخگويان همان نمونه، در هنگامي است كه با واحد تومان ذكر شود . وقتي دو گروه داراي ميانگين مشابهي

باشند ، ميانگين گروهي كه انحراف معيار آن كمتر باشد، خلاصه ي بهتري از داده ها ار

ائه مي كند، زيرا در اينجا افراد شبيه تر به يكديگر اند و پراكندگي نمرات آنها كمتر است . مثلاً، دوكلاس A و B  داريم به طوري كه در كلاس A ، ميانگين نمرات دانشجويان 15 و انحراف معيار 5/1 و كلاس B  داراي ميانگين 15 و انحراف معيار 2 است . در اينجا نمرات دانشجويان در كلاس A شبيه تر به يكديگر است و پراكندگي كمتري دارند زيرا انحراف معيار كوچكتري دارد . هنگامي مي توان دو انحراف معيار را مقايسه كرد كه دامنه ي تغيير نمرات و واحد اندازه گيري آنها يكسان باشد . مثلاً، نمي توان پراكندگي دو متغير وزن و قد را با يكديگر مقايسه كرد. زيرا اولاً، دامنه ي تغييرات اين متغيرها با يكديگر تفاوت دارد و ثانياً ، واحد اندازه گيري آنها متفاوت است. زيرا واحد اندازه گيري قد ، سانتيمتر و واحد اندازه گيري وزن كيلوگرم است . حتي اگر واحد اندازه گيري دو گروه يكسان باشد ولي دامنه ي تغيير آنها تفاوت داشته باشد، نمي توان اين دو گروه را با يكديگر مقايسه كرد. مثلاً نمي توان انحراف معيار وزن دانش آموزان يك مدرسه ي ابتدايي را با انحراف معيار وزن دانشجويان يك دانشگاه مقايسه كنيم . زيرا بزرگي انحراف معيار وزن دانشجويان، ممكن است به خاطر وزن بالاي آنها نسبت به دانش آموزان راهنمايي باشد، نه به خاطر اينكه تغييرات در بين وزن دانشجويان بيشتر است.  در چنين مواقعي بهتر است بجاي استفاده از انحراف معيار براي مقايسه تغييرات گروه ها ، از ضريب تغييرا ت استفاده نمود .  محاسبه ي انحراف معيار : روش هاي محاسبه انحراف معيار عبارتند از : الف ـ محاسبه ي انحراف معيار براي داده هاي بدون فراواني و گروه بندي : جدول 7ـ13 را در نظر بگيريد، در اين جدول سن تعدادي از دانشجويان يك كلاس ارائه شده است انحراف معيار اين داده ها را محاسبه مي كنيم:                            25،24،23،22،21،20     
202122232425 5/2-=5/22-205/1-=5/22-215/0-=5/22-225/0=5/22-235/1=5/22-245/2=5/22-25 25/625/225/025/025/225/6 
   


 ب ـ محاسبه ي انحراف معيار براي داده هاي داراي فراواني ولي گروه بندي نشده : جدول 7ـ14 را در نظر بگيريد . دراين جدول سن تعدادي از دانشجويان همراه با فراواني هر كدام از سنين ارائه شده است . حال به محاسبه ي انحراف معيار اين داده ها مي پردازيم . 


xi Fi       
202122232425 81141098 16023188230216200 5/2-5/1-5/0-5/05/15/2 25/625/225/025/025/225/6 5075/2415/225/2050 50 1125  5/17 5/148 

 

 ج ـ محاسبه ي انحراف معيار براي داده هاي داراي فراواني و گروه بندي شده : با توجه به جدول 7ـ15 به محاسبه ي انحراف معيار اين داده ها مي پردازيم : xi Fi MP FiMP    
21-2023-2225-24 191417 5/205/225/24 5/3893159/11/01/2 61/301/041/4 59/6814/097/74
1121 7/143 
تصحيح شپرد  : در مثال هايي كه حل نموديم ميانگين اعداد طبقه بندي نشده برابر با5/22 ولي اعداد طبقه بندي شده برابر با 4/22 شد . طبقه بندي كردن اطلاعات اين تفاوت را بوجود آورده است . به اين خطاي به وجود آمده ، خطاي طبقه بندي مي گويند. هرچه فاصله ي طبقات بيشتر باشد اين خطاي طبقه بندي هم بيشتر مي شود . براي اينكه اين خطا را در انحراف معيار كاهش دهيم ، بايد انحراف معيار محاسبه شده را تصحيح كنيم براي تصحيح انحراف معيار از فرمول زير استفاده مي كنيم كه به تصحيح شپرد معروف است .   sC= انحراف معيار تصحيح شده s= انحراف معيار محاسبه شده I = فاصله ي طبقاتي معايب انحراف معيار : 1ـ انحراف معيار هيچ وقت كمتر از صفر نمي شود . 2ـ حدبالاي انحراف معيار باز است . 3ـ در توزيع هاي داراي چولگي زياد ، كارايي آن پايين است، زيرا نمرات خيلي بزرگ يا كوچك در انحراف معيار تأثير مي گذارند. در چنين شرايطي بهتر است از انحراف چاركي يا انحراف متوسط استفاده نمود .  


محاسن انحراف معيار : 1ـ انحراف معيار تحت تأثير همه ي نمرات قرار دارد، بنابراين معتبرترين و با  ثبات ترين شاخص پراكندگي است . اگر نمونه هاي زيادي از جامعه انتخاب كنيم، انحراف معيار آنها خيلي به هم نزديك خواهد بود. 2ـ در آمار استنباطي كاربرد گستره اي دارد . 3ـ با انحراف معيار امكان انجام عمليات رياضي وجود دارد . 4ـ با استفاده از انحراف معيار مي توانيم مشخص كنيم، چند درصد نمرات در فواصل مختلف نسبت به ميانگين قرار دارند. مثلاً، 28/68 درصد نمرات به مقدار يك انحراف معيار بيشتر يا كمتر از ميانگين قرار دارند . حال ممكن است اين سوال پيش آيد كه استفاده از انحراف معيار بهتر است يا واريانس ؟ درپاسخ بايد گفت كه، تفسير از طريق انحراف معيار دقيق تر و با مفهوم تر است. مثلاً وقتي واريانس قد پاسخگويان 100 سانتي متر، درحالي كه انحراف معيارش 10 سانتي متر باشد ، در اينجا انحراف معيار مفهوم بيشتري نسبت به واريانس دارد . روش اجراي انحراف معيار:1ـ ابتدا منو analyze و سپس فرمان descriptive statistics  را كليك مي كنيم . 2ـ فرمان frequencies را كليك كرده و سپس متغير مورد بررسي را به بخش variables       منتقل مي كنيم. 3ـ گزينه ي statistics را كليك كرده و سپس گزينه يstd.deviation  را انتخاب مي كنيم. 4ـ گزينه ي  continueو سپس ok را كليك مي كنيم.7ـ3ـ3ـ2ـ4ـ  گشتاور   : اگر يك متغير n  بار مورد اندازه گيري قرار بگيرد و اندازه هاي    را بدست آوريم ، ميانگين انحراف اين اعداد از ميانگين گشتاور ناميده مي شود . گشتاور را با m  نشان مي دهند و فرمول هاي محاسبه ي آن در جدول 7ـ16 ارائه شده است . 
جدول 7ـ16 فرمول هاي محاسبه گشتاور مرتبه اول ، دوم ، سوم و چهارم اگر داده ها فاقد فراواني باشد اگر داده ها داراي فراواني باشدگشتاور مرتبه ي اول =m1  

گشتاور مرتبه ي دوم =m2       
گشتاور مرتبه ي سوم =m3       
گشتاور مرتبه ي چهارم =m4   
واريانس وميانگين ،هم گشتاور محسوب مي شوند . مثال ـ وزن تعدادي از دانشجويان يك كلاس در جدول 7ـ17 ارائه شده است . حال مقدار گشتاورها را با توجه به اين اطلاعات محاسبه مي كنيم. جدول 7ـ17 جدول توزيع وزن دانشجويانx Fi        
707172737475 567385 5/2-5/1-5/0-5/05/15/2 25/625/225/025/025/225/625/315/1375/175/01825/31 62/15-37/3-12/0-12/07/362/15 1/78-22/20-84/0-36/096/261/7806/3906/506/006/006/506/39 3/19536/3042/018/048/403/195
50 0 5/17 5/96 0 26/6 36/88 04/462
                                                                          7ـ3ـ3ـ2ـ5ـ  كشيدگي    : كشيدگي ميزان پراكندگي يا انباشتگي داده هاي يك متغير را نشان مي دهد . بعبارت ديگر ميزان بلندي يا پخي يك توزيع را نشان مي دهد . هرچه پراكندگي داده ها از ميانگين كمتر باشد ، توزيع كشيده تر مي شود (مانند شكل 7ـ2) و هرچه پراكندگي داده ها از ميانگين بيشتر باشد توزيع پخ تر (خوابيده تر ) است .(مانند شكل 7ـ3)

ضريب كشيدگي را با  k نشان مي دهند و فرمول محاسبه آن عبارت است از :  k = ضريب كشيدگي m4 = گشتاور مرتبه ي چهارم m2 = گشتاور مرتبه ي دوم پس براي محاسبه ي كشيدگي از گشتاور مرتبه ي دوم و گشتاور مرتبه ي چهارم استفاده مي شود . هنگامي كه مقدار ضريب كشيدگي (k)  كوچكتر از صفر باشد، كشيدگي از نوع منفي است . در اين صورت منحني توزيع به صورت نيمه برآمده وپخ تر از منحني توزيع نرمال مي شود در كشيدگي منفي دامنه ي تغيير بين متغيرها زياد است . هنگامي كه مقدار ضريب كشيدگي بزرگتر از صفر باشد، كشيدگي از نوع مثبت است ، در اين صورت منحني توزيع، كشيده تر از منحني توزيع نرمال          مي شود. درصورتي كه مقدار ضريب كشيدگي مساوي با صفر باشد، كشيدگي نرمال است . در اين هنگام منحني توزيع برابر با توزيع نرمال مي شود . مثال ـ توزيع سن تعدادي از پاسخگويان در جدول 7ـ14 ارائه شده است. با توجه به آن اطلاعات، مقدار ضريب كشيدگي را محاسبه مي كنيم. x            
202122232425 81141098 5/2-5/1-5/0-5/05/15/2 25/625/225/025/025/225/6 5075/2415/225/2050 5/31268/5525/0625/056/455/312
50 0 5/17 5/148 11/727                                                                  چونكه ضريب كشيدگي كوچكتر از صفر (35/1-> 0)  است ، نتيجه مي گيريم توزيع داراي كشيدگي منفي است. در اين جا منحني توزيع پخ تر (پايين تر ) از منحني نرمال است . روش اجراي كشيدگي : 1ـ ابتدا منو analyze و سپس فرمان descriptive statistics  را كليك مي كنيم. 2ـ فرمان frequencies  را كليك كرده و سپس متغير مورد بررسي را به بخش variables     منتقل مي كنيم

 

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید