بخشی از مقاله
شمارش پاسخ ها درتركيب چند متغير
جهت بررسی روابط بین رنگ ماشین و ناحیه جغرافیایی نمی توانید به روش فصل های قبل عمل کنید. زیرا میانگین گرفتن از رنگ یا ناحیه جغرافیایی، بی معنا است. وقتی می خواهید رابطه بین دو متغیر با مقادیر یا حالات محدود را بررسی نمایید (که گاهی متغیر های حالتی - variable categorical – نامیده می شوند) ممکن است از جدول متقاطع crosstabulation استفاده نمایید. جدول متقاطع جدولی است که جهت نمایش تعداد ترکیب های مختلف مقادیر دو متغیر استفاده می شود. برای مثال، می توانید تعداد پسران یا دخترانی که در هر یک از حالات سطح قبولی وجود دارند را بشمارید یا توزیع رنگ اتومبیلها را در نواحی مختلف کشور مشاهده نمایید.
در این فصل از جدول متقاطع جهت مشاهده رابطه بین نوع مرکز و سطح قبولی که به صورت سه حالتی اندازه گیری شده است، استفاده خواهیم کرد.
سطح قبولی و نوع مرکز
در این مطالعه سطح قبولی مراکز به صورت دامنه ای از مقادیر که دربرگیرنده سطح قبولی مراکز است، استفاده شده است. یعنی از چارک های سطح قبولی استفاده شده است. از شکل 1-3 که شامل جدول فراوانی چهار حالت درآمد است مشاهده می نمایید که همان گونه که انتظار می رود تقریباً 25% نمونه ها در هر یک از چهار گروه سطح قبولی قرار دارد.
Cumulative Percent
Valid Percent
Percent
Frequency
22.7
50.0
77.3
100.0 22.7
27.3
27.3
22.7
100.0 22.7
27.3
27.3
22.7
100.0 5
6
6
5
22 11.25 or less Valid
11 to 32.50
33 to 73.75
74 or more
Total
شکل 1-3 : جدول فراوانی چارک های سطح قبولی سال 83-82
جهت بررسی رابطه بین سطح قبولی و نوع مرکز، می توانید در هر یک از حالات سطح قبولی تعداد مراکزی که "دولتی و هنر" و "غیر انتفاعی" و "خاص" هستند را بشمارید. شکل 2-3 حاوی همین اطلاعات است. گروههای سطح قبولی ستونهای جدول را تشکیل می دهد.
ردیف ها نیز نوع مرکز می باشد. برای هر یک از ترکیب های مقادیر دو متغیر خانه ای در جدول ظاهر می شود. اولین خانه در بالا و چپ جدول مربوط به مراکز "دولتی و هنر" در پایین ترین گروه سطح قبولی است.
1 مرکز در این گروه قرار دارد. خط دوم در ستون اول مربوط به مراکز "غیرانتفاعی" در پایین ترین گروه سطح قبولی است. تعداد مراکز این خانه 4 مرکز می باشد. به همین ترتیب خانه ردیف چهارم از ستون چهارم شامل 1 مرکز از مراکز "خاص" است
که در گروه بیشترین سطح قبولی قرار دارد.
در سمت راست و پایین جدول مقادیر جمع قرار دارند که به آنها جمع های حاشیه ای (marginal totals) می گوییم زیرا در حاشیه های جدول قرار دارند. حاشیه های جدول همان اطلاعات جدول فراوانی را برای دو متغیر نشان می دهند
. در حاشیه راست جدول ستونی که دارای برچسب Total می باشد جمع کل مراکز راکه هر یک از انواع مراکز را انتخاب کرده اند را نمایش می دهد. به همین ترتیب، جمع ستون اول 5 می باشد که سطح قبولی مراکزی است که در گروه کمترین سطح قبولی قرار می گیرند. آخرین عدد جدول (22) جمع کل نمونه های جدول مي باشد.
Count
Total
The total number of acceptances
74 or more 33 to 73.75 11 to 32.50 11.25 or less
7
7
8
22 4
1
5 1
5
6 1
3
2
6 1
4
5 The type governmental,art
of center nonprofit
private
Total
شکل 2-3 : جدول متقاطع نوع مرکز بر حسب سطح قبولی
آیا جمع های حاشیه ای که از یک جدول متقاطع به دست می آید همیشه برابر با مقادیری است که از جداول فراوانی هر یک از متغیرها به دست می آ ید؟
اگر مقادیری از هر یک از دو متغیر جدول نامعلوم باشد پاسخ نامنفی است. برای مثال جدول متقاطع در شکل 2-3 تنها شامل نمونه هایی است که مقادیر آن برای هر دو متغیر نوع مرکز و سطح قبولی نامعلوم نباشد. بنابراین جمع های حاشیه ای متغیر سطح قبولی براساس نمونه هایی محاسبه شده است که مقادیر آنها برای هر دو متغیر سطح قبولی و نوع مرکز معلوم باشد. وقتی یک جدول فراوانی برای متغیر سطح قبولی تشکیل می دهید تنها نمونه هایی از درصدهای صحیح حذف می شوند که مقدار آن برای متغیر سطح قبولی نامعلوم نباشد.
اگر به مقادیر جدول متقاطع توجه نمایید، ملاحظه می نمایید که 1 مرکز از مراکزی که در پایین ترین سطح قبولی قرار دارند از نوع "دولتی و هنر" می باشد. از گروه دوم سطح قبولی 1 مرکز، گروه سوم سطح قبولی 1 مرکز و گروه با بیشترین سطح قبولی 4 مرکز از نوع "دولتی و هنر" می باشند. آیا تنها با این اعداد می توانید بگویید
که رابطه سطح قبولی و مراکز "دولتی و هنر" چیست؟ البته که خیر. زیرا نمی توانید تنها تعداد را با هم مقایسه نمایید. برای مقایسه گروهها به جای تعداد باید درصدها را با هم مقایسه نمایید. یعنی می باید در هر یک از گروههای متغیر سطح قبولی درصدی از مراکز را که در حالات مختلف نوع مرکزقرار دارند بررسی نمایید.
درصد های ردیف و ستون
شکل 3-3 علاوه بر تعداد، حاوی درصدهای ستون نیز می باشد. از روی جمع هر یک از ردیف ها ملاحظه می نمایید که در مجموع 8/31% از نمونه ها در مراکز "دولتی و هنر" هستند. همچنین ملاحظه می نمایید که 20% از گروه کمترین سطح قبولی، 7/16% از گروه دوم سطح قبولی، 7/16% از گروه سوم سطح قبولی و 80% از گروه بیشترین سطح قبولی درمراکز "دولتی و هنر" دارا هستند. به نظر می رسد که بیشترین سطح قبولی مربوط به مراکز "دولتی وهنر" می باشد.
Total
The total number of acceptances
74 or more
33 to 73.75
11 to 32.50
11.25 or less
7
31.8%
4
80.0%
1
16.7%
1
16.7%
1
20.0%
The type governmental,art Count
of center % within The total
number of acceptances
7
31.8%
3
50.0%
4
80.0%
nonprofit Count
% within The total
number of acceptances
8
36.4%
1
20.0%
5
83.3%
2
33.3%
private Count
% within The total
number of acceptances
22
100.0%
5
100.0%
6
100.0%
6
100.0%
5
100.0%
Total Count
% within The total
number of acceptances
شکل 3-3 : جدول متقاطع با درصدهای ستون
درصد هایی که برای مقایسه مورد استفاده قرار گرفتند را اصطلاحاً درصدهای ستون (column percentages ) می نامند زیرا تعداد هر یک از خانه های جدول را به صورت درصدی از جمع ستون بیان می کند. یعنی برای هر یک از گروه های سطح قبولی، توزیع نوع مرکز را بیان می کند. در هر یک از ستونها جمع درصدهای ستون برابر با 100% می شود. از شکل 3-3 می توانید متوجه مي شوید که 20% مراکز با کمترین سطح قبولی از نوع "دولتی و هنر" هستند در حالی که 80% مراکزی که بیشترین سطح قبولی را دارند از نوع "دولتی و هنر" هستند .
درصد مراکزی که از نوع " غیرانتفاعی" هستند بیشترین مقدار را در مراکز با کمترین سطح قبولی دارد. ( 0/80% )
همچنین می توانید درصدهای ردیف را برای یک جدول محاسبه نمایید. درصدهای ردیف (row percentages ) به شما می گوید که چند درصد از کل نمونه های یک ردیف در هر یک از ستون ها قرار دارند. در هر یک از حالات نوع مرکز این درصدها به شما می گوید که چند درصد از نمونه ها در هر یک از انواع متغیرسطح قبولی قرار می گیرد. (همچنین می توانید درصدهای کل (total percentages) را محاسبه نمایید. یعنی تعداد هر خانه به صورت درصدی از کل نمونه های جدول محاسبه می شود.) شکل 4-3 حاوی درصدهای ردیف می باشد.
Total
The total number of acceptances
74 or more
33 to 73.75
11 to 32.50
11.25 or less
7
100.0%
4
57.1%
1
14.3%
1
14.3%
1
14.3%
The type governmental,art Count
of center % within The total
number of acceptances
7
100.0%
3
42.9%
4
57.1%
nonprofit Count
% within The total
number of acceptances
8
100.0%
1
12.5%
5
62.5%
2
25.0%
private Count
% within The total
number of acceptances
22
100.0%
5
22.7%
6
27.3%
6
27.3%
5
22.7%
Total Count
% within The total
number of acceptances
شکل 4-3 : جدول متقاطع با درصدهای ردیف
از روی درصدهای ردیف ملاحظه می نمایید که 3/14% مراکز "دولتی و هنر" در گروه کمترین سطح قبولی، در گروه دوم و سوم سطح قبولی نیز 3/14% و 1/57% در گروه چهارم سطح قبولی می باشد. برای هر یک از ردیف ها جمع درصدهای ردیف 100% می شود.
چطور می توانیم بگوییم که آیا یک جدول دارای درصدهای ردیف یا ستون می باشد؟ اگر مقادیر ستونی که برچسب آن Total می باشد همگی 100% باشد، جدول مورد نظرحاوی درصدهای ردیف می باشد که جمع هر یک از ردیف ها 100% می شود. اگر مقادیر ردیفی که دارای برچسب Total می باشد همگی 100 باشند، آن جدول دارای درصدهای ستون می باشد.
برای هر جدولی باید تعیین نمایید که آیا درصد های ستون , می تواند پاسخ سؤ ال مورد نظر شما را بدهد .
در صورتی که بتوانید یکی از متغیرها را به عنوان متغیر وابسته و دیگری را به عنوان متغیر مستقل در نظر بگیرید . این کار به سادگی امکان پذیر است . یک متغیر مستقل (independent variable ) متغیری است که تصور می شود بر روی متغیر دیگر که متغیر وابسته ( dependent variable ) است اثر بگذارد. برای مثال اگر در حال مطالعه بروز سرطان ریه در سیگاری ها و غیر سیگاری ها هستید، سیگار کشیدن متغیر مستقل می باشد. سیگار کشیدن براینکه فردی سرطان ریه بگیرد (متغیر وابسته) اثر می گذارد. به همین ترتیب، اگر در حال مطالعه سطح قبولی مراکز در دو جنس پسر و دختر می باشید، جنس متغیر مستقل است زیرا بر سطح قبولی مراکز تأثیر می گذارد. هنگامی که توانستید یکی از متغیرها را به عنوان مستقل و دیگری را به عنوان وابسته تشخیص دهید، حال باید درصدها را به گونه ای محاسبه نمایید که جمع درصدها در هر یک از حالات متغیر مستقل 100% بشود. به عبارت دیگر، آنچه که می خواهید ملاحظه نمایید این است که تعداد مراکز در هر یک از حالات متغیر مستقل برابر شود . اگر جمع درصدها برای هریک از حالات متغیر مستقل 100% شود مثل آن است که در هر حالت 100 نمونه داشته باشیم. برای مثال می خواهید 100 سیگاری و 100 غیر سیگاری داشته باشید.
حال می توانید بروز سرطان ریه را در هر یک از این دو گروه با هم مقایسه نمایید. در مثالی که دنبال می کردیم، نوع مرکز متغیر مستقل و سطح قبولی متغیر وابسته می باشد. یعنی می خواهید در هر گروه نوع مرکز 100 نمونه داشته باشید. از آنجایی که در شکل 4-3، نوع مرکز متغیر ردیف می باشد، از درصد ردیف استفاده شده که جمع آن برای هریک از حالات نوع مرکز برابر با 100% است.