بخشی از مقاله
توزيعهاي احتمالي گسسته
مقدمه
در حالي كه اغلب تعيين توزيع احتمالي براي يك متغير تصادفي معين مفيد است، بسياري مواقع در استنباط آماري و تصميمگيري توابع احتمالي متغيرها داراي يك فرم هستند. در چنين مواردي استفاده از نظريه توابع احتمالي شرح داده شده در فصل پنجم براي به دست آوردن نتايج كلي در مورد توزيع احتمالي مثل ميانگين و واريانس بهتر است از به دست آوردن اين مشخصهها در هر حالت ويژه. زيراكسل كننده خواهد بود كه در هر مورد جديد با استفاده از توزيع احتمالي يا چگالي، فرايند تعيين مشخصهها مثل ميانگين و واريانس را انجام دهيم. خوشبختانه به اندازة كافي همانندي بين انواع معين از آزمايشهاي منحصر به فرد معلوم وجود دارد، به طوري كه به دست آوردن يك فرمول كه نشان دهندة ويژگي عمومي اين آزمايشها باشد را ممكن ميسازد.
در اين فصل بعضي از توزيعهاي احتمالي متغيرهاي تصادفي گسسته مثل توزيعةاي دو جملهاي، فوق هندسي و پواسن را مطالعه خواهيم نمود و خواص آنها را بررسي ميكنيم اين توزيعها از مهمترين توزيعهاي گسسته در آمار هستند كه كاربرد زيادي دارند. توزيعهاي احتمالي متغيرهاي پيوسته با تأكيد بر توزيع نرمال كه كاملاً شناخته شده است و در آمار استفادة زيادي از آن ميشود در فصل هفتم بحث خواهد شد.
آزمايش دو جملهاي
بسياري از آزمايشگاه هستند كه داراي يك ويژگي عمومي بوده و آن عبارت است از اينكه نتايج آنها به يكي از دو پيشامد دستهبندي ميشوند. براي مثال، «آزمايش دسته بندي يك متقاضي شغل كه مرد يا زن است» داراي دو نتيجه ميباشد، آزمايش پرتاب يك سكه كه نتيجة آن پيشامد شيرآمدن و خط آمدن ميباشد. تولد يك نوزاد كه نتيجة آن پسر و يا دختر ميباشد. آزمايش انتخاب يك كالاي توليدي كه نتيجة آن تنها به يكي از دو صورت سالم و يا ناقص اتفاق ميافتد.
در حقيقت اين امكان هميشه وجود دارد كه نتايج رخدادهايي كه در زندگي روزمره اتفاق ميافتد را به صورت دو نتيجه «موفقيت» و يا «عدم موفقيت» شرح دهيم. امتحانهايي كه تنها منتج به دو نتيجه ميشوند، نقش بسيار مهمي در يكي از توزيعهاي احتمالي گسسته كه كاربرد زيادي در عمل دارد يعني «توزيع دو جملهاي» ايفا ميكنند.
قبل از اين كه توزيع دو جملهاي را معرفي كنيم، آزمايش دو جملهاي را شرح ميدهيم با توجه به مثالهاي بالا و مثالهايي مثل مصاحبه با يك رأي دهنده كه جواب آن موافق كانديداي مورد نظر است و يا نيست. پرتاب موشك كه نتيجة آن به هدف خوردن و يا به هدف نخوردن است، ملاحظه ميشود كه صرف نظر از بعضي از تفاوتها همة آنها داراي يك مشخصة ويژه آزمايش دو جملهاي ميباشند.
تعريف:
يك آزمايش دو جملهاي داراي فرضيات زير است.
1-آزمايش دو جملهاي مركب از n امتحان يكسان ساده است.
2-هر امتحان منتج به يكي از دو نتيجه ميشود. يك نتيجه را موفقيت و با S نشان داده و نتيجة ديگر را عدم موفقيت و با F نشان ميدهيم.
3-احتمال موفقيت در يك امتحان ساده مساوي P است، كه از يك امتحان به امتحان ديگر ثابت باقي ميماند احتمال عدم موفقيت مساوي q=1-P است.
4-امتحانها از هم مستقل ميباشند.
5-علاقمند به X، تعداد موفقيتهاي هستيم كه در nبار آزمايش ساده مشاهده ميشود. امتحانهاي سادهاي كه در اين شرايط صدق ميكنند به آزمايشهاي «برتولي» معروفند. در عمل فرضهاي بيان شده در يك آزمايش دو جملهاي تنها در حالتهاي محدودي وجود دارند، اما مادامي كه هر آزمايش روي آزمايش ديگر اثر ناچيزي داشته باشد ميتوان نظرية دو جملهاي را بكار برد.
براي مثال، احتمال اين كه يك رايدهنده موافق كانديداي معيني در يك انتخاب سياسي رأي به دهد تقريباً از يك امتحان به امتحان ديگر ثابت ميماند. مادامي كه جامعة راي دهندگان در مقايسه با نمونه نسبتاً بزرگ باشد. اگر پنجاه درصد جامعه 1000 نفري از راي دهندگان كانديداي A را ترجيح به دهند، آن گاه احتمال موافق بودن اولين مصاحبه شونده به كانديداي A مساوي خواهد بود. احتمال موافق بودن دومين مصاحبه شونده به كانديداي A مساوي يا خواهد بود كه بستگي دارد به اينكه آيا اولين مصاحبه شونده موافق بوده يا مخالف آن.
هر دو عدد نزديك به هستند، در عمل براي سومين، چهارمين و nامين انتخاب هم همين طور است در صورتي كه n خيلي بزرگ باشد. اما اگر تعداد جامعه 10 و تعداد موافق كانديداA، 5 نفر باشند، آن گاه احتمالي اين كه اولين راي دهنده موافق A باشد مساوي و دومين مساوي يا بستگي به اين كه اولي موافق يا مخالف بوده است خواهد بود. بنابراين براي جوامع كوچك، احتمال موافق بودن از يك رأي دهنده به رأي دهنده ديگر (از يك امتحان به امتحان ديگر) به طور محسوس تغيير ميكند و نتيجتاً آزمايش دو جملهاي نخواهد بود.
توزيع احتمالي دو جملهاي
توزيع دو جملهاي بوسيلة مقادير n و p كه پارامترهاي توزيع هستند توصيف ميشود. پارامتر هر توزيع عبارت است از يك مشخصة جامعه. در توزيع دو جملهاي پارامتر n عبارت است «تعداد امتحانها» و p عبارت از احتمال موفقيت در هر امتحان ساده ميباشد. براي هر n وp داده شده با توجه به فرضيات آزمايش دو جملهاي ميتوان احتمال هر تعداد موفقيت را حساب كرد و نيز ميتوان ديگر مشخصههاي توزيع مثل ميانگين و واريانس را هم به دست آورد.
براي نشان دادن اين كه چگونه توزيع احتمالي دو جملهاي حاصل ميشود،فرايند توليد را در نظر بگيريد كه يك وسيلة همانندي توليد ميكند كه به دو صورت سالم و يا ناقص دستهبندي ميشود. وقتي كه فرايند به طور درست كار نكند، احتمال ثابت 10/0=p وجود دارد كه كالا ناقص توليد شود. تعداد ناقصها هر مقداري از 0 تا تعداد آزمودني (n) ميتواند باشد. براي مثال، ممكن است سئوال شود، «احتمال اين كه در يك نمونة تصادفي چهارتايي يك نتيجة ناقص باشد چقدر است؟ يا احتمال اين كه دو يا بيشتر در يك نمونة تصادفي چهارتايي ناقص وجود داشته باشد چقدر است؟ كلمة تصادفي معادل مستقل بودن در تعريف آزمون دو جملهاي است.
براي محاسبة احتمالات در آزمايش دو جملهاي ميتوانيم از قوانين ضرب احتمال استفاده كنيم. مانند
(يك رويداد) p(تعداد رويدادهاي مربوط)=(پيشامد)p
در يك مسئله دو جملهاي، علاقمند به محاسبة احتمال دقيقاً x موفقيت در n تكرار امتحان برنولي هستيم، كه هر امتحان داراي احتمال موفقي p است. به اين معني كه ما x موفقيت و n-x عدم موفقيت داريم. براي محاسبه چنين احتمالهايي، لازم است كه احتمال يك رويداد از اين وع را پيدا كنيم، آن گاه آن را در تعداد ممكن چنين رويدادهايي ضرب كنيم. چون فرقي ندارد كدام رويداد را ابتدا بررسي كنيم، فرضي كنيد به طور اختياري اين رويداد را بررسي كنيم كه در آن x موفقيت ابتدا رخ دهد، ادامه پيدا كند يا n-x (عدم موفقيت). فرض كنيد موفقيت S= و عدم موفقيت F= باشد، بنابراين اين رويداد ويژه به صورت زير مرتب نمود.
SS…S FF…F
n-x عدم موفقيت x موفقيت
براي تعيين احتمال توأم چنين دنبالة ويژهاي از موفقيتها و عدم موفقيتها، توجه كنيد كه امتحانها فرض ميشوند كه از هم مستقل هستند. چون احتمال يك موفقيت p(S)=p و p(F)=q است، بنابراين داريم.
P(SS…S FF…F)=p(S)p(S)…p(S)p(F)p(F)…p(F)
=(p)(p)…(P)(q)(q)..(q)
ميتوان نشان داد كه نشان دهندة احتمال هر دنبالهاي است كه در آن x موفقيت و n-x عدم موفقيت وجود دارد. بنابراين كافي است بدانيم چند رخ داد متفاوتي وجود دارد كه در آن x موفقيت و n-x عدم موفقيت داشته باشيم. جواب عبارت است از تعداد تركيبهاي x از n ميدانيم اين تعداد عبارت از
بنابراين حاصلضرب در احتمال x موفقيت در n امتحان را با احتمال ثابت موفقيت (p) به صورت زير به دست ميدهد.
(6-1) (x موفقيت در n امتحان)p
اين توزيع را توزيع دو جملهاي گويند. اگر متغير تصادفي X داراي توزيع دو جملهاي با پارامترهاي n و p باشد معمولاً آن را به صورت زير مينويسند.
مثال 6-1 اگر كسر ناقصي توليد يك كالا مساوي 1/0=p باشد، در يك نمونة تصادفي چهارتايي از اين كالاها توزيع احتمالي تعداد كالاهاي ناقص را حساب كنيد.
حل: يك كالاي انتخاب دو صورت خواهد داشت يا سالم است و يا ناقص. احتمال اين كه يك كالاي انتخاب ناقص باشد مساوي 1/0=p كالاهاي انتخابي از همديگر مستقل هستند بنابراين تعداد كالاهاي خراب در نمونه داراي توزيع دو جملهاي است. بنابراين توزيع احتمالي تعداد كالاهاي خراب طبق جدول 6-1 خواهد بود.
جدول 6-1: توزيع دو جمله با 4=n و 1/0=p
جمع 4 3 2 1 0 Xتعداد كالاهاي خراب
1 0001/0 0036/0 0486/0 2916/0 6561/0 P(x)
كه در آن احتمال اين كه دقيقاً (1=x) كالاي خراب در نمونة چهارتايي (4=n) وقتي كه 1/0=p باشد، داشته باشيم به صورت زير حساب ميشود
با استفاده از جدول 6-1 به سادگي ميتوان احتمال اين كه تعداد خرابها كمتر يا مساوي 2 باشد را حساب كرد.
مثال 6-2 به منظور عيب يابي در توليد يك نوع كالا كه به مقدار زياد توسط ماشين در كارخانه توليد ميشود، با استفاده از طرح نمونهگيري، كالاي توليدي بازرسي ميشود. ده قلم كالا به طور تصادفي انتخاب و مورد آزمايش قرار ميگيرند. چنانچه دو يا بيشتر كالاي ناقص مشاهده شود، كالاي توليدي رد ميشود. اگر كل كالاي توليدي دقيقاً 5 درصد ناقص داشته باشد، احتمال اين كه كالا پذيرفته شود چقدر است؟ احتمال اين كه كالا رد شود چقدر است؟
حل: با توجه به شرايط يك آزمايش دو جملهاي، مشاهده ميشود كه تعداد كالاهاي ناقص در نمونه، x داراي توزيع دو جملهاي زير است.
در صورتي كالا پذيرفته ميشود كه در نمونه يا خراب مشاهده نشود و يا يكي مشاهده شود بنابراين
آن گاه، احتمال رد كالا عبارت خواهد بود از
مثال 6-3 يك واكسن جديد جلوگيري از سرماخوردگي براي تعيين اثر جلوگيري آن در سرماخوردگي عمومي مورد آزمايش قرار گرفته است. براي اين كار به ده نفر واكسن تزريق كرده و بعد از مدت يكسال مشاهده شده كه هشت نفر زمستان را بدون سرماخوردگي سپري كردهاند.
فرض كنيد وقتي كه واكسن استفاده نشود،
احتمال اينكه يك نفر بدون سرماخوردگي زمستان را سپري كند مساوي 5/0 باشد. احتمال اينكه هشت نفر يا بيشتر زمستان را بدون سرماخوردگي سپري كنند بشرطي كه واكسن در افزايش مقاومت بدن در برابر سرماخوردگي موثر نباشد چقدر است؟
حل: فرض كنيد در صورتي كه واكسن مؤثر نباشد، احتمال اينكه يك نفر زمستان را بدون سرماخوردگي طي كند مساوي 5/0=p است. توزيع احتمالي براي x، تعداد سرما نخورهها عبارت است از:
مثالهاي 6-1، 6-2 و 6-3 موارد استفادة توزيع دو جملهاي و محاسبة احتمال x موفقيت در n امتحان را با توجه به تعريف آزمايش دو جملهاي روشن ميساند.
البته نكتة مهم اين است كه براي هر عمل فيزيكي بايستي دقيقاً مشخصههاي آزمايش دو جملهاي بخش 6-2 براي تعيين اينكه آيا مدل آزمايش دو جملهاي براي عمل مورد نظر معتبر است تطبيق داده شود.
توجه ميكنيد كه مثالهاي فوق مسائلي احتمالي بودند تا آماري. احتمال موفقيت در يك امتحان ساده معلوم است و ما ميخواهيم در n امتحان احتمال پيشامدهاي عددي معيني را حساب كنيم. حال روش را بر عكس در نظر ميگيريم، به اين معني كه فرض ميكنيم يك نمونه از جامعه داريم و ميخواهيم راجع به p استنباط بكنيم. شكل فيزيكي مثالهاي 6-2 و 6-3 در صورتي كه هدف نهايي استنباط آماري باشد وضعيت عملي خوبي به دست ميدهد از اين دو مسئله در بخشهاي آتي در استنباط آماري استفاده خواهيم كرد.
تمرين 6-1 اطلاعات قبلي نشان ميدهد كه 30درصد تمام بيماراني كه در يك كلينيك پذيرش ميشوند نميتوانند هزينة خود را پرداخت كنند. فرض كنيد 4=n بيمار جديد نشان دهندة يك نمونة جديد از جامعة بيماراني باشند كه توسط كلينيك تحت مداوا قرار ميگيرند. احتمال اينكه
الف) هيچكدام از بيماران هزينه را پرداخت نكنند.
ب) يك نفر از بيماران هزينه را پرداخت نكند.
ج) تمام بيماران هزينه را پرداخت كنند.
احتمال اينكه تيراندازي در هر شليك تير به هدف بزند مساوي 8/0 است. او چهار تير به هدف شليك ميكند، پيدا كنيد.
الف) دقيقاً دو تير به هدف بزند.
ب)لااقل يك تير به هدف بزند.
ج)چهار تير به هدف اصابت نمايد.
6-3 يك روش جديد جراحي 80درصد با موفقيت انجام ميشود. اگر عمل جراحي پنج مرتبه انجام شود و فرض كنيم كه عملاً از يكديگر مستقل باشند پيدا كنيد.
الف) احتمال اينكه هر پنج عمل با موفقيت انجام شوند چقدر است؟
ب) احتمالي اينكه كمتر از دو عمل به موفقيت بيانجامد چقدر است؟
ج) فقط چهار عمل با موفقيت انجام شود چقدر است؟
6-4 به تمرين 6-3 مراجعه نمائيد، اگر كمتر از دو عمل با موفقيت همراه بودند در بارة تيم عمل جراحي چه نظري داشتيد؟
6-5 به تمرين 6-3 مراجعه كنيد، اگر x تعداد موفقيتها در عملهاي جراحي باشد، توزيع احتمالي آن را رسم نمائيد.
6-4-ميانگين و واريانس توزيع دو جملهاي
ميدانيم كه توزيع دو جملهاي بوسيلة پارامترهاي n و P مشخص ميشوند. از طرفي هر توزيعي داراي مشخصههايي است مثل ميانگين و واريانس. بنابراين ممكن است در توزيع دو جملهاي، ميانگين و واريانس را نيز بر حسب n وp بدست آورد.
ميتوان با استفاده از قضاياي مربوط به جمع و با استفاده از مهارت در جابجايي جبري، ميانگين و واريانس متغير تصادفي x كه داراي توزيع دو جملهاي با پارامتر pو n است را مستقيماً حساب نمود در اينجا سعي ميكنيم اين ويژگيهاي توزيع را با استفاده از مثالهاي ساده حساب كرده و آن گاه در حالت كلي تعميم دهيم. براي n=1، توزيع احتمالي x عبارت از
1 0 X
P Q P(x)
با توجه به تعريف اميد رياضي، داريم
و براي 2=n، توزيع احتمالي عبارت است از
2 1 0 X
2p Pq2 2q P(x)
براي 3=n با توجه به توزيع احتمالي x داريم
ميتوان حدس زد كه نتيجه در حالت كلي نيز برقرار است. در واقع ميتوان با استفاده از قضاياي رياضي نشان داد كه اميد رضاي x در توزيع دو جملهاي با n امتحان با پارامتر p، برابر است با
به همين طريق ميتوان واريانس x را براي 2و1=n امتحان به دست آورد. براي 1=n
براي 2=n
با جايگذاري q=1-p، خواهيم داشت
به سادگي ميتوان نشان داد كه براي 3=n، واريانس مساوي pq3 است. در حالت كلي براي n امتحان و با پارامتر p، ميتوان استنباط نمود كه واريانس و انحراف معيار برابر است با
و
مثال 6-4 در يك فرايند توليد كه كالاي همانندي توليد ميشود، 10% كالاهاي توليدي ناقص هستند در انتخاب 20 نمونه تصادفي كالا از اين فرايند، ميانگين و واريانس و انحراف معيار تعداد كالاهاي ناقص را حساب كنيد.
حل: فرض ميكنيم مقدار كالاهاي ناقص در نمونه باشد =x
واضح است كه
بنابراين،
تمرين
6-6 به تمرين 6-1 مراجعه نمائيد، ميدانيم كه 30 درصد بيماران پذيرش شده قادر به پرداخت هزينة بيمارستان نيستند. اگر در طول زمان يكسال 2000 نفر در بيمارستان معالجه گردند حساب كنيد.
الف) ميانگين افرادي كه قادر به پرداخت صورتحساب بيمارستان نيستند چيست؟
ب) واريانس و انحراف معيار اين تعداد را حساب كنيد.
6-7 يك آزمون داراي 15 سوال است كه هر سوال داراي چهار جواب احتمالي بوده كه فقط يكي از آنها درست است. شخصي به طور شانسي علامت ميزند، مطلوبست محاسبة
الف) ميانگين تعداد جوابهاي درست
ب) احتمال اينكه به 8 تا 10 سوال جواب درست به دهد چقدر است؟
6-8اگر متغير تصادفي x داراي توزيع دو جملهاي با ميانگين 5/2 و واريانس 25/1 باشد را محاسبه كنيد.