بخشی از مقاله

توزيع‎هاي احتمالي گسسته

مقدمه

در حالي كه اغلب تعيين توزيع احتمالي براي يك متغير تصادفي معين مفيد است، بسياري مواقع در استنباط آماري و تصميم‎گيري توابع احتمالي متغيرها داراي يك فرم هستند. در چنين مواردي استفاده از نظريه توابع احتمالي شرح داده شده در فصل پنجم براي به دست آوردن نتايج كلي در مورد توزيع احتمالي مثل ميانگين و واريانس بهتر است از به دست آوردن اين مشخصه‎ها در هر حالت ويژه. زيراكسل كننده خواهد بود كه در هر مورد جديد با استفاده از توزيع احتمالي يا چگالي، فرايند تعيين مشخصه‎ها مثل ميانگين و واريانس را انجام دهيم. خوشبختانه به اندازة كافي همانندي بين انواع معين از آزمايشهاي منحصر به فرد معلوم وجود دارد، به طوري كه به دست آوردن يك فرمول كه نشان دهندة ويژگي عمومي اين آزمايش‎ها باشد را ممكن مي‎سازد.


در اين فصل بعضي از توزيع‎هاي احتمالي متغيرهاي تصادفي گسسته مثل توزيع‎ةاي دو جمله‎اي، فوق هندسي و پواسن را مطالعه خواهيم نمود و خواص آنها را بررسي مي‎كنيم اين توزيع‎ها از مهمترين توزيع‎هاي گسسته در آمار هستند كه كاربرد زيادي دارند. توزيع‎هاي احتمالي متغيرهاي پيوسته با تأكيد بر توزيع نرمال كه كاملاً شناخته شده است و در آمار استفادة زيادي از آن مي‎شود در فصل هفتم بحث خواهد شد.


آزمايش دو جمله‎اي
بسياري از آزمايشگاه هستند كه داراي يك ويژگي عمومي بوده و آن عبارت است از اينكه نتايج آنها به يكي از دو پيشامد دسته‎بندي مي‎شوند. براي مثال، «آزمايش دسته بندي يك متقاضي شغل كه مرد يا زن است» داراي دو نتيجه مي‎‏باشد، آزمايش پرتاب يك سكه كه نتيجة آن پيشامد شيرآمدن و خط آمدن مي‎باشد. تولد يك نوزاد كه نتيجة آن پسر و يا دختر مي‎باشد. آزمايش انتخاب يك كالاي توليدي كه نتيجة آن تنها به يكي از دو صورت سالم و يا ناقص اتفاق مي‎افتد.


در حقيقت اين امكان هميشه وجود دارد كه نتايج رخدادهايي كه در زندگي روزمره اتفاق مي‎افتد را به صورت دو نتيجه «موفقيت» و يا «عدم موفقيت» شرح دهيم. امتحانهايي كه تنها منتج به دو نتيجه مي‎شوند، نقش بسيار مهمي در يكي از توزيع‎هاي احتمالي گسسته كه كاربرد زيادي در عمل دارد يعني «توزيع دو جمله‎اي» ايفا مي‎كنند.


قبل از اين كه توزيع دو جمله‎اي را معرفي كنيم، آزمايش دو جمله‎اي را شرح مي‎دهيم با توجه به مثالهاي بالا و مثالهايي مثل مصاحبه با يك رأي دهنده كه جواب آن موافق كانديداي مورد نظر است و يا نيست. پرتاب موشك كه نتيجة آن به هدف خوردن و يا به هدف نخوردن است، ملاحظه مي‎شود كه صرف نظر از بعضي از تفاوتها همة آنها داراي يك مشخصة ويژه آزمايش دو جمله‎اي مي‎باشند.


تعريف:
يك آزمايش دو جمله‎اي داراي فرضيات زير است.
1-آزمايش دو جمله‎اي مركب از n امتحان يكسان ساده است.
2-هر امتحان منتج به يكي از دو نتيجه مي‎شود. يك نتيجه را موفقيت و با S نشان داده و نتيجة ديگر را عدم موفقيت و با F نشان مي‎دهيم.
3-احتمال موفقيت در يك امتحان ساده مساوي P است، كه از يك امتحان به امتحان ديگر ثابت باقي مي‎ماند احتمال عدم موفقيت مساوي q=1-P است.
4-امتحان‎ها از هم مستقل مي‎باشند.


5-علاقمند به X، تعداد موفقيتهاي هستيم كه در nبار آزمايش ساده مشاهده مي‎شود. امتحانهاي ساده‎اي كه در اين شرايط صدق مي‎كنند به آزمايش‎هاي «برتولي» معروفند. در عمل فرضهاي بيان شده در يك آزمايش دو جمله‎اي تنها در حالتهاي محدودي وجود دارند، اما مادامي كه هر آزمايش روي آزمايش ديگر اثر ناچيزي داشته باشد مي‎توان نظرية دو جمله‎اي را بكار برد.


براي مثال، احتمال اين كه يك راي‎دهنده موافق كانديداي معيني در يك انتخاب سياسي رأي به دهد تقريباً از يك امتحان به امتحان ديگر ثابت مي‎ماند. مادامي كه جامعة راي دهندگان در مقايسه با نمونه نسبتاً بزرگ باشد. اگر پنجاه درصد جامعه 1000 نفري از راي دهندگان كانديداي A را ترجيح به دهند، آن گاه احتمال موافق بودن اولين مصاحبه شونده به كانديداي A مساوي خواهد بود. احتمال موافق بودن دومين مصاحبه شونده به كانديداي A مساوي يا خواهد بود كه بستگي دارد به اينكه آيا اولين مصاحبه شونده موافق بوده يا مخالف آن.

هر دو عدد نزديك به هستند، در عمل براي سومين، چهارمين و nامين انتخاب هم همين طور است در صورتي كه n خيلي بزرگ باشد. اما اگر تعداد جامعه 10 و تعداد موافق كانديداA، 5 نفر باشند، آن گاه احتمالي اين كه اولين راي دهنده موافق A باشد مساوي و دومين مساوي يا بستگي به اين كه اولي موافق يا مخالف بوده است خواهد بود. بنابراين براي جوامع كوچك، احتمال موافق بودن از يك رأي دهنده به رأي دهنده ديگر (از يك امتحان به امتحان ديگر) به طور محسوس تغيير مي‎كند و نتيجتاً آزمايش دو جمله‎اي نخواهد بود.


توزيع احتمالي دو جمله‎اي
توزيع دو جمله‎اي بوسيلة مقادير n و p كه پارامترهاي توزيع هستند توصيف مي‎شود. پارامتر هر توزيع عبارت است از يك مشخصة جامعه. در توزيع دو جمله‎اي پارامتر n عبارت است «تعداد امتحانها» و p عبارت از احتمال موفقيت در هر امتحان ساده مي‎باشد. براي هر n وp داده شده با توجه به فرضيات آزمايش دو جمله‎اي مي‎توان احتمال هر تعداد موفقيت را حساب كرد و نيز مي‎توان ديگر مشخصه‎هاي توزيع مثل ميانگين و واريانس را هم به دست آورد.


براي نشان دادن اين كه چگونه توزيع احتمالي دو جمله‎اي حاصل مي‎شود،‌فرايند توليد را در نظر بگيريد كه يك وسيلة همانندي توليد مي‎كند كه به دو صورت سالم و يا ناقص دسته‎بندي مي‎شود. وقتي كه فرايند به طور درست كار نكند، احتمال ثابت 10/0=p وجود دارد كه كالا ناقص توليد شود. تعداد ناقص‎ها هر مقداري از 0 تا تعداد آزمودني (n) مي‎تواند باشد. براي مثال، ممكن است سئوال شود، «احتمال اين كه در يك نمونة تصادفي چهارتايي يك نتيجة ناقص باشد چقدر است؟ يا احتمال اين كه دو يا بيشتر در يك نمونة تصادفي چهارتايي ناقص وجود داشته باشد چقدر است؟ كلمة تصادفي معادل مستقل بودن در تعريف آزمون دو جمله‎اي است.


براي محاسبة احتمالات در آزمايش دو جمله‎اي مي‎توانيم از قوانين ضرب احتمال استفاده كنيم. مانند
(يك رويداد) p(تعداد رويدادهاي مربوط)=(پيشامد)p


در يك مسئله دو جمله‎اي، علاقمند به محاسبة احتمال دقيقاً x موفقيت در n تكرار امتحان برنولي هستيم، كه هر امتحان داراي احتمال موفقي p است. به اين معني كه ما x موفقيت و n-x عدم موفقيت داريم. براي محاسبه چنين احتمالهايي، لازم است كه احتمال يك رويداد از اين وع را پيدا كنيم، آن گاه آن را در تعداد ممكن چنين رويدادهايي ضرب كنيم. چون فرقي ندارد كدام رويداد را ابتدا بررسي كنيم، فرضي كنيد به طور اختياري اين رويداد را بررسي كنيم كه در آن x موفقيت ابتدا رخ دهد، ادامه پيدا كند يا n-x (عدم موفقيت). فرض كنيد موفقيت S= و عدم موفقيت F= باشد، بنابراين اين رويداد ويژه به صورت زير مرتب نمود.


SS…S FF…F
n-x عدم موفقيت x موفقيت
براي تعيين احتمال توأم چنين دنبالة ويژه‎اي از موفقيت‎ها و عدم موفقيت‎ها، توجه كنيد كه امتحانها فرض مي‎شوند كه از هم مستقل هستند. چون احتمال يك موفقيت p(S)=p و p(F)=q است، بنابراين داريم.
P(SS…S FF…F)=p(S)p(S)…p(S)p(F)p(F)…p(F)
=(p)(p)…(P)(q)(q)..(q)

مي‎توان نشان داد كه نشان دهندة احتمال هر دنباله‎اي است كه در آن x موفقيت و n-x عدم موفقيت وجود دارد. بنابراين كافي است بدانيم چند رخ داد متفاوتي وجود دارد كه در آن x موفقيت و n-x عدم موفقيت داشته باشيم. جواب عبارت است از تعداد تركيب‎هاي x از n مي‎دانيم اين تعداد عبارت از

بنابراين حاصلضرب در احتمال x موفقيت در n امتحان را با احتمال ثابت موفقيت (p) به صورت زير به دست مي‎دهد.
(6-1) (x موفقيت در n امتحان)p

اين توزيع را توزيع دو جمله‎اي گويند. اگر متغير تصادفي X داراي توزيع دو جمله‎اي با پارامترهاي n و p باشد معمولاً آن را به صورت زير مي‎نويسند.

مثال 6-1 اگر كسر ناقصي توليد يك كالا مساوي 1/0=p باشد، در يك نمونة تصادفي چهارتايي از اين كالاها توزيع احتمالي تعداد كالاهاي ناقص را حساب كنيد.
حل: يك كالاي انتخاب دو صورت خواهد داشت يا سالم است و يا ناقص. احتمال اين كه يك كالاي انتخاب ناقص باشد مساوي 1/0=p كالاهاي انتخابي از همديگر مستقل هستند بنابراين تعداد كالاهاي خراب در نمونه داراي توزيع دو جمله‎اي است. بنابراين توزيع احتمالي تعداد كالاهاي خراب طبق جدول 6-1 خواهد بود.

جدول 6-1: توزيع دو جمله با 4=n و 1/0=p
جمع 4 3 2 1 0 Xتعداد كالاهاي خراب
1 0001/0 0036/0 0486/0 2916/0 6561/0 P(x)

كه در آن احتمال اين كه دقيقاً (1=x) كالاي خراب در نمونة چهارتايي (4=n) وقتي كه 1/0=p باشد، داشته باشيم به صورت زير حساب مي‎شود

با استفاده از جدول 6-1 به سادگي مي‎توان احتمال اين كه تعداد خراب‎ها كمتر يا مساوي 2 باشد را حساب كرد.

مثال 6-2 به منظور عيب يابي در توليد يك نوع كالا كه به مقدار زياد توسط ماشين در كارخانه توليد مي‎شود، با استفاده از طرح نمونه‎گيري، كالاي توليدي بازرسي مي‎شود. ده قلم كالا به طور تصادفي انتخاب و مورد آزمايش قرار مي‎گيرند. چنانچه دو يا بيشتر كالاي ناقص مشاهده شود، كالاي توليدي رد مي‎شود. اگر كل كالاي توليدي دقيقاً 5 درصد ناقص داشته باشد، احتمال اين كه كالا پذيرفته شود چقدر است؟ احتمال اين كه كالا رد شود چقدر است؟
حل: با توجه به شرايط يك آزمايش دو جمله‎اي، مشاهده مي‎شود كه تعداد كالاهاي ناقص در نمونه، x داراي توزيع دو جمله‎اي زير است.

در صورتي كالا پذيرفته مي‎شود كه در نمونه يا خراب مشاهده نشود و يا يكي مشاهده شود بنابراين

آن گاه، احتمال رد كالا عبارت خواهد بود از

مثال 6-3 يك واكسن جديد جلوگيري از سرماخوردگي براي تعيين اثر جلوگيري آن در سرماخوردگي عمومي مورد آزمايش قرار گرفته است. براي اين كار به ده نفر واكسن تزريق كرده و بعد از مدت يكسال مشاهده شده كه هشت نفر زمستان را بدون سرماخوردگي سپري كرده‎اند.
فرض كنيد وقتي كه واكسن استفاده نشود،

احتمال اينكه يك نفر بدون سرماخوردگي زمستان را سپري كند مساوي 5/0 باشد. احتمال اينكه هشت نفر يا بيشتر زمستان را بدون سرماخوردگي سپري كنند بشرطي كه واكسن در افزايش مقاومت بدن در برابر سرماخوردگي موثر نباشد چقدر است؟
حل: فرض كنيد در صورتي كه واكسن مؤثر نباشد، احتمال اينكه يك نفر زمستان را بدون سرماخوردگي طي كند مساوي 5/0=p است. توزيع احتمالي براي x، تعداد سرما نخوره‎ها عبارت است از:

مثالهاي 6-1، 6-2 و 6-3 موارد استفادة توزيع دو جمله‎اي و محاسبة احتمال x موفقيت در n امتحان را با توجه به تعريف آزمايش دو جمله‎اي روشن مي‎ساند.
البته نكتة مهم اين است كه براي هر عمل فيزيكي بايستي دقيقاً مشخصه‎هاي آزمايش دو جمله‎اي بخش 6-2 براي تعيين اينكه آيا مدل آزمايش دو جمله‎اي براي عمل مورد نظر معتبر است تطبيق داده شود.


توجه مي‎كنيد كه مثالهاي فوق مسائلي احتمالي بودند تا آماري. احتمال موفقيت در يك امتحان ساده معلوم است و ما مي‎خواهيم در n امتحان احتمال پيشامدهاي عددي معيني را حساب كنيم. حال روش را بر عكس در نظر مي‎گيريم، به اين معني كه فرض مي‎كنيم يك نمونه از جامعه داريم و مي‎خواهيم راجع به p استنباط بكنيم. شكل فيزيكي مثالهاي 6-2 و 6-3 در صورتي كه هدف نهايي استنباط آماري باشد وضعيت عملي خوبي به دست مي‎دهد از اين دو مسئله در بخش‎هاي آتي در استنباط آماري استفاده خواهيم كرد.


تمرين 6-1 اطلاعات قبلي نشان مي‎دهد كه 30درصد تمام بيماراني كه در يك كلينيك پذيرش مي‎شوند نمي‎توانند هزينة خود را پرداخت كنند. فرض كنيد 4=n بيمار جديد نشان دهندة يك نمونة جديد از جامعة بيماراني باشند كه توسط كلينيك تحت مداوا قرار مي‎گيرند. احتمال اينكه
الف) هيچكدام از بيماران هزينه را پرداخت نكنند.
ب) يك نفر از بيماران هزينه را پرداخت نكند.
ج) تمام بيماران هزينه را پرداخت كنند.


احتمال اينكه تيراندازي در هر شليك تير به هدف بزند مساوي 8/0 است. او چهار تير به هدف شليك مي‎كند، پيدا كنيد.
الف) دقيقاً دو تير به هدف بزند.
ب)لااقل يك تير به هدف بزند.
ج)چهار تير به هدف اصابت نمايد.


6-3 يك روش جديد جراحي 80درصد با موفقيت انجام مي‎شود. اگر عمل جراحي پنج مرتبه انجام شود و فرض كنيم كه عملاً از يكديگر مستقل باشند پيدا كنيد.
الف) احتمال اينكه هر پنج عمل با موفقيت انجام شوند چقدر است؟
ب) احتمالي اينكه كمتر از دو عمل به موفقيت بيانجامد چقدر است؟
ج) فقط چهار عمل با موفقيت انجام شود چقدر است؟


6-4 به تمرين 6-3 مراجعه نمائيد، اگر كمتر از دو عمل با موفقيت همراه بودند در بارة تيم عمل جراحي چه نظري داشتيد؟
6-5 به تمرين 6-3 مراجعه كنيد، اگر x تعداد موفقيت‎ها در عمل‎هاي جراحي باشد، توزيع احتمالي آن را رسم نمائيد.
6-4-ميانگين و واريانس توزيع دو جمله‎اي


مي‎دانيم كه توزيع دو جمله‎اي بوسيلة پارامترهاي n و P مشخص مي‎‏شوند. از طرفي هر توزيعي داراي مشخصه‎هايي است مثل ميانگين و واريانس. بنابراين ممكن است در توزيع دو جمله‎اي، ميانگين و واريانس را نيز بر حسب n وp بدست آورد.


مي‎توان با استفاده از قضاياي مربوط به جمع و با استفاده از مهارت در جابجايي جبري، ميانگين و واريانس متغير تصادفي x كه داراي توزيع دو جمله‎اي با پارامتر pو n است را مستقيماً حساب نمود در اينجا سعي مي‎كنيم اين ويژگي‎هاي توزيع را با استفاده از مثالهاي ساده حساب كرده و آن گاه در حالت كلي تعميم دهيم. براي n=1، توزيع احتمالي x عبارت از
1 0 X
P Q P(x)
با توجه به تعريف اميد رياضي، داريم

و براي 2=n، توزيع احتمالي عبارت است از
2 1 0 X
2p Pq2 2q P(x)

براي 3=n با توجه به توزيع احتمالي x داريم

مي‎توان حدس زد كه نتيجه در حالت كلي نيز برقرار است. در واقع مي‎توان با استفاده از قضاياي رياضي نشان داد كه اميد رضاي x در توزيع دو جمله‎اي با n امتحان با پارامتر p، برابر است با

به همين طريق مي‎توان واريانس x را براي 2و1=n امتحان به دست آورد. براي 1=n

براي 2=n

با جايگذاري q=1-p، خواهيم داشت

به سادگي مي‎توان نشان داد كه براي 3=n، واريانس مساوي pq3 است. در حالت كلي براي n امتحان و با پارامتر p، مي‎توان استنباط نمود كه واريانس و انحراف معيار برابر است با

و

مثال 6-4 در يك فرايند توليد كه كالاي همانندي توليد مي‎شود، 10% كالاهاي توليدي ناقص هستند در انتخاب 20 نمونه تصادفي كالا از اين فرايند، ميانگين و واريانس و انحراف معيار تعداد كالاهاي ناقص را حساب كنيد.
حل: فرض مي‎كنيم مقدار كالاهاي ناقص در نمونه باشد =x
واضح است كه
بنابراين،

تمرين
6-6 به تمرين 6-1 مراجعه نمائيد، مي‎دانيم كه 30 درصد بيماران پذيرش شده قادر به پرداخت هزينة بيمارستان نيستند. اگر در طول زمان يكسال 2000 نفر در بيمارستان معالجه گردند حساب كنيد.
الف) ميانگين افرادي كه قادر به پرداخت صورتحساب بيمارستان نيستند چيست؟
ب) واريانس و انحراف معيار اين تعداد را حساب كنيد.


6-7 يك آزمون داراي 15 سوال است كه هر سوال داراي چهار جواب احتمالي بوده كه فقط يكي از آنها درست است. شخصي به طور شانسي علامت مي‎زند، مطلوبست محاسبة
الف) ميانگين تعداد جوابهاي درست


ب) احتمال اينكه به 8 تا 10 سوال جواب درست به دهد چقدر است؟
6-8اگر متغير تصادفي x داراي توزيع دو جمله‎اي با ميانگين 5/2 و واريانس 25/1 باشد را محاسبه كنيد.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید