متغيرهاي تصادفي گسسته و توزيع هاي احتمال

طبق علم آمار ما بايد به نتايج آزمايشات مقادير عددي اختصاص دهيم حتي هنگامي كه آنها كيفي هستند .

تمرين ۱ ) هنگامي كه يك شاخه از موردي را براي تشخيص تناسب ناقص بررسي مي كنيم ، بنابراين ‌‌‍‌[ n , d ‍ ‍‍‍‍‍‍‍‍‍‍‍‍‌‌‌ برآمد هاي ممكن از بررسي يك مورد است كه مجموعه O را براي d و I را براي N در نظر مي گيريم .

۱ . تعريف اساسي

متغيرهاي تصادفي قانوني است كه يك عدد را به هر برآمد S مربوط مي سازد .
علامت اختصاري r.v يا rv اغلب براي نشان دادن متغيرهاي تصادفي به كار مي رود .

اصطلاحات علمي و نمادگزاري :

محمل متغير تصادفي r مجموعه همه مقادير ممكن است كه r م يتواند فرض كند . ما اغلب مجموعه محمل را با R نشان مي دهيم .

r.v گسسته :
اگر متغير تصادفي r داراي مجموعه محمل R باشد كه مجموعه متناهي يا شماراست ، آنگاه r را متغير تصادفي گسسته مي ناميم .
يك متغير تصادفي پيوسته اگر مجموعه محمل شامل يك بازه يكپارچه روي محور اعداد باشد .

ساده ترين متغير تصادفي فقط مقادير ۱ , ۰ را مي گيرد كه متغير تصادفي برنولي ناميده مي شود . متغير تصادفي ( rvs ) در متعاقب اين سه نمونه ، گسسته rvs مي باشد آنها همگي با آزمايشات برنولي مرتبط اند .

تمرين ۲ ) ۲۰ بيمار كه دل درد دارند بطور تصادفي براي يك نمونه معالجه انتخاب شده اند .
تعداد بيمارهاي يافت شده سه ماه بعد از معالجه X =

تمرين ۳ ) بيماران ميتلا به دل درد در يك زمان مشخص بعد از معالجه ويژه معاينه مي شوند تا زماني كه اولين بيمار غير بهبود يافته پيدا شود .
تعداد بيماران معاينه شده X =

تمرين ۴ )

۲ . توزيعهاي احتمال براي R.V.S گسسته :

توزيع احتمال يا تابع جرم احتمال ( pmf ) متغير تصادفي گسسته X به وسيله
براي هر x تعريف مي شود .

يك ليست از مقادير ممكن X با احتمال وابسته به آن توزيع احتمال X را بدست مي دهد . pdf براي r مي تواند يك فرمول ، جدول يا شكل را بدست دهد .
خلاصه : توزيع احتمال براي يك متغير تصادفي گسسته r شامل دو بخش است .
A ) R ، مجموعه پشتبان r
B ) براي هر عدد R y 
بنابراين ، گزاره هاي زير بايد درست باشند . ( براي توزيع احتمال معتبر )
۱)

تمرين ۵ ) براي يك متغير تصادفي برنولي توزيع احتمال ممكن است به صورت زير باشد :

اگر آزمايش بررسي يك مولفه اي باشد و D = 0 و ND = 1 به روشني يك كلاس بي عيب از توزيع احتمال برنولي وجود دارد . آنها همگي به شكل

كه P = P ( 1) = P ( x = 1 )
به عبارت ديگر توزيع احتمال برنولي به طور كامل از مقادير پارامتر P تعيين مي شود .

پارامتر يك توزيع احتمال :
فرض كنيد كه P ( X ) به يك مقدار وابسته باشد كه مي تواند هر يك از مقادير ممكن را تعيين كند ، كه هر يك با مقادير معين مختلف يك توزيع احتمال متفاوت است چنين مقاديري پارامتر توزيع ناميده مي شوند . مجموعه همه توزيعها با همه پارامترهايشان يك خانواده از توزيع ها ناميده مي شوند .

تمرين ۶ ) آزمايش تمرين ۲ را ملاحظه كنيد . بنابراين

تعداد بيماران كشف شده از ميان n = 20 مورد است . X =

به وضوح K = 0 , 1 , ………. , n است .
اين آزمايش دو جمله اي ناميده مي شود و x يك متغير تصادفي دو جمله اي است . بعداً خواهيم ديد كه هر بيمار كشف شده با احتمال p مستقل از ديگر بيماران است .

پس توزيع احتمال x بطور كامل از پارامتر هاي n و p تعيين مي شود .
تابع توزيع تجمعي ( cdf ) اغلب به صورت تناوبي از توصيف يك توزيع احتمال است . در عوض از ليست كردن احتمالات هر مقدار ممكن x ، ليست احتمالات تجمعي بدست مي آيد.

تمرين ۷ ) توزيع احتمال را ملاحظه كنيد :

احتمالات تجمعي هستند .

تعريف : cdf متغير تصادفي گسسته x بصورت زير است :

نمودار cdf از توابع پله اي است .

تمرين ۸ ) آزمايش تمرين ۳ را ببينيد . مقادير ممكن v = 1 , 2 , ….. است . در اينگونه موارد توزيع احتمال x اغلب به صورت قراردادي به وسيله فرمولهايي توصيف مي شود ( براي pmf يا cdf ) . فرض كنيد كه p احتمال ناقص آيتم باشد . پس طبق حالت مفروض در تمرين ۶ ، pmf به صورت زير است
همچنين تحت فرضيات مشابه ، cdf نيز
( تمرين ۳٫۱۲ را براي صادق بودن آخرين تساوي ببينيد )
تذكر : pmfبه سادگي از cdf نتيجه مي شود

.

۲٫۱ . تعداد اميد ( يا ميانيگين عمومي ) متغير هاي تصادفي گسسته .
اتصال آماري :
هنگام استفاده از آمار ، مقدار اميد E ( X ) بعضي اوقات ميانگين x ناميده مي شود . ممكن است از علامت  يا x از بحث هايمان استفاده كنيم . بنابراين E ( X ) =  = x . در دستگاه آماري ، x اغلب يك پارامتر عمومي را نشان مي دهد كه ما مي خواهيم تخمين بزنيم . تعريف دقيق x در زير است:
تعريف : اميد رياضي متغيرهاي تصادفي گسسته كه با E ( X ) يا x نشان داده مي شود چنين است :
بعبارت ديگر تعداد اميد براي متغيرهاي تصادفي گسسته ، يك وزن ميانگين ا ز مقادير ممكن معتبر مي تواند فرض شود ، كه هر مقدار به وسيله احتمال متناظر به آن وزن دار شده است .

رياضيات مجزا :
در محاسبات اميد متغير هاي گسسته در صورتي موجود است كه سيگما فوق همگرا باشد يعني در غير اينصورت

تمرين ۹ ) براي يك متغير تصادفي برنولي x با پارامتر p :

تفسير اميد رياضي با مثال :
تمرين : فرض كنيم x برآمدهاي يك جفت تاس باشد ( برآمدهايي كه هنوز اتفاق نيفتاده اند ) پس
فرض كنيد كه تاس ۱۰۰ مرتبه پرتاب شود و فرض كنيم كه x1 , x2 , ……. , x100 برآمد ها را نشان دهد . چرا رابطه اي ميان E(X) و وجود دارد ؟ براي جواب به اين سؤال فرض كنيد كه ۱۰۰ پرتاب داشته ايم و جدول فراواني زير بدست آورده است .

i fi pi = pi = p ( x = i)

۱ ۱۷ ۰٫۱۷ ۰٫۱۶۶۶
۲ ۱۶ ۰٫۱۶ ۰٫۱۶۶۶
۳ ۱۹ ۰٫۱۹ ۰٫۱۶۶۶
۴ ۱۴ ۰٫۱۴ ۰٫۱۶۶۶
۵ ۱۵ ۰٫۱۵ ۰٫۱۶۶۶
۶ ۱۹ ۰٫۱۹ ۰٫۱۶۶۶

و اكنون

بنابراين به n و برآمد هاي خاص وابسته است . از طرف ديگر
بنابراين E(X) بهn يا برآمدها وابست نيست .

تمرين ۱۱ ) يك كتابفروشي سه سري فتوكپي از يك كتاب با قيمت هر كدام ۶ دلار كه براي فروش به قيمت ۱۲ دلار عرضه مي شوند . كپي هاي فروخته نشده با ۲ دلار برگشت مي خورند . فرض كنيم x كپي هاي فروخته شده و Y سود خالص خالص باشد بنابراين

اگر pmf به اين صورت باشد ( براي x )

پس
و pmf براي Yبه صورت

بنابراين
قواعد تعداد اميد :
قضيه ۱ ) فرض كنيم Y = h (x) . پس
قضيه ۲ ) اگر تابع h (x) خطي باشد يعني= ax + b h (x) كه a و b ثابتند . بنابراين

تمرين ۱۲ ) دستگاه تمرين ۱۱ را ملاحظه كنيد . اينجا Y = 10 x – ۱۲ . ما قبلاً داشتيم كه = ۲٫۱ E(X) . بنابراين E (Y) = 10 (2.1) – ۱۲ = ۹

۲٫۲ ) واريانس متغيرهاي تصادفي گسسته :
تعداد واريانس متغير ها ( يا پراكندگي ) در توزيعها . كه بصورت زير تعريف مي شود
مجذور ۲ ،  انحراف استاندارد x ناميده مي شود . ( مي توانيد x يا  نوشته شود ) يك فرمول كوتاه براي ۲ چنين است
تمرين ۱۳ ) فرض كنيم x برنولي با پارامتر p باشد

. چونكه
بنابراين
ويژگي هايي درباره واريانس و انحراف استاندارد :
۱ ) ۰ var ( Y )
2 ) v ( Y ) = 0 اگر و فقط اگر متغير تصادفي Y يك توزيع تباه شده باشد . يعني همه جرم احتمال در يك نقطه باشد .
۳ ) var ( Y ) بزرگتر يعني انحراف بيشتر مقادير Y از ميانگين .
۴ ) var ( Y ) در ۲ ( يكه ) اندازه گيري شده و انحراف استاندارد (Y) ( SD(Y) ) در يكه اصلي اندازه گيري شده .
تمرين ۱۲ ) براي دو متغير تصادفي x و Y با pmf هاي
Var(x) و var(Y) را محاسبه كنيد .

حل : اولي :
بنابراين هر دو متغير تصادفي داراي ميانگين صفر هستند اكنون
بنابراني Y داراي واريانس بزرگتر ( و انحراف استاندارد بزرگتر ) از x است .
روش كوتاه براي محاسبه واريانس : فرض كنيد Y يك متغير تصادفي باشد . ( لازم نيست كه گسسته باشد ) با pmf ياpdf ، بنابراين
اثبات :
خواص واريانس : فرض كنيم كه Y يك متغير تصادفي ( نه لزوماً گسسته ) و فرض كنيد كه a و b ، ثابتهاي حقيقي اند. پس
اثبات : تمرين

.
از نتيجه بالا ، يك نتيجه فوري اينست كه var ( b) = 0 است براي هر مقدار ثابت b اين مستقيماً بدست مي آيد . واريانس يك اندازه گيري پراكندگي متغير هاست . يك مقدار ثابت مثل b هيچ پراكندگي ( تغييري ) ندارد .
۳ . تابع مولد گشتاورها :
اصطلاحات : فرض كنيم كه Y يك متغير تصادفي گسسته با pdf ، PY (y) باشد . تابع مولد گشتاور ها براي Y ، MY ( t ) به وسيله
تذكر :
• تابع مولد گشتاورها از اين پس با mgf نشان داده مي شود . از آناليز رياضي اين نتيجه بدست مي آيد كه اگر mgf وجود داشته باشد ، ابزاري براي محاسبه گشتاور E ( YK) است .
• Mgf مي تواند به ما در بدست آوردن توزيع احتمال كمك كند چون اگر mgf وجود داشته باشد ، يكتاست . بنابراين اگر دو متغير تصادفي mgf مشابه داشته باشند ، داراي توزيع احتمال مشابهند !

بهر حال ، اين براي تفكر از مورد mgf مانند يك ” اميد ويژه ” كفايت مي كند البته در صورت وجود ، مولد گشتاور ها . اين در عكس به ما در محاسبه ميانگين و واريانس متغير تصادفي كمك مي كند .
قضيه : فرض كنيم كه Y يك متغير تصادفي را نشان دهد (نه لزوماً گسسته) با mgf ،MY(t) پس

تذكر : در بالا متذكر مي شويم كه مشتقات از t گرفته شده اند .
۴ ) توزيع دوجمله اي :
تعداد زيادي از آزمايشات عبارتند از يك دنباله از آزمايشات كه هر آزمايش مي تواند نتيجه پيروزي يا شكست داشته باشد . ( يعني فقط دو برآمد ممكن است براي هر آزمايش بدست آيد .) اگر
I ) اگر وجود داشته باشد n آزمايش ( كه n ثابت است )
II ) آزمايشات مستقلند .

III ) احتمال موفقيت كه نشان داده مي شود با p ، ( ۰ < p < 1 ) ثابت است از آزمايشي به آزمايشي ديگر .
پس ما اين آزمايشات را يك آزمايش دوجمله اي مي ناميم .
تذكر : هر آزمايش يك آزمايش برنولي است .

اصطلاحات : با يك دنباله از n آزمايش برنولي ، فرض كنيم كه Y تعداد موفقيتها باشد . ( out of n ) . Y را يك متغير تصادفي دو جمله اي مي ناميم و مي گوييم Y يك توزيع دوجمله اي با پارامترهاي n ( تعداد آزمايشات انجام شده ) و احتمال موفقيت p .
كه آخرين جمله را به اين صورت خلاصه نويسي مي كنيم

تمرين ۱۳) هر يك از حالات زير آزمايش دو جمله اي را نشان مي دهد . ( آيا تو فرض دوجمله اي بودن را در هر آزمايش مناسب مي بيني ؟ )
۱ ) فرض كنيم كه يك سكه سالم را ۱۰ بار پرتاب كنيم و Y تعداد آزمايشات در ۱۰ پرتاب باشد . در اينجا
۲ ) در يك سري آزمايشات ، ۴۰ درصد از همه رسمها به يك رفتار مشخص جواب مي دهد. چهار رسم از سرزميني رفتار فوق الذكر را دارا باشد . اگر Y تعداد رسمهايي كه به رفتار جواب مي دهند باشد ،

پس
۳ ) در يك شهر بزرگ آفريقا ، نرخ شيوع HIV حدوداً ۱۲ درصد است . فرض كنيم كه Y تعداد مبتلايان به HIV را در يك نمونه ۵۰۰ نفري نشان دهد پس
۴ ) مي دانيم كه پيچهاي توليد شده توسط يك كارخانه با احتمال ۰٫۰۰۱ معيوبند . فرض كنيم Y تعداد پيچهاي معيوب را در بسته ۴۰ تايي نشان دهد . پس
تمرين۱۴ ) توضيح دهيد كه چرا آزمايشات ذيل آزمايشات دوجمله اي نيستند .

۱ ) من سه كارت از يك دسته معمولي مي كشم و Y تعداد آنها است . بدون جايگذاري
۲ ) يك زوج تصميم مي گيرند كه بچه داشته باشند تا زماني كه دختري متولد شود . Y تعداد فرزندان زوج را نشان مي دهد .
۳ ) در يك نمونه ۵۰۰ نفري ، Y سن هر شخص را نشان مي دهد .

۴ ) يك شيميدان يك تست حلاليت را ۱۰ دفعه روي يك ماده مشابه انجام مي دهد . هر قسمت در يك دماي ۱۰ درجه اي بيشتر از آزمايش قبلي انجام مي شود . Y نشان دهنده تعداد دفعات است كه ماده كاملاً حل مي شود .
ما اكنون pdf يك متغير تصادفي دوجمله اي را بدست مي آوريم . براي اينكار ، به PY(y) براي هر تعداد Y نياز داريم . يادآور مي شويم كه Y تعداد موفقيتها در n آزمايش برنولي است و p احتمال موفقيت در هر آزمايش است . چگونه مي توان موفقيت دقيق y را بدست آوريد ؟
با موفقيت = S و شكست = F .

يك برآمد ممكن است S S F S F S S F ……..S F باشد .
با استقال آزمايشات احتمال اينكه هر ترتيب خاص از y موفقيت و n-y شكست بصورت p y ( 1 – p ) 1-y است . اكنون به چند طريق مي توان y موفقيت را از n آزمايش انتخاب كرد ؟ ( yn ) راه براي انجام آن وجود دارد . با استقلال آزمايشات و قاعده ضرب pdf را براي Y چنين بدست مي آوريم كه ، ۰ < p < 1
تمرين ۱۵) در يك كلينيك كوچك آزمايشي با ۲۰ مريض انجام شد .

فرض كنيم كه Y نشان دهنده بيماراني كه به يك درمان جديد خارش پوست واكنش داده اند باشد . فيزيكدانان فرض مي كنند كه بيماران از يكديگر مستقلند كه p نشان دهنده احتمال واكنش نشان دادن به درمان باشد. در يك مسئله آماري ، p ممكن است يك پارامتر نامشخص قابل تخمين باشد . براي اين مسئله ما فرض مي كنيم كه p=0.7 باشد . مي خواهيم اولاً p ( Y= 15 ) و ثانياً ۱۵ ) p ( Y ، ثانياً ( ۱۰ Y ) p را محاسبه كنيم .

حل :
( مجبوريم ۶ دفعه از pdf دو جمله اي استفاده كنيم و نتايج را با هم جمع كنيم . بجاي محاسبه بطور مستقيم ، مي توان نوشت
( قائده متمم )
ما اين را انجام مي دهيم چونكه WMSS ضميمه III ( صفحات ۷۵۸-۷۸۳ ) شامل جدول احتمالات دو جمله اي به شكل y ) p ( Y است براي متغيرهاي p, n در حقيقت با n=20, p=0.7 طبق ضميمه= ۰٫۵۸۴ ۱۴) p ( Y بنابراين

۱۵) = ۱ – ۰٫۵۸۴ = ۰٫۴۱۶ p ( Y

P ( Y < 15 ) = p ( Y 9 ) = 0.017

ميانگين واريانس توزيع دو جمله اي ، فرض كنيد كه پس

تمرين ۱۴ ) فرض كنيد كه ۷۵% از مشتريان يك فروشگاه مشخص از كارت اعتباري استفاده مي كنند . فرض كنيد كه Y نشان دهنده تعداد استفاده از كارت اعتباري را در ۱۰ خريد نشان دهد . پس و ميانگين خريدها با كارت است .
چريانس نيز همچنين طبق ضميمه III

تذكر:
۱ ) هنگامي كه n=1 است pdf دو جمله اي به توزيع بونولي ساده شده است هنچنين نشان خواهيم داد كه يك توزيع دوجمله اي با شكل سيگماي متغير هاي تصادفي برنولي مستقل قابل تغيير است .
۲ ) فرض كنيد كه هر آزمايش نتيجه S يا f مي تواند داشته باشد . اما نمونه برداري بدون جايگذاري از يك جمعيت N تايي است . اگر اندازه نمونه n بيشتر از ۵% جامعه باشد ، آزمايش مانند يك آزمايش دو جمله اي در نظر گرفته شود .

۵ ) توزيع فوق هندسي
يك مجموعه N تايي از اشياي مشابه داريم ( مانند افراد ، بازي پوكه ، نقشه سرزمين ، …) فرض كنيم كه دو كلاس دو بخشي داريم . براي مثال
بازي پوكه : قرمز / آبي
افراد : آلوده ، غير آلوده

نقشه هاي سرزمين : پاسخ داده به رفتار يا پاسخ نداده
ما بايد مشابه با تعلق شي به يك كلاس خاص ، احتمالات را محاسبه كنيم . اگر r به كلاس تعلق داشت بگوييم ، پس N-r شي به كلاس ۲ تعلق دارد .
تذكر : اين نوعي از مقدمه چيني هاي دو جمله اي مشابه است . بهرحال ، تفاوت با اين حالت در اينست كه سايز جامعه ، N ، متناهي است . ( بودن در مدل دوجمله اي مفروض است ) در اين مورد ، اگر نمونه گيري بدون جايگزاري باشد ، پس احتمال موفقيت از يك آزمايش ديگر تغيير مي كند . البته ، مفروضات مدل دوجمله اي از اين بيشتر است .

اصطلاحات : يك مجموعه از n شي نمونه ( با تصادف و بدون جايگذاري ) از يك جامعه N تايي ( n N ) . فرض كنيم كه Y داراي توزيع فوق هندسي است و مي نويسيم
مجموع همه اشياء = N
) موفقيت ) تعداد اعضاي كلاس اول = r
) شكست ) تعداد اعضاي كلاس دوم = ( N-r )
تعداد اعضاي نمونه = n
Pdf براي r بصورت زير است

تمرين ۱۵) يك تهيه كننده ، قطعات كشتي بيش از ۲۵ قطعه به ديگر شركتها مي فرستد . دريافتهاي يك شركت با طرح ساده زير انجام مي شود .
« نمونه گيري ۵ تايي تصادفي ، بدون جايگذاري انجام مي شود . اگر هيچ قطعه معيوبي در نمونه نباشد ، همگي دريافت مي شوند در غير اينصورت همگي برگشت مي خورند .»
فرض مي كنيم كه Y نشان دهنده تعداد قطعات معبوب در نمونه باشد . ( يعني out of 5 ) پس
كه r نشان دهنده تعداد قطعات معيوب است .

كه p =نشان دهنده تناسب مناسب قطعات معيوب در بقيه است . علامت oc نشان دهنده احتمال پذيرش هنگي ( كه البته تابعي از p است ) است . ملاحظه كنيد جدول صفحه بعد را ( كه همگي عبارات احتمالهاي بالا هستند كه محاسبه شده اند ) .
تذكر : نمودار oc (p) در برابر p گهگاهي يك منحني oc ناميده مي شود .
البته همچنانكه r ( يا بطور معادل p ) افزايش مي يابد ، احتمال پذيرش افزايش مي يابد .

پذيرش نمومه يكي از بزرگترين بخشهاي فرآيند كنترل آمادگي است . بويژه ، در سايزها خيلي بزرگتر ( N = 1000 و غيره ) و اصوات توسعه يافته رياضيات ، طرحهاي نمونه بسيار سخت است براي اجتناب از قطعات معيوب توليد شده .

r p oc(p)

۰ ۰ ۱٫۰۰
۱ ۰٫۴۴ ۰٫۸۰
۲ ۰٫۰۸ ۰٫۶۳
۳ ۰٫۱۲ ۰٫۵۰
۴ ۰٫۱۶ ۰٫۳۸
۵ ۰٫۲۰ ۰٫۲۹
۱۰ ۰٫۴۰ ۰٫۰۶
۱۵ ۰٫۶۰ ۰٫۰۱

روابط با دوجمله اي :
طبق تذكر ابتدائي ، توزيع هاي دوجمله اي و فوق هندسي مشابهند . تفاوت اساسي در آزمايشات دوجمله اي ، p از آزمايشي به آزمايش ديگر تغيير نمي كند . اما در فوق هندسي تغيير مي كند و قابل ملاحظه تر است اگر N كوچك باشد . اگر N بزرگ شود ، محاسبه توزيع دوجمله اي كه p = و كاملاً تقريبي است به وسيله محاسبات فوق هندسي به ويژه، اگر n بيشتر از ۵% جامعه ( N ) باشد ما مي توانيم متغير تصادفي فوق هندسي را با متغير تصادفي در جمله اي تقريب بزنيم . ميانگين و واريانس توزيع هاي فوق مهندسي بصورت زير است :

تذكر : اگر مجموعه p =( احتمالات S ) پس E(X) شبيه دوجمله اي است كه var (x) تفاوتش با دوجمله اي در است . ضريب ، ضريب صحيح جامعه متناهي ناميده مي شود .

تمرين ۱۶) ۱۲ يخچال به شكرت برگشت خورده است چونكه صداي نوسانات زياد بوده است . فرض كنيد كه ۴ تا از ۱۲ تا كمپرسور معيوب دارند و كمتر خاموش مي شوند . اگر ۶ مورد تشخيص داشته باشيم و x تعداد كمپرسورهاي معيوب پيدا شده باشد . پيدا كنيد :
P(x=3) , E(x) , var(x) , N =12 , n= 6

حل :

۶ ) دو جمله اي منفي :
اصطلاحات : تصور كن يك تجربه را كه آزمايشات برنولي در آن به صورت پيوسته هستند اگر Y نشان دهنده تعداد آزمايشات تا زماني كه rth موفقيت رخ دهد ، ۱ r، پسY يك توزيع دوجمله اي منفي با پارامترهاي p, r دارد ، p نشان دهنده احتمال موفقيت در هر آزمايش است ، ۰< p <1 گهگاهي اين توزيع به صورت

نوشته مي شود . pdf براي Y به وسيله

هنگامي كه r=1 باشد x متغير تصادفي هندسي ناميده مي شود . منطق شكل گيري PY(y) در زير آورده شده است .
اگر rth موفقيت رخ دهد در yth امين آزمايش ، پس r1 موفقيت بايد در طي y1 آزمايش رخ دهد . مجموع تعداد نقاط مشابه ( در زير فضاهاي فضاي s ) كه اين همان ضريب دوجمله اي ( ) است كه شمارنده تعداد راههايي كه تو مرتب مي كني r-1 موفقيت و y-r شكست را در اولين y-1 آزمايش مي باشد .
احتمال هر ترتيب خاص ، با استقلال ، به وسيله pr-1 ( 1-p )y-r بدست مي آيد .

اكنون در yth آزمايش ما rth موفقيت را مشاهده مي كنيم ( اين با احتمال p رخ مي دهد ).
اميد و واريانس توزيع دوجمله اي منفي ( آنها مي توانند با هر يك از تعريف ها يا فرمول كوتاه تابع مولد گشتاور بدست آيد ) :

رابطه با دو جمله اي : متذكر مي شويم كه در يك آزمايش دو جمله اي ، x تعداد آزمايشات برنولي است .

تمرين ۱۹ ) بر پايه تذكر ۹ پيدا كردن احتمال اينكه از ۱۰ آزمايش ۳ موفقيت كسب كنيم همچنين متوسط تعداد آزمايشات لازم براي بدست آوردن سه موفقيت را بدست آوريد .
حل : p= 0.04 , r = 3

متوسط تعداد آزمايشات لازم براي بدست آوردن سه موفقيت بصورت

۷ ) فرايند پواسن :
۷٫۱ . توزيع پواسن به اين مدلهاي توزيع تصادفي پيشامد حوادث در فضا يا يك مدت زمان است . فرض كنيم x تعداد پيشامدها در يك زمان يا يك ناحيه است . مقادير ممكن x اعداد ۰,۱,۲,….. هستند .
تعريف : متغير تصادفي A به توزيع پواسني گفته مي شود كه اگر pmf آن به وسيله

بدست آيد .
Cdf اغلب از جدول شماره ۳ در آخر متن كتاب بدست مي آيد .
مثالهايي براي متغير تصادفي پواسن : ( يعني حالاتي كه يك مدل احتمال پواسن جوابگو است . )
• شمردن تعداد افراد يك جامعه كه در يك قرن زيسته اند .
• شمردن تعداد مشتريان كه در يك روز وارد مغازه مي شوند .

• شمردن تعداد ذرات شمارش شده از يك ماده راديو اكتيو در يك دوره زماني .
• شمردن تعداد زمين لرزه هاي كاليفرنيا در يك سال مفروض .
• شمردن تعداد شكلاتها در يك كلوچه .
تمرين ۱۶ ) تعداد ماشينهاي هفتگي در يك بزرگراه داراي توزيع پواسن با ۲٫۲ = است . در يك هفته مفروض ،احتمالات زير چگونه است .
a) هيچ ماشيني مشاهده نشود .
b) دقيقاً يك ماشين مشاهده شود .
c) بيشتر از يك ماشين مشاهده شود .
d) حداقل يك ماشين مشاهده شود .

حل :

تقريب احتمالات برنولي :
اگر Y دوجمله اي با n خيلي بزرگ ( ۱۰۰ ) و p كوچك ( ۰٫۰۱ ) . بنابراين ۲۰ p، اين احتمال مي تواند تقريبي از يك توزيع پواسن باشد :

تمرين ۱۷ ) به واسطه نقص در يك سري از ماشينهاي شركت ، n = 10000 ماشين فراخوان شدند . فرض كنيم كه p=0.0005 احتمال ناقص بودن يك ماشين باشد و فرض كنيم كه Y تعداد ماشينهاي ناقص باشد . ۱۰) Y)p و p(Y=0) را بيابيد .
جواب : بنويسيد ۱۰) p(x ~ 10) p(Y كه x داراي توزيع پواسن باپارامتر =np=5 است . بنابراين از جدول پواسن و