آمار و احتمال

تخمين پارامترهاي احتمال:

با توجه به بحث انجام شده دردرس ۳ ، پايه قانون PFS شامل تئوري فازي است كه نتايج چندگانه اي دارد . هر نتيجه به يك پارامتراحتمال مربوط مي شود . اين درس به احتمال تخمين پارامترها درPFS مربوط مي شود . در اين درس فرض بر اين است كه هم مقدمه وهم نتيجه mfsبه يك اندازه تعيين كننده هستند واحتياجي به بهينه سازي بيشتر نمي باشد . طبقه بندي مسئله ها وتخمين mfs دردرس ۵ ملاحظه مي شود. دردرس۱۶و۱۸و۳۴ پارامترهاي احتمال به وسيله تئوري فازي تخمين زده مي شوندو براي تخمين احتمالات شرطي ازفرمولهاي اماري استفاده مي شود (همانطور كه دردرس ۳۵ مي بينيم ) اين روش براي

تخمين پارامترهاي تخمين است وهمچنين درياداوري نظريه ها به روش احنمال شرطي اشاره مي كند . دراين درس نشان خواهيم دادكه روش احتمال شرطي كلا نتيجه بهينه ودقت مورد تاييدي دردوره هاي PFS نمي دهد . متناوبا هدف اين است كه ازحداكثر احتمال درست نمايي معيار ML براي تخمين پارامترهاي

احتمالي PFS استفاده شود . درادامه اين درس الگوهايي وجود دارد . درقسمت (۱-۴ ) روش احتمال شرطي براي تخمين پارامترهاي احتمال در PFSمورد بحث قرار مي گيرد. همچنين نشان خواهيم داد هم مسئله ها ي طبقه بندي وهم مسئله هاي برگشتي كه به وسيله پارامترهاي احتمال تخمين زده مي شوند روش احتمال شرطي غيرواقعي ، غيرواقعي مجانبي ، و ناهماهنگ مي باشند كه معيارهاي ML را پاسخگو نمي باشند . در قسمت (۲-۴) براي تخمين

پارامترهاي احتمال در PFS معرفي يك روش جديد هدف مي باشد . اين روش بر پايه معيار ML مي باشد . همچنين در قسمت ۲-۴نمونه هايي ازبهينه سازي مسئله كه نتيجه معيار MLمي باشد مورد بررسي قرار مي گيرد . توجه كنيد كه درتوصيف ازمايشها دردرس۵ روش احتمال شرطي وروش ML به صورت تجربي به وسيله ارتباط ان روشها با مسئله هاي عددي طبقه بندي شده با هم مقايسه مي شوند.

 

۱-۴ : روش احتمال شرطي
اجازه دهيد(X1,Y1) , … Xn,Yn) ,) نشان دهنده نمونه هاي تصادفي از جامعه n باشند اين نمونه ها براي تخمين Рr(C|A) استفاده مي شوند . احتمال شرطي رخداد C به شرط رخدادA به وسيله فرمول اماري زير محاسبه مي شود :

(۱٫ ۴)

كه وظايف مشخصه هاي XA ,Xc نشان داده مي شوند به وسيله :

(۲٫ ۴)

(۳٫ ۴)

حالافرض كنيد به جاي پديده هاي معمولي Aو C پديده هاي فازي جايگزين شوند .
اين به اين معناست كه به وسيله mfs پديده هاي A,C به µA وμC تعريف شوندو
به جاي XΑ،Xc در معادله ۴٫۱ جايگزين شوند . در نتيجه خواهيم داشت :
(۴٫۴)
اين فرمول پايه تعريف احتمال رخداد در پديده فازي مي باشد ( درس ۳۷ ) .
مشتق اول فرمول ۴٫۴ درسهاي ۳۵و۳۶ را پديد مي آورد .
نتيجه فرمول ۴٫۴ در تخمين پارامترهاي شرطي درPFS استفاده مي شود . اين ديدگاه دردرسهاي ۱۶و۱۸و۳۴ دنبال مي شود كه به روشهاي احتمال شرطي در اين تز اشاره
مي كند .
فرض كنيد مجموعه اطلاعاتي شاملn نمونه به صورت ( (i=1,2, …,n) ( Xi,Yi
براي تخمين پارامترهاي احتمال در دسترس باشد همچنين فرض كنيد كه هم مقدمه وهم نتيجه mfs درسيستم تعيين شده است ونياز به بهينه سازي بيشتر نمي باشد يعني فقط پارامترهاي احتمال درتخمين باقي بمانند . به نظر منطقي مي آيد كه پارامترهاي Pj,k واقعي رابراي تخمين احتمال شرطي پديده فازي Ck به شرط رخداد پديده فازي Aj قرار دهيم . اگرچه ورودي X به تعريف بيشتر احتياج ندارد اما براي نشان دادن غير عادي بودن محاسبات mfµAj وmfµ¯Aj بايد ازفرمول زيراستفاده شود :
(۴٫۵)
بنابراين Pj,k واقعي است و براي تخمين احتمال شرطي پديده فازي Ck ونشان دادن غير عادي بودن پديده فازي Aj بايد ازآن استفاده شود .
توجه داشته باشيد كه PFSs براي نمونه هاي برگشتي يك قانون پايه دارد كه فقط با همان قانون كه در پارامترهاي شرطي Pj,k استفاده مي شود ودرفرمول ۴٫۵ نشان داده شده هيستوگرامهاي فازي مورد بحث دردرس ۲ را معادل سازي مي كند .
درPFS براي نمونه هاي طبقه بندي درهرطبقه Ck به صورت يك خروجي جديد نشان داده مي شود پس فرمول ۴٫۵ به صورت زير هم نوشته مي شود :
(۴٫۶)

عملكرد مشخصه XCk بوسيله فرمول زير نشان داده مي شود :
(۴٫۷)

درتعريف اين قسمت ،احتمالات آماري پارامترها تخمين زده مي شوند . به PFSs درنمونه هاي طبقه بندي در تجزيه وتحليل فرمولهاي (۴٫۵) و(۴٫۶) در قسمت (۴٫۱٫۱) توجه مي شود . همچنين در قسمت (۴٫۱٫۲) درنمونه هاي برگشتي PFSs بررسي مي شود .

۴٫۱٫۱- نمونه هاي طبقه بندي درمسائل آماري :
دراين قسمت ثابت مي شود كه مسئله هاي احتمال كه به وسيله فرمول (۴٫۶) تخمين زده شده باشند غير واقعي وناهماهنگ هستند وبا معيارهاي ML سازگار نمي باشند .
همچنين كافي است يك عامل نمونه درفرمول( ۴٫۶) قرارداده شود تا غير واقعي وناهماهنگ بودن تخمين هاي بدست آمده واينكه بيشينه سازي احتمال درست نمايي مجموعه اطلاعات انجام نمي شود اثبات گردد.
ملاحظه كنيد كه درPFS اگرمسئله طبقه بندي درخواست شده ۲ نوع باشد باC1 وC2 نمايش داده مي شود . PFS يك ورودي X=[0,1] ويك قانون پايه شامل ۲ احتمال تئوري فازي دارد . در مقدمه mfs فازي A1,A2 مي نشيند پس خواهيم داشت :
(۴٫۸)
دردنباله با توجه به فرمول (۳٫۴) كه µ¯Aj=µAj و j=1,2 مفروض است كه احتمال شرطي C1 وC2 برابر است با :

(۴٫۹)
با استفاده ازفرمول (۳٫۵) مي توانيم احتمال هاي شرطي نا شناخته اي را كه براي تخمين بهPFS احتياج ندارند ببينيم .
بااستفاده از فرمول (۴٫۹) پارامترهاي احتمال بدين صورت خواهند بود كه :
P*1,1=P*2,2=1 و P*1,2=P*2,1=0 ( توجه كنيد كه در اين مثال مقدمه mfs درفرمول
(۴٫۸) به روشي انتخاب شده است كه بدست آوردن تخمين درست احتمال شرطي PFS
را مشكل مي نمايد لذا بدست آوردن تخمين هاي درست احتمال شرطي پارامترهاي احتمال
Pj,k نيزمشكل خواهد بود ودر نتيجه آناليز تخمين هاي پارامترهاي احتمالي ، غيرواقعي وناهماهنگ مي باشد .
درادامه ۲قضيه كه درارتباط باپارامترهاي آماري فرمول (۴٫۶) مي باشد خواهد آمد . براي اثبات قضيه ها از مثال فوق استفاده ميگردد .
قضيه۴٫۱:
براي نمونه هاي طبقه بندي شده در PFS بااستفاده از فرمول (۴٫۶)اثبات كنيد كه تخمين هاي Pj,k ازپارامترهاي احتمالي P*j,k غيرواقعي وناهماهنگ هستند .
اثبات : مثالي را كه دربالا نشان داده شده ملاحظه نماييد . فرض كنيد يك مجموعه اطلاعاتي شامل n نمونه طبقه بندي شده (i=1, … , n) ( Xi,yi) براي تخمين پارامترهاي احتمال درPFS دردسترس است . براي سادگي فرض كنيد كه X1, … ,Xn ارزشهاي ثابتي دارند يعني فقط Y1, … ,Yn نمونه هايي بارفتارهاي متغير هستند . براي مثال تخمين
P2,2 ازپارامتراحتمالي P*2,2 را ملاحظه كنيد . ازفرمولهاي (۴٫۶) ،(۴٫۷) ،(۴٫۸) ،(۴٫۹)
چنين بدست مي آيد كه :
(۱۰،۴)
حالا فرض كنيد كه XiЄ(۰,۱) و,n) (i=1,… سپس از فرمول (۴٫۱۰) بدست آوريد كه
Ep2,2Є(۰,۱) تازمانيكه P*2,2=1 تخمين غيرواقعي ازP2,2 باشد . اين بحث اعداد مستقلي از نمونه هاي طبقه بندي شده n راشامل ميگردد. همچنين ازn→∞ تشكيل شده است .از دو مورد فوق نتيجه مي شود كه تخمين P2,2 غير واقعي و ناهماهنگ است .
معادله (۴٫۶) تخمين هاي پايه رافقط وفقط براي اعدادمثبت Є .
(۴٫۱۱) Є)=۱ n→∞ lim Pr(|pj,k–p*j,k|≤
دراينجا تخمين Pj,k ازيك مجموعه اطلاعات شامل n نمونه طبقه بندي شده بدست مي آيد .
اين شرط مي تواند همچنين به صورت Plim pj,k=p*j,k نوشته شود . شرط لازم براي
Plim pj,k=p*j,k اين است كه n→∞ Epj,k=p*jk lim باشد. (ببينيد قضيه ۲٫۹٫۳۹ دردرس۱۲ ) تخمين pj,k ازp*j,k بايد واقعي و هماهنگ باشد .اگر چه فعلا اثبات شده كه
Pj,k تخمين غيرواقعي وناهماهنگي از pj,k است . بنابراين نتيجه مي شود كه pj,k تخمين غيرواقعي از p*j,k مي باشد واين كاملا تئوري ما را اثبات مي كند .
قضيه ۴٫۲ :
نمونه هاي طبقه بندي شده درPFS رادرنظر بگيريد يك مجموعه اطلاعاتي نيز داده شده است . پارامترهاي احتمالي pj,k بااستفاده ازفرمول (۴٫۶)تخمين زده شده اند واحتياجي به بيشينه سازي احتمال درست نمايي مجموعه اطلاعات نمي باشد .

x 0.0 0.5 0.5 1.0
y C1 C1 C2 C2

جدول ۴٫۱: مجموعه اطلاعاتي كه در اثبات قضيه ۴٫۲ استفاده مي شود .
اثبات : مثال داده شده در بالا را ملاحظه كنيد . فرض كنيد كه مجموعه اطلاعاتي شامل ۴ نمونه طبقه بندي شده) Xi,yi )( i=1,2,3,4 ) براي تخمين پارامترهاي احتمال در PFS دردسترس مي با شد . مجموعه اطلاعات در جدول ۴٫۱ نشان داده شده است .
نمونه هاي طبقه بندي شده را درفرمول (۴٫۶) جايگزين كنيد در نتيجه خواهيم داشت P1,1=P2,2=0.75 و P1,2=P2,1=0.25 سپس از فرمول (۳٫۵)به دست مي آيد كه
(۴٫۱۲) pˆ(C1|x)=0.75-0.5x و pˆ(C2|x)=0.25+0.5x
احتمال درست نمايي مجموعه اطلاعات نشان داده مي شود به وسيله
(۴٫۱۳) ) pˆ(Yi|xi L=πⁿ,і=۱
حالا فرض كنيد كه نمونه هاي مجموعه اطلاعات مستقل ازهم مي باشند براي پارامترهاي
احتمالي Pj,k كه به وسيله فرمول (۴٫۶) تخمين زده شده اند با استفاده از فرمولهاي
(۴٫۱۲) و (۴٫۱۳) احتمال درست نمايي مجموعه اطلاعات جدول ۱-۴ برابرخواهد بود با
۹/۶۴≈۰٫۱۴ . حالا ملاحظه كنيد اگر پارامترهاي احتمالي به P΄۱,۱=P΄۲,۲=۱ و P΄۱,۲=P΄۲,۱=۰ تبديل شوند با استفاده از فرمول (۳٫۵) نتيجه پارامترهاي احتمالي برابر خواهد شد با:
(۴٫۱۴) pˆ΄(C1|x)=1-x و Pˆ΄(C2|x)=x
براي تبديل پارامترهاي احتمال p΄j,k از فرمولهاي (۴٫۱۳) و (۴٫۱۴) استفاده مي شود كه احتمال درست نمايي مجموعه اطلاعات در جدول ۱-۴ برابر با ۰٫۲۵ خواهد شد . بنابراين تبديل پارامترهاي احتمال در ارزشهاي بالاتر احتمال درست نمايي نتيجه بخش مي باشد لذا پارامترهاي احتمالي Pj,k با استفاده از فرمول (۴٫۶) تخمين زده مي شوند . اين مثال نشان مي دهد كه پارامترهاي تخمين زده شده با استفاده از فرمول (۴٫۶) احتياج به بيشينه سازي احتمال درست نمايي مجموعه اطلاعات ندارند(واقعيت اين است كه مثال نشان مي دهد كه تبديل پارامترهاي احتمالي P΄j,k احتمال درست نمايي مجموعه اطلاعات را بيشينه سازي مي كند . ودرست است كه تخمين ML پارامترهاي احتمال دقيقا برابربا پارامترهاي احتمالي
p*j,k به محض اتفاق افتادن مجموعه اطلاعات خاص در جدول ۱-۴ است . ) اين اثبات قضيه را كامل مي كند .

اين موضوع توجه را جلب مي كند كه در يك سيستم كه ورودي x به روشهاي جديد تقسيم مي شود(x) i.e.µ¯Ajبرابرخواهد بودبراي j=1, … , a وبراي همه (X ( x Є با ۰ يا ۱٫
براي پارامترهاي احتمال كه با استفاده از فرمول (۴٫۶) تخمين زده مي شوند ميتوانيم واقعي وهماهنگ بودن با معيارهاي ML را نشان دهيم . (در اين قسمت اثبات نمي شود )
بنابراين در سيستم هاي جديد تخمين پارامترهابا مطلوبيت آماري ممكن است با تخمين هر پارامتر به تفكيك وبا استفاده از فرمول (۴٫۶) بدست آيد . در يك سيستم فازي اگر چه با استفاده از قضاياي ۴٫۲ و۴٫۱ تخمين پارامترها با مطلوبيت آماري با تخمين هرپارامتر به تفكيك وبا استفاده از فرمول (۴٫۶) بدست نمي آيد در عوض پارامترها در يك سيستم فازي مي توانند به طور همزمان تخمين زده شوند واين به پيشنهاد مطرح شده در بخش ۴٫۲ نزديك است .