لطفا به نکات زیر در هنگام خرید دانلود فایل پاورپوینت ارزیابی فرضیه‌ها توجه فرمایید.

1-در این مطلب، متن اسلاید های اولیه دانلود فایل پاورپوینت ارزیابی فرضیه‌ها قرار داده شده است 2-به علت اینکه امکان درج تصاویر استفاده شده در پاورپوینت وجود ندارد،در صورتی که مایل به دریافت  تصاویری از ان قبل از خرید هستید، می توانید با پشتیبانی تماس حاصل فرمایید 3-پس از پرداخت هزینه ، حداکثر طی 4 ساعت پاورپوینت خرید شده ، به ادرس ایمیل شما ارسال خواهد شد 4-در صورت  مشاهده  بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل اسلاید ها میباشد ودر فایل اصلی این پاورپوینت،به هیچ وجه بهم ریختگی وجود ندارد 5-در صورتی که اسلاید ها داری جدول و یا عکس باشند در متون زیر قرار نخواهند گرفت

— پاورپوینت شامل تصاویر میباشد —-

اسلاید ۱ :

مقدمه

یک الگوریتم یادگیری با استفاده از داده‌های آموزشی فرضیه‌ای را بوجود می‌آورد. قبل از استفاده از این فرضیه ممکن است که لازم شود تا دقت این فرضیه مورد ارزیابی قرار گیرد.

 

 

 

اینکار از دو جهت اهمیت دارد:

.۱دقت فرضیه را برای مثالهای نادیده حدس بزنیم.

.۲گاهی اوقات ارزیابی فرضیه جزئی از الگوریتم یادگیری است: مثل هرس کردن درخت تصمیم.

اسلاید ۲ :

روشهای آماری

در این فصل سعی می‌شود تا روشهای آماری مناسب برای حدس زدن دقت فرضیه‌ها معرفی گردند .مبنای کار در جهت پاسخگوئی به سه سوال زیر است:

.۱اگر دقت یک فرضیه برای داده‌های محدودی معلوم باشد دقت آن برای سایر مثالها چه قدر خواهد بود؟

.۲اگر یک فرضیه برای داده‌های محدودی بهتر از فرضیه دیگری عمل کند احتمال اینکه این وضعیت در حالت کلی نیز صادق باشد چقدر است؟

.۳وقتی که داده آموزشی اندکی موجود باشد بهترین راه برای اینکه هم فرضیه را یاد بگیریم و هم دقت آنرا اندازه‌گیری کنیم چیست؟

اسلاید ۳ :

کمی دادههای آموزشی

وقتی که داده آموزشی محدود باشد این امکان وجود دارد که این مثالها نشاندهنده توزیع کلی داده‌ها نباشند.

اسلاید ۴ :

مشکل کمی داده

وقتی که یادگیری با استفاده از داده‌های محدودی انجام می‌شود دو مشکل ممکن است رخ دهد:

.۱بایاس در تخمین.

  دقت یک فرضیه بر روی مثالهای آموزشی تخمین مناسبی برای دقت آن برای مثالهای نادیده نیست. زیرا فرضیه یاد گرفته شده بر اساس این داده‌ها برای مثالهای آتی به صورت خوش‌بينانه (optimistic) عمل خواهد نمود. برای رهائی از این امر می‌توان از مجموعه داده‌های تست استفاده کرد.

.۲انحراف (Variance) در تخمین.

  حتی با وجود استفاده از مجموعه تست این امکان وجود دارد که دقت فرضیه اندازه‌گیری شده با دقت فرضیه واقعی اختلاف داشته باشد. این دقت بستگی به خصوصیات مجموعه تست و تطابق با توزیع کلی داده‌ها دارد.

اسلاید ۵ :

Bias and Variance in the Estimate

اسلاید ۶ :

تخمین دقت فرضیه

در یک مثال یادگیری می‌توان برای فضای مثالهای ورودی یک تابع توزیع احتمال نامعلوم D در نظر گرفت که احتمال رخداد هر نمونه X را با p(X) مشخص می‌نماید.

 

 

 

 

در این صورت با دو سوال زیر مواجه هستیم:

.۱اگر فرضیه h و تعداد n نمونه داشته باشیم که به صورت تصادفی از مثالهائی با توزیع D انتخاب شده باشند، بهترین تخمین برای دقت h برای مثالهای  آتی با همان توزیع چیست؟

.۲خطای احتمالی در این تخمین دقت چقدر است؟

اسلاید ۷ :

خطای نمونه و خطای واقعی

lخطای نمونه

  خطای فرضیه روی مجموعه مثالهای موجود) آموزشی و یا تست) به عبارت دیگر کسری است از نمونه‌های S که تحت فرضیه h نسبت به تابع هدف f اشتباه دسته‌بندی شده‌اند:

errorS(h)= 1/n SxÎSd(f(x),h(x))

  که در ان n تعداد مثالهای S و اگر f(x) ¹ h(x)آنگاه مقدار d(f(x),h(x))  برابر با ۱ است در غیر این صورت برابر با ۰ است.

اسلاید ۸ :

lخطای واقعی

  عبارت است از خطای فرضیه روی مجموعه تمام مثالها با توزیع نامعلوم D و برابر است با احتمال اینکه یک نمونه تصادفی به اشتباه دسته‌بندی شود.

  خطای واقعی فرضیه h نسبت به تابع هدف f و داده با توزیع D به صورت زیر بیان می‌شود:

errorD(h)= PrxÎD[f(x) ¹ h(x)]

اسلاید ۹ :

مثال

lیک مجموعه داده شش‌تائی با توزیع احتمال زیر وجود دارد:

l

P(X1) = 0.2    P(X4) = 0.1

P(X2) = 0.1    P(X5) = 0.2

P(X3) = 0.3    P(X6) = 0.1

  فرضیه h برای مجموعه نمونه {X1, X2, X3, X4}می‌تواند X1, X2, X3 را بدرستی دسته‌بندی کند ولی قادر به دسته‌بندی صحیح X4 نیست. دراین صورت خطای نمونه برابر است با:

¼ (۰ + ۰ + ۰ + ۱) = ¼ = ۰٫۲۵

  اگر این فرضیه برای X6 صحیح و برای X5نادرست باشد در این صورت خطای واقعی برابر است با:

۰٫۲(۰) + ۰٫۱(۰) + ۰٫۳(۰) + ۰٫۱(۱) + ۰٫۲(۱) + ۰٫۱(۰) = ۰٫۳

اسلاید ۱۰ :

فاصله اطمینان برای فرضیههای با مقادیر گسسته

اگر سه شرط زیر برقرار باشند:

lنمونه S دارای n مثال باشد که مستقل از یکدیگر و مستقل از h برپایه توزیع احتمال D انتخاب شده باشند.

ln ³ ۳۰  باشد.

lفرضیه h منجر به r خطا روی این مثالها گردد. (یعنی  errorS(h)=r/n)

  آنگاه می‌توان بر پایه قضایای آماری ادعا نمود که: