آنچه که در اين مقاله به آن مي پردازيم ده الگوريتم از برترين هاي انتخاب شده  کنفرانس  بين المللي داده کاوي است .

١.  الگوريتم CART

١- مقدمه

درخت تصميم گيري CART١ در سال ١٩٨٤  بطور مشترک توسط لئو بريمن ٢، ژئوم فريدمن ٣  ، ريچارد اولشن

۴ و چارلز استون ٥ نوشته شد که اين امر  يک گام مهم در زمينه پيشرفت هوش مصنوعي ، سيستم يادگيري ، آمار غير پارامتري و استخراج داده ، را به بار آورد  . CART به دليل سادگي مطالعه درختان تصميم گيري ، ابتکارات فني ارائه شده بوسيله آن ، مباحث پيچيده و پيشرفته بررسي داده هاي درختي شکل ، و نگرش توانمندانه آن به تئوري نمونه هاي وسيع براي درختان حائز اهميت است . با اينکه CART را مي توان تقريبا در هر حوزه اي يافت ولي به طور وسيع  در زمينه هايي مانند مهندسي الکترونيک ، زيست شناسي ، مطالعات پزشکي و مباحث اقتصادي يافت مي شود . مثلا در تحقيقات بازاريابي يا اجتماعي .

 توصيف  الگوريتم

درخت تصميم گيري CART يک روش تقسيم بندي بازگشتي باينري است . داده ها در اين الگوريتم  بصورت خام استفاده مي شوند و هيچگونه پاکسازي نه نياز است نه پيشنهاد مي شود . درختان بدون استفاده از يک قانون متوقف کننده به رشد حداکثري خود مي رسند و سپس اصلاح مي شوند (که اين کار قسمت به قسمت انجام مي شود .) اصلاح تا ريشه ادامه دارد  و با اصلاح پيچيدگي کار بالا مي رود. قسمت بعدي براي اصلاح بخشي است که کمترين کمک را به کارکرد کلي درخت در پردازش اطلاعات مي کند (و ممکن است در يک زمان بيشتر از يک بخش حذف شود). هدف مکانيزم CART توليد تنها يک درخت نيست بلکه توليد يک سري درختان اصلاح شده تو در توست که همه آن درختان بهينه داوطلب هستند . درخت با اندازه مناسب يا “درخت درست ” به وسيله  رزش گذاري عملکرد پيشگويانه هر درخت در توالي اصلاح ، شناخته مي شود . CART هيچگونه اندازه عملکرد داخلي براي انتخاب درخت براساس پردازش اطلاعات پيشنهاد نمي کند زيرا اين اندازه ها  قابل اطمينان نيستند . به جاي آن عملکرد درخت در آزمايش داده هاي جداگانه (يا از طريق تائيد ميانه ) اندازه گيري مي شود و انتخاب درخت تنها پس از ارزشيابي آزمايش داده ها صورت مي گيرد . اگر هيچ آزمايش داده اي وجود نداشته باشد و تائيديه مياني انجام نشده باشد CART نمي تواند بهترين درخت توالي را مشخص کند . اين با روش هايي مانند C4.5 که مدل هاي برتر را بر اساس اندازه هاي پردازش داده ايجاد مي کنند کاملا در تضاد است .