خلاصه

تجزیه و تحلیل سریهای زمانی همواره به دلیل حضور مکـرر آن در کاربردهـای مختلـف در زمینـه تحقیقـاتی، مهـم و جالـب بـوده اسـت. در گذشته، بسیاری از روشهای مبتنی بر رگرسیون، شبکههای عصبی و دیگر مدلهای ریاضی برای تجزیه و تحلیل سریهای زمانی مطرح شد. در این مقاله، تلاش میشود از تکنیک دادهکاوی برای تجزیه و تحلیل سریهای زمانی استفاده شود. بسیاری از مطالعات قبلی در مورد دادهکـاوی بـر روی دادههای باینری متمرکز بوده است، درحالیکه دادههای سری زمانی، معمولا مقادیر کمی هستند. در نتیجه رویکرد دادهکاوی فازی را برای دسـت-یابی به دادههای سری زمانی برای پیدا کردن قواعد انجمنی زبانی گسترش میدهیم. روش ارائه شده از یک پنجره کشویی برای ایجاد توالی دنبالـه-های سری زمانی استفاده میکند، سپس مجموعه آیتمهای فازی این توالیها را تجزیه و تحلیل میکند. پسپردازش مناسـب بـرای حـذف الگوهـای زاید انجام میگیرد. آزمایشهایی نیز برای نشان دادن عملکرد الگوریتم دادهکاوی مورد نظر انجام گرفته است.

کلمات کلیدی: قانون تجمیع، دادهکاوی، مجموعههای فازی، سریهای زمانی.

.۱ مقدمه

تجزیه و تحلیل بازههای زمانی همواره به دلیل حضور مکرر آن در کاربردهای مختلف در زمینه تحقیقاتی، مهم و جالب بوده است. ایـن تحقیقـات بـرای برخی از حوزههای علمی مانند بیوانفورماتیک، درمان پزشکی و مالی که تاکید آنها برای پیش بینی است، خوب میباشـد. سـریهـای زمـانی معمـولا از تعداد زیادی نقطه دادهای تشکیل میشود، که هر کدام نشان دهنده یک مقدار در یک زمان مشخص است. در گذشته، بسیاری از روشهـای رگرسـیون، شبکههای عصبی و دیگر مدلهای ریاضی برای تجزیه و تحلیل سـریهـای زمـانی مطـرح شـد. بسـیاری از مطالعـات دادهکـاوی قبلـی بـر روی دادههـای باینری-مقدار متمرکز شده است. ولی دادههای سری زمانی، معمولا مقادیر کمی هستند، بنابراین طراحی یک الگوریتم دادهکاوی پیچیده قادر به اسـتفاده از این نوع دادهها، یک چالش با کسانی که در این زمینه تحقیق کار کردهاند را نشان میدهد.

به تازگی، نظریه مجموعه فازی اغلب بیشتر در سیستمهای هوشمند به دلیل سادگی و شباهت آن به اسـتدلال انسـان اسـتفاده شـده اسـت کـه بـرای اولین بار توسط زاده در ۵۶۹۱ پیشنهاد شد. این در درجه اول به استفاده استدلالی و کمی مربوط به زبان طبیعی که در آن کلمات میتواننـد معـانی مـبهم داشته باشند، میپردازد.

این نظریه در زمینههایی مانند ساخت و تولید، مهندسی ، تشخیص عیب، اقتصاد استفاده شـده اسـت. چنـد الگـوریتم یـادگیری فـازی بـرای اسـتنتاج قوانین از مجموعه دادهها استفاده شده است. در دادهکاوی فازی، هنگ و همکارانش، چندین الگوریتم دادهکـاوی فـازی بـرای اسـتخراج قـوانین انجمـن زبانی از دادههای کمی پیشنهاد کردند. [۵] آنها هر یک از آیتمهای کمی را به یک مجموعه فازی تبدیل و با استفاده از عملیات فازی برای پیدا کـردن قواعد فازی تلاش کرده اند. نتایج کاوش به دست آمده میتواند به دلیـل ویژگـیهـای عضـویت فـازی ملایـم باشـد. کـایی و همکـارانش یـک رویکـرد داده کاوی وزندار معرفی کردند که منعکس کننده اهمیت اختلاف آیتمهای مختلف است.[۲] هر آیتم داده شده توسط کـاربران بـه یـک وزنـه عـددی متصل میباشد. پشتیبانی وزنی و اطمینان وزنی برای تعیین قوانین انجمن بهرهوری تعریف شد. یـو و همکـارانشٌ سـپس مفـاهیم خـود را بـرای بردارهـای آیتم فازی گسترش دادند. [۳]

در این مقاله، رویکرد قبلیمان را گسترش و یک الگوریتم دادهکاوی فازی برای سریهای زمـانی بـرای پیـدا کـردن قـوانین زبـانی انجمـن بررسـی میکنیم. روش ارائه شده برای اولین بار از یک پنجره کشویی برای ایجاد زیردنبالههای ادامهدار از یک مجموعه سری زمانی داده شده اسـتفاده مـیکنـد، سپس مجموعه آیتم فازی ناشی از این زیردنبالهها را تجزیه و تحلیل میکند و پس از پردازش مناسب الگوهای زاید، حذف میشود.

بنابراین روش پیشنهادی دارای دو مزیت است. در مرحله اول، نتایج نهایی بر اساس قواعد زبانی نشان داده شده، که آنها نسـبت بـه نمـایش کمـی، انسان دوستانهتر خواهد بود. ثانیا، یک مشکل برای رویکردهای دادهکاوی قوانین انجمن این است که ممکـن اسـت قـوانین بـیش از حـد ایجـاد شـود. از طریق روند پردازش در الگوریتم، بسیاری از قوانین زاید را میتوان فیلتر کرد به طوری که قوانین دادهکاوی شده فشرده باشد و کاربران بتوانند بـه راحتـی از قوانین استفاده کنند.

.۲ قوانین داده کاوی انجمن فازی برای سریهای زمانی

دادهکاوی اغلب در تلاش برای کشف قوانین انجمن از دادههای معامله است. هدف کشف انجمنهای مهم در میان آیتمها است، بـه طـوری کـه حضـور برخی از آیتم ها در معامله ضروری هست را میرساند. برای رسیدن به این هدف، اگروال۲ و همکارانش چنـدین الگـوریتم دادهکـاوی بـر اسـاس مفهـوم مجموعه آیتمهای بزرگ به منظور پیدا کردن قوانین انجمنی در دادههای معامله پیشنهاد کردند.

داس و همکارانش۳ یک الگوریتم دادهکاوی برای تجزیه و تحلیل سـریهـای زمـانی پیشـنهاد دادنـد.[۴] ایـن رویکـرد خـود متشـکل از دو مرحلـه میباشد: سریهای زمانی گسسته و ایجاد قوانین انجمن. در فاز گسسته روش استفاده شده یک روش خوشهبندی بـرای پیـدا کـردن شـکلهـای پایـهای از سریهای زمانی میباشد، و پس از آن سریهای زمانی در قالب سریهای گسسـته بـر مبنـای شـکلهـای پایـهای تبـدیل مـیشـود. در مرحلـه دوم، روش apriori برای ایجاد قوانین انجمن استفاده شد. قوانینی که در روش بالا گفته شد متفاوت از قوانین سنتی انجمن میباشد. فرم قانون “اگـر A در زمـان T رخ دهد، آنگاه B رخ میدهد “، که به معنای وقوع B در هر واحد زمان T میباشد. علاوه بر این، یوان و همکـارانش یـک الگـوریتم دادهکـاوی بـرای کشف الگوی حرکت کمی از سریهای زمانی پیشنهاد دادند. قاعده دادهکاوی ممکن است شبیه به این باشد: “اگر نرخ ارز برخی از سهامهـا ۵۱ درصـد افزایش یابد، آنگاه قیمت بسته شدن آن ممکن است ۵۱ درصد افزایش یابد. “

۱ Yue etal 2 Agrawal 3 Das etal

در کنترل دادههای سری زمانی، سانگ و چیسوم۱ یـک احتمـال فـازی، سـریهـای زمـانی فـازی و مـدلهـای خـود را بـا فـرض اینکـه مقـادیر آن مجموعههای فازی هستند، پیشنهاد کرد.[۱] چن و هوانگ۲ یک مدل سریهای زمانی فازی عامل زمانی-نوع برای مقابله با مشکلات پیشبینـی، پیشـنهاد کردند. ایو و چان۳ یک رویکرد داده کاوی فازی برای پیدا کردن قوانین فازی برای طبقه بندی سریهای زمانی پیشنهاد کردند. واتانابه۴ از مدل تاکـاگی سوگنو برای ساخت مدل سریهای زمانی بهره جست. الگوریتم پیشنهادی داده کاوی فازی در این مقاله ادغام مجموعه های فازی، الگوریتم داده کـاوی apriori، و سریهای زمانی برای پیدا کردن مفاهیم برای قوانین انجمن زبانی مناسب میباشد. این بـرای اولـین بـار اسـت کـه زیردنبالـههـای ادامـهدار از سریهای زمانی از طریق اندازه پنجره کشویی ایجاد میشود. این الگوریتم از توابع عضویت برای تبدیل دادهها در هر زیر دنبالـه بـه مجموعـههـای فـازی استفاده میکند. پس از تبدیل، کاردینالیتیهای اسکالر را از همه اصطلاحات زبانی به عنوان مقادیر فازی آنها محاسبه میکند. فرآینـد دادهکـاوی سـپس مجموعه ایتم بزرگ فازی را بر اساس مقادیر فازی مییابد. در مرحله پس پردازش، به حذف مجموعه آیـتمهـای بـزرگ فـازی زایـد پرداختـه مـیشـود. قوانین انجمن فازی در نهایت از مجموعه ایتم بزرگ فازی کشف میشود. جزئیات الگوریتم دادهکاوی پیشنهادی در زیر توضیح داده شده است.[۹]