چکیده
دادهکاوی فرآیند کشف رابطهها، الگوها و روندهای جدید معنی داری است که به بررسی حجم وسیعی از اطﻻعات ذخیره شده در انبارهای داده با فناوری های تشخیص الگو (مانند ریاضی و آمار) میپردازد. پیدا کردن الگوها و دانش نهفته در دادههای موجود در سیستمهای آموزشی می تواند به تصمیم گیرندگان در سیستمهای آموزشی در جهت بهبود و ارتقاء فرآیندهای آموزشی نظیر بهبود برنامه ریزیها کمک زیادی نماید. در این تحقیق بر آنیم تا بر اساس بخشی از اطﻻعات ومشخصههای داوطلبان مانند سهمیه استفاده شده در کنکور ، معدل دیپلم ،جنسیت داوطلب و با استفاده از روشهای دادهکاوی رتبه داوطلب را تخمین بزنیم و همچنین مهمترین مولفه های تاًثیرگذار بر رتبه داوطلبان در کنکور سراسری را بدست آوریم.

کلمات کلیدی

دادهکاوی ، دادهکاوی آموزشی ، آزمون سراسری ، پیشبینی ، شبکه عصبی

ٌ. مقدمه

ٌ؟ٌ. معرفی سازمان سنجش آموزش کشور

وزارت علوم و آموزش عالی وقت به منظور حل مساله گزینش دانشجو، مرکز آزمون شناسی را در بهمن ماه تاسیس نمود تا با همکاری دانشگاهها، مقررات ورود به آموزش عالی را تدوین و اجرا نماید . افزایش تعداد متقاضیان ورود به آموزش عالی و گسترش دانشگاهها و موسسات آموزش عالی، وجود تشکیﻻت وسیعتری با شرح وظایف مشخص برای گزینش دانشجو ضروری م ینمود، لذا در بهمن ماه سال تشکیﻻت سازمان سنجش آموزش کشور با سه حوزه معاونت فنی و پژوهشی، اجرایی و نظارت بر امور دانشگاهها به تصویب رسید و با همین تشکیﻻت تا سال ًّ به کار خود ادامه داد. در سال ًّ بر اساس طرح ادغام سازمانهای وابسته به وزارتخانه، سازمان سنجش آموزش کشور منحل و وظایف آن به اداره کل گزینش دانشجو در حوزه معاونت دانشجویی وزارت علوم، تحقیقات و فناوری واگذار شد .با توجه به حجم فعالیتهای تحقیقاتی و اجرایی به ویژه در زمینه پذیرش و گزینش دانشجو، افزایش تعداد داوطلبان ورود به نظام آموزش عالی و حساسیت بیش از پیش مراحل مختلف امر گزینش دانشجو، در فروردین ماه سال ، تشکیﻻت سازمان سنجش آموزش کشور با سه معاونت اجرایی، فنی و پژوهشی و گزینش به تصویب سازمان امور اداری و استخدامی رسید و در تاریخ /ّ/ شرح وظایف و پستهای مصوب سازمان ابﻻغ شد .جدیاً با توجه به گستردگی کمی و کیفی وظایف سازمان و با اندک تغییراتی در تشکیﻻت با هدف کیفیتر نمودن ترکیب نیروی انسانی و افزایش پستهای پژوهشی و کارشناسی، تشکیﻻت سازمان سنجش آموزش کشور با سه معاونت اجرایی، معاونت فنی و آماری و معاونت تحقیقات آزمون و ارزیابی آموزشی، به موجب تبصره ٍ ماده قانون استخدام کشوری در بهمن ماه به تایید سازمان امور اداری و استخدامی کشور رسید.

ٌ- عضو هیئت علمی گروه مهندسی صنایع ، دانشگاه صنعتی بیرجند saffarian@birjandut.ac.ir ٍ- دانشجوی کارشناسی ارشد فناوری اطﻻعات ، دانشگاه پیام نور تهران az.khairabadi@gmail.com

اهداف و وظایف سازمان سنجش آموزش کشور عبارتند از:

• استقرار نظام کارامد در امر سنجش آموزش

• فراهم آوردن امکانات شناسایی و شناساندن استعدادهای درخشان کشور در زمینههای مختلف و مشارکت در تشویق و حمایت آنها

• سنجش و اندازهگیری و ارزیابی دانش داوطلبان ورود به آموزش عالی کشور و سطوح مختلف آموزشی

• انتخاب و معرفی شایستهترین افراد برای ادامه تحصیل در دانشگاهها و موسسات آموزش عالی کشور

• برگزاری کلیه آزمونهای ورود به دانشگاهها و موسسات آموزش عالی به صورت مستقیم و یا با نظارت سازمان

• انجام امور مربوط به تعیین شرایط و ضوابط پذیرش دانشجو با توجه به طرحها و برنامهها و سیاستهای آموزشی کشور

• بررسی و ارائه روشهای مناسب اندازهگیری برای سنجش آمادگی داوطلبان و پیشرفت تحصیلی و علمی دانشآموزان و دانشجویان

• انجام پژوهشهای ﻻزم برای شناخت و فراهم آوردن روشهای علمی برای سنجش آموزش

• برگزاری آزمونهای مورد نیاز برای سازمانهای دولتی و غیردولتی برابر ضوابط مورد نظر

• تهیه و تدوین، چاپ و انتشار کتب و مجﻻت مورد نیاز داوطلبان ورود به آموزش عالی بر اساس نتایج تحقیقات انجام شده

• برقراری ارتباط مستمر با دانشگاهها، وزارت آموزش و پرورش و سایر نهادها به منظور هماهنگی در انجام بهینه امور و برنامههای گزینش دانشجو

• مشارکت در امر پذیرش دانشجو برای دانشگاهها از میان عﻻقهمندان و داوطلبان غیر ایرانی در چارچوب سیاستهای فرهنگی دولت

• برگزاری مسابقات علمی دانشجویان در رشتهها و مقاطع مختلف تحصیلی، المپیاد علمی در سطوح ملی، منطقهای و بینالمللی

• ارائه خدمات مشورتی برای کاربرد موثر روشها و وسایل اندازهگیری آموزش ، کمک به واحدهای آموزشی برای ایجاد سیستمهای اطﻻعاتی متمرکز و بهرهگیری از آن در طرحها و برنامههای تحقیقاتی

• تحقیق در زمینه اندازهگیری، سنجش دانش عمومی، معلومات و سایر توانائیهای فردی به منظور پیشبینی موفقیت تحصیلی دانشجویان و فارغالتحصیﻻن و کارآیی اجتماعی آنان

• ایجاد روابط علمی و پژوهشی با متخصصان دانشگاهها و موسسات آموزش عالی و پژوهشی

• برقراری ارتباط و تبادل نظر با مراکز علمی، تحقیقاتی خارج از کشور که وظایفی مشابه س

• مشارکت در تربیت نیروی انسانی متخصص مورد نیاز در زمینه اندازهگیری و ارزیابی آموزشی

• بررسی صﻻحیتهای عمومی داوطلبان ورود به آموزش عالی بر اساس آئیننامهها و ضوابط مصوب مراجع ذیصﻻح ٌ[

ٌ؟ٍ. دادهکاوی

دادهکاوی یا به تعبیر دیگر کشف دانش در پایگاه دادهها، استخراج غیر بدیهی اطﻻعات بالقوه مفید از روی دادههایی است که قبﻻً ناشناخته ماندهاند. این مطلب برخی از روشهای فنی مانند خوشهبندی، خﻻصه سازی دادهها، فراگیری قاعدههای ردهبندی، یافتن ارتباط شبکهها، تحلیل تغییرات و کشف بیقاعدگی را شامل میشود.

شکلٌ- مراحل فرآیند کشف دانش از پایگاه داده

. متدلوژی مورد استفاده

در انجام این تحقیق از متدلوژی استاندارد CRISP-DM جهت انجام مراحل مختلف دادهکاوی استفاده شده است. شکل ٍ گامهای مختلف مدل مرجع CRISP-DM را بصورت چرخه حیات پروژه دادهکاوی نمایش می دهد.

شکلٍ- نمودار چرخه حیات پروژه داده کاوی بر اساس متدلوژی CRISP-DMٍ[

؟ٌ. شناخت و بررسی مسئله

سازمان سنجش آموزش کشور هر ساله قبل از شروع ثبت نام دانشجویان دانشگاهها، فایلهای مربوط به داوطلبان پذیرفته شده در آزمون سراسری را که در هر دانشگاه و موسسه آموزش عالی پذیرفته شدهاند، به دانشگاه مربوطه ارسال مینماید. بسیاری از دانشگاهها اطﻻعات مورد نیاز سیستم آموزشی خود را از این مجموعه داده استخراج نموده و پس از انجام تبدیﻻت مورد نظر به پایگاههای داده آموزشی وارد

مینمایند.از جمله مزایای بکارگیری این مجموعه داده این است که نیاز به ثبت مجدد اطﻻعات شخصی و آموزشی دانشجویان دانشگاهها را برطرف مینماید و تنها در صورت وجود تغییرات در اطﻻعات داوطلبان مانند آدرس داوطلب و. .. این تغییرات در سیستم آموزشی دانشگاه به ثبت می رسد. این کار کمک بسیار زیادی به تسریع فرآیند ثبت نام پذیرفتهشدگان جدیدالورود دانشگاهها مینماید. در این راستا سازمان سنجش آموزش کشور نیز هر ساله اطﻻعات دقیقتر و تکمیلیتری از داوطلبان را جمعآوری نموده و به دانشگاهها ارسال مینماید. یکی از مواردی که بصورت محرمانه در اختیار دانشگاهها گذاشته می شود، رتبه داوطلبان پذیرفته شده در دانشگاه مربوطه میباشد که از این طریق دانشگاه میتواند از سطح تحصیلی و علمی دانشجویان در کنکور سراسری اطﻻع یابد. در این تحقیق برآنیم تا بر اساس بخشی از اطﻻعات مربوط به داوطلبان، رتبه آنها در کنکور سراسری را تخمین بزنیم.

؟ٍ. مجموعه داده مورد استفاده

مجموعه داده مورد استفاده در این تحقیق مربوط به یکی از دانشگاههای کشور است که به دلیل رعایت مسئله محرمانگی دادهها، از ذکر نام دانشگاه خودداری مینمائیم. این دادهها مربوط به سالهای -ْ میباشدهمچنین. جمعاً اطﻻعات مربوط به ً نفر از داوطلبان کنکور سراسری مورد بررسی قرار گرفته است. در مجموعه داده در دسترس، اطﻻعات فردی و شخصی داوطلبان مانند شماره پرونده، شماره داوطلبی، شماره شناسنامه، کد ملی و. .. حذف شده و حریم خصوصی افراد حفظ شده است.

؟. آماده سازی و پیش پردازش دادهها

بخش اصلی پیش پردازش و مدلسازی دادهها در محیط نرمافزار Clementine انجام شده و قسمتی از عملیات تحلیلی و آماری دادهها در محیط نرمافزار ً؟ٌّSPSS مورد بررسی قرار گرفته است. ﻻزم به ذکر است که هردوی این ابزارها محصول شرکت SPSS میباشند.

فهرست مشخصههای مورد بررسی عبارتند از :

جنسیت ، سهمیه قبولی ، سهمیه نهایی ، کد استان ماقبل دیپلم ، کد استان دیپلم ، کد استان پیش دانشگاهی ، کد استان تولد ، کد استان بومی ، سال دیپلم ، سال پیش دانشگاهی ، رتبه قبولی