استفاده از ایندکس مدیکوس در بررسی داده ها 

نظریه آلبرایت (۱۹۷۹) با استفاده از ایندکس مدیکوس، بررسی جامعی از این نوع را انجام داده است. برای ده موضوع مختلف، کاوش های شبیه سازی شده ای انجام شد؛ نتیجه آنکه برای بازیابی همهٔ مدارک شناخته شدهٔ مرتبط با یک موضوع خاص، باید به طور متوسط از اصطلاح مختلف بهره گرفت. هرچند بعضی از این اصطلاحات از طریق ساختار سلسله مراتبی یا ارجاع متقابل در واژگان سیستم به یکدیگر ربط یافته بودند، اما بسیاری از آنها از چنین ارتباطاتی برخوردار نبودهاند و بعید به نظر می رسید که حتی یک کاوشگر سمج و ماهر نیز از این اصطلاحات استفاده نماید. شکل ۶۱ یک مثال از تحقیق آلبرایت را نشان میدهد. در واقع، باید کاوشگر دقیق و آگاهی وجود داشته باشد تا بتواند، براساس این موضوعات، به چنین نسبت بالایی از جامعیت در ایندکس مدیکوس دست یابد.

همانطور که مقالات در مجلات مختلفی پراکنده اند، ممکن است مدارک موجود در یک پایگاه اطلاعاتی نیز در زیر اصطلاحات بسیار متفاوتی پراکنده شده باشند. این نکته در شکل ۶۲ نشان داده شده است. ممکن است برای هر موضوع خاص، درصد نسبتاً بالایی از مدارک مرتبط وجود داشته باشد که با استفاده از تعداد کمی از اصطلاحات ساده (مثل ابررساناها یا “ابررسانایی در جستجو برای موضوع ابررسانا) بتوان آنها را بازیابی کرد. با افزودن سایر اصطلاحات مرتبطی که شاید در ساختار واژگانی پایگاه اطلاعاتی به یکدیگر ربط یافته اند، بتوان جامعیت را به ۷۰ تا ۸۰ درصد افزایش داد. در این مثال فرضی، تنها ۲۰ تا ۳۰ درصد مدارک زیر پوشش باقی می مانند که کاوشگر احتمالاً نمی تواند آنها را بازیابی کند.

بحث دربارهٔ شبیه سازی، آگاهانه ساده ارائه شده است زیرا در این بررسی کاوشگر تنها با یک بعد روبرو بوده یا، حداکثر با جستجویی روبرو بوده اشت که بر روی منابع چاپی انجام می شود و در هر بار تنها یک اصطلاح مورد مراجعه قرار میگیرد. شبیه سازی یک کاوش در یک پایگاه اطلاعاتی درون خطی که عموماً مستلزم توجه به چندین بعد است، کمی پیچیده تر خواهد بود. مثلاً در یک جستجو دربارهٔ حشرات مضر برای سویا، باید فرض کرد که یک مدرک فقط در صورتی بازیابی خواهد شد که زیر اصطلاحات حشرات ” یا سویانمایه سازی متون مربوط به ستاره شناسی دست یافت.

داویسون” و ماتیو” (۱۹۶۹) قابلیت بازیابی مدارکی موجود بر روی رایانه در حوزه موضوعی طیف سنجی” را در یازده پایگاه اطلاعاتی مورد بررسی قرار دادند و نیز دامنهٔ پوششی این پایگاه ها را براساس این موضوعات ارزیابی کردند. تورپ” (۱۹۷۴) جامعیت و مانعیت جستجوها در موضوع روماتولوژی را در ایندکس مدیکوس ارزیابی کرد و ویرگو (۱۹۷۰) از موضوع چشم پزشکی برای مقایسه بازیابی از پایگاه اطلاعاتی مدلارز و معادل چاپی ان، یعنی ایندکس مدیکوس، استفاده کرد. یهودا و استور سا” (۱۹۶۹) توانایی های بازیابی یک مدخل نمایهٔ موضوعی را با یک نمایهٔ کلیدواژهای عنوان، و یرکی (۱۹۷۳)

توانایی های بازیابی نمایه کوئیک را با نمایه نامه مهندسی و نمایه نامه ادواری های تجاری مقایسه کردند و فارادان و یاتسی – مرکر (۱۹۷۳) نمایهٔ چکیده نامهٔ فلزات را با استفاده از کاوش های شبیه سازی شده مورد ارزیابی قرار دادند. کین (۱۹۷۶) با استفاده از موضوع علوم کتابداری و اطلاع رسانی، دقیق ترین بررسیها را در زمینهٔ عملکرد بازیابي نمایه های چاپی ارائه کرده است. این بررسیها با مشارکت دانشجویان انجام شد و نتایج حاصل براساس جامعیت، مانعیت و زمان جستجو مورد ارزیابی قرار گرفت. کین (۱۹۷۷b) همچنین تحلیلی از راهبرد کاوش که بر روی نمایه های چاپی اعمال شده را ارائه داده است.

کاناوی ” (۱۹۷۴) یک امتیاز تک رقمه ” برای یک نمایه چاپی – یعنی ضریب قابلیت استفاده از نمایه ” – ایجاد کرد که مشخص میکند بازیابی جزئیات کامل کتاب شناختی یک مدرک خاص چه مقدار از وقت کاوشگر را خواهد گرفت. زمانی می توان یک کاوش موضوعی را موفقیت آمیز دانست که کاوشگر بتواند مدرکی شناخته شده که ربط زیادی با موضوع ارائه شده دارد را بازیابی کند. اگر مدرک بازیابی شود، مدت زمانی که برای بازیابي داده کامل کتاب شناختی صرف شده است را ثبت میکنند. با استفاده از روش کاناوی، و تعیین میانگین نتایج حاصل از جستجوی شماری از موضوعات که توسط چندین کاوشگر حاصل آمده است، باید برای نمایه های مختلف امتیازات عددی درنظر گرفت. ”ضریب قابلیت استفاده از نمایه اساساً ابزار اندازه گیری مقرون به صرفه ای است. به هرحال، از آنجا که این مقیاس اندازه گیری، کارایی را فقط براساس بازیابی شدن یا بازیابی نشدن یک مدرک شناخته شده واحد تعیین می کند بسیار ضعیف است. مقیاس بسیار مقرون به صرفه دیگر، قیمت واحد (به دلار ریال) یا زمان بهره گیر) درازای مدرک بازیابی شد و مرتبط است.