ابزارهای کمکی جستجو

حتی در اولین روزهای جستجوی متنی، ابزارهای کمکی مختلفی برای کمک به کاوشگران تهیه شد. ابتدایی ترین ابزارهای کمکی جست و جو ، نمایش الفبایی (یا چاپی) کلمات مهم به همراه بسامد تکرار آنها در پایگاه است. استفاده از بعضی از انواع شاخص های فاصلهٔ (عملگر متری ) کلمات نیز متداول است. توانایی تعیین فاصلهٔ بین دو کلمه به ویژه در جستجو از پایگاه های تمام متن بسیار اهمیت دارد زیرا در این پایگاهها ممکن است کلماتی که در پاراگرافهای مختلف ظاهر می شوند اصلاً مرتبط با موضوع جستجو نباشند.شاید قدرتمندترین ابزار کمکی برای جستجو به زبان طبیعی، توانایی جستجو براساس بخشهای کلمات باشد؛ یعنی، بتوان کلمات را کوتاه سازی ” کرده یا براساس بخش های کلمه جستجو نمود. ویلیامز (۱۹۷۲) اهمیت جستجو براساس بخش های کلمه را مورد بحث قرار داده است. انعطاف پذیرترین نرمافزار، نرمافزاری است که امکان جستجو براساس هر بخشی از کلمه را فرآهم آورد: کوتاه سازی از راست در فارسی چپ] (مثل جستجوی همهٔ کلماتی که با condens شروع می شوند)، کوتاه سازی از چپ در فارسی راست ] (مثل جستجوی همهٔ کلماتی که به “mycin ختم می شوند)، کوتاه سازی میان وند (ابتدا و انتهای واژه معلوم است ولی حروف وسط نامشخص هستند) یا هر نوع ترکیب ممکنی از آنها (مثل همهٔ کلماتی که زنجیره نویس های “magnet را در هر کجای واژه دربر دارند). گرچه استفاده از جستجو براساس بخشی از کلمه در همهٔ حوزه های موضوعی کاربرد دارد اما به نظر میرسد که استفاده از آن در حوزه های علوم و فنآوری، یعنی جایی که زبان قابل پیش بینی تر است، مناسبتر باشد. به عبارت دیگر، جستجو براساس بخشی از کلمه اجازه می دهد تا از طریق ایجاد طبقه های سودمندی از کلمات در قالب یک راهبرد، فقدان واژگان کنترل شده تحمل پذیرتر شود. بنابراین، جستجو براساس ریشه ” condens احتمالاً گروهی از مدارک را بازیابی خواهد کرد که در آنها مثلا کلمات condensers و condensation وجود دارند؛ جستجو با پسوند “mycin مدارکی را بازیابی خواهد کرد که درباره آنتیبیوتیک ها اطلاعاتی را دربر دارند؛ و جستجو با “” tri.cobaltate (میان وند نامعلوم است) خانواده ترکیبات شیمیایی را بازیابی خواهد نمود.

جستجو براساس بخشی از کلمه، به بخشی از توانایی های اصطلاح نامه ها دست یافته است اما این توانایی را فقط در هنگام ارائه اطلاعات اعمال می کند و هیچ کنترلی بر خروجی ها ندارد. مثلاً توانایی جستجو براساس پسوندهای “biotics یا illinیا cycline یا myxin جایگزینی برای مدخل اصطلاح نامه ای “antibiotics است که ما را به فهرستی از اصطلاحات خاص تر مربوط به آنتیبیوتیک ها راهنمایی میکند. یک اصطلاحنامه از واژگانی پیش همارا تشکیل شده است، درحالی که کلمه سازی یا طبقه بندی بخش های کلمه در یک راهبرد کاوش،نوعی فرآیند “پس همارای است.