جستجوی متن

استفاده از رایانه در بازیابی اطلاعات که در دهه ی ۱۹۸۰آغاز شد.جستجوی متن درقالب الکترونیکی را میسر ساخت بدون آنکه متن مورد جستجو نمایه سازی شده باشد؛ برنامه بازیابی، کلماتی خاص یا ترکیبی از کلمات را در خود متن جستجو خواهد کرد، جایی که کلمات انتخابي کاوشگر بیانگر چیزی است که متن درباره آن بحث می کند. ممکن است جستجوی متن از طریق رایانه را جستجوی متنی” یا جستجو به زبان طبیعی ” بنامند. متن جستجو شده میتواند متنی پیچیده از یک انتشارات (مقاله، گزارش، یا حتی یک کتاب) یا بخشی از آن باشد: یک چکیده، یک استخراج متن یا فقط یک عنوان، گاهی جستجوی یک متن کامل را جستجوی تمام متن ” می نامند.

در طول سال ها و با افزایش توان رایانه ها، کاهش قیمت پردازش و ذخیره و افرایش بیش از پیش متن در قالب الکترونیکی و به عنوان پیامد جانبي انواع مختلف انتشارات، توانایی جستجوی متنی نیز به طور قابل ملاحضه ای افزایش یافته است. گسترش اینترنت و وب جهانی، که حجم بسیار زیادی از متن را در دسترس افراد زیادی قرار داد، جستجوی متنی را به پدیده ای عادی – نه استثناء – بدل کرد. همانطور که از این گفته ها نیز برمی آید، در دهه ۱۹۹۰علاقمندی به روش های جستجوی متن در جوامع تحقیقاتی و بخش های دولتی و تجاری افزایش یافت. در خلاصهٔ مذاکرات یک مجموعه از همایشها، روش های فعلي پردازش متن – برای بازیابی و سایر اهداف مرتبط – به خوبی ترسیم شده است. همایش سالانهٔ بازیابی متن (تریک) که مؤسسه ملی استاندارد و فن آوری (آمریکا)” آن را برگزار می کند و تا پایان سال ۱۹۹۶ پنج دوره از آن برگزار شده است، و نیز همایش درک پیام (میوس)” که تا پایان سال ۱۹۹۶ شش دوره از آن برگزار شده، ازجمله مهمترین این همایش ها به شمار میآیند. همچنین، همایش هایی دربارهٔ استفاده از پردازش به زبان طبیعی و کنفرانس هایی بین المللی دربارهٔ تحلیل و تشخیص مدرک، از جمله همایش های مرتبط با بحث این فصل هستند. کنفرانس های تریک و میوس، به دلیل روش شناسی خاص خود، از اهمیت ویژه ای برخوردارند: همهٔ گروه های تحقیقی شرکت کننده، باید فرآیندهای پردازش متنی خود را در یک وظیفهٔ از پیش تعیین شده عمومی اعمال کنند، طوری که امکان مقایسهٔ و سنجش کارایی آن با استفاده از روش ها موجود وجود داشته باشد.