تلخیص متن اصطلاحی است که اخیراً برای بیان چیزی باب شده است که در گذشته چکیده نویسی خودکار یا استخراج خودکار نامیده می شده است. جملات براساس معیارهای آماری و / یا زبانشناختی انتخاب می شوند. هرچند معیارهایی که امروزه مورد استفاده قرار میگیرند بسیار پیچیده هستند، اما در اصول تفاوت چندانی با معیارهایی ندارند که محققینی چون لوان، باکسن دال و ادموندسون برای اولین بار در اواخر دهه ۱۹۵۰ و اوایل دهه ۱۹۶۰ مورد استفاده قرار دادند.

علاوه براین، روش های پیشرفته تر امروزی بر روی انتخاب صرفی جملات تاکید دارند؛ مثلاً آنها ممکن است دو یا چند جمله را در یک جملهٔ منسجم و بی حشو ادغام کنند یا ممکن است تلخیصی روایی از چند مدرک اطلاعاتی مجزا را فرآهم آورند مک کثون و دیگران، و می بیوری ” (۱۹۹۵) در مقالاتی جداگانه، حد اعلای پیشرفت در زمینهٔ تلخیص متن براساس تکیه بر جملات را مورد بررسی قرار دادهاند. روش مک کئون و دیگران، تلخیصی روایی (نه متن روایی) از داده های ذخیره شده دربارهٔ بازی های بسکتبال و برنامه ریزی های شبکه تلفنی را تولید میکند، درحالی که روش می بیوری تلخیص هایی متنی از پیام های بسیار موجز و ساخت یافتهٔ نظامی (حوادث جنگی) فرآهم می آورد.محیط شبکه فرصت ها و چالش های جدیدی را برای تلخیص متن فرآهم آورده است. مثلاً هیوئی و گو (۱۹۹۶) دربارهٔ تولید خودکار چکیده های مقالات روزنامه ها، به عنوان بخشی از برنامهٔ واسط بازیابی و پالایش وب بحث کرده اند.

تلخیص متن سالتون و دیگران (۱۹۹۷) یکی از روش های پیشرفته تر برای تهیهٔ خودکار متون پیچیده را توصیف کرده اند. از این روش – که برای اندازه گیری شباهت بین دو مدرک (به شکل ۱۱۱مراجعه کنید) مورد استفاده قرار میگیرد – می توان برای سنجش شباهت هاي بین دو پاراگراف در یک مدرک واحد نیز استفاده کرد. در نتیجه، میتوان خوشه هایی متنی تشکیل داد، طوری که هر خوشه از پاراگرافهایی تشکیل شده باشد که از بخش های کاملاً متفاوت متن استخراج شده اند و به نظر میرسد که درباره موضوع واحدی بحث می کنند.

ادعا شده است که این روش با استفاده از استخراج پاراگراف، تلخیص های معنی داری از متن را تهیه میکند. توجه داشته باشید که کار انها تاحدودی با سایر کارهایی که درزمینهٔ چکیده نویسی خودکار انجام شده است تفاوت دارد، زیرا جمله به عنوان یک واحد، مبنای کار آنها است نه پاراگراف. فرآیندهای سالتون و دیگران، به نسبت سایر روش های معمول، تلخیص های متنی طولانی تری تهیه می کند. تلخیص های متن که از روش استخراج پاراگراف تولید شده بودند. با تلخیص هایی که از طریق استخراج پاراگرافهای مهم از طریق افراد انسانی حاصل آمده بودند مقایسه شدند. محققین نتیجه گرفتند که فرآیندهای خودکار قابل پذیرش هستند زیرا تلخیص های حاصل از فرآیندهای خودکار – همانند شباهت دو تلخیص انسانی به یکدیگر – با خلاصه استخراج انسانی سازگار هستند، درحالی که فرآیندهای خودکار استخراج بسیار ارزان تر میباشند. تولید متنا، دراینجا، هم به ابزارهای اشاره دارد که انواع محدودی از متن خودکار را تولید میکنند و هم ناظر بر سیستم های خبرهای است که به افراد انسانی کمک میکنند تا انواع مختلفی گزارش را تهیه نمایند.

برای کمک به تهیه گزارش، سیستم هایی وجود دارند که مثلاً از طریق ایجاد امکان دسترسی درون خطی به متن و تصاویری که ممکن است کراراً برای تولید انواع مختلف گزارشها مورد نیاز باشند، به تهیه مستندات تولیدات صنعتی کمک میکنند (برای مثال به اسمیت، ۱۹۹۱ نگاه کنید). بیت من” و تایج ” (۱۹۹۵) به طور خلاصه سیستم های پیچیده ای را توضیح دادهاند که متن را استخراج کرده و باتوجه به نیازهای سردبیران را ساختار بندی می نمایند. دستیاران نوشتار هوشمند” جدید، کاری بیش از بررسی هجی کلمات انجام می دهند؛ آنها در انتخاب کلمات و دستور زبان صحیح و روش استفاده از آنها راهنمایی هایی را دراختیار بهره گیر قرار میدهند (اکمن، ۱۹۹۴). استاک (۱۹۹۳) و استاک و دیگران (۱۹۹۷) یک سیستم ابررسانهای جالب (آلفر سکو”) شرح دادهاند که برای بازیابی دیوارنگارههای قرن چهاردهم ایتالیا و اطلاعات مربوط به آنها مورد استفاده قرار میگیرد. علاوه بر سایر قابلیت ها، این سیستم یک میانجي جستجو به زبان طبیعی دربر دارد و میتواند از متون ضبط شده ای که با تصاویر دیوارنگارهها در یک شبکه ابررسانهای همراه است، پاسخ های قابل فهم و روشنی را ارائه نماید. استاک نمونه ای از سوال از سیستم، یعنی : می توانی یک دیوارنگاره آمبروگیو لورنزتی؟ در سینا را نشان داده و آن را برای من تشریح کنی؟” را ارائه داده و پاسخ حاصل از سیستم را به این شرح نگاشته است:

دارایی های دولت شایسته، یک دیوارنگاره از آمبرو گیو لورنزتی در قصر دولتی است. دارایی های دولت شایسته در سال ۱۳۳۸ نقاشی شد. سیلوسترو و پادشاهان مقدس، دیوارنگاره های دیگری از همان دوران هستند که ماسو دی بانکو در سالهای ۱۳۴۰-۱۳۳۰ آنها را نقاشی کرده است. اطلاعیه، اثر دیگری از آمبرو گیو لورنزتی است که در سال ۱۳۴۴ در پینا کوتکا ” نقاشی شد.