در جایی که با مدارک بسیار طولانی سروکار داریم، ضروری است تا برنامه ای را دراختیار داشته باشیم که بتواند جملات مهم را برای هر بخش از اثر انتخاب کرده و چاپ نماید. از آنجا که در تهیه چکیده، برای سازمانی که چکیده برای ان تهیه میشود، باید بر بخش های مهم و بخصوصی از مدرک تاکید شود، در نتیجه باید برای طبقه یا فهرست کلماتی معین، وزن نیز تعیین کرد تا اطمینان حاصل شود که جملات انتخابی برای چکیده نویسی، یک یا چند رخداد از این کلمات را دربر دارند.

بدیهی است چکیده ای که به این روش شکل میگیرد چندان به چکیده هایی که نیروی انسانی آنها را تهیه میکنند شباهت ندارد. از آنجا که ممکن است بعضی از جملات از اولین و برخی از آخرین پاراگراف و شاید جملات دیگری از میانهٔ اثر انتخاب شوند، ممکن است جملات کاملاً بی ارتباط به هم به نظر آیند. درحقیقت، در قبال انتخاب جملاتی که مجموعاً می توانند تصویر درستی از محتوای مدرک را ارائه دهند، این مسئله چندان مهم به نظر نمی آید. به هرحال، بعضی از محققین با این مسئله موافق نیستند و اصرار دارند چکیده هایی که به طور خودکار استخراج می شوند باید پیوستگی بیشتری داشته باشند (راش و دیگران، ۱۹۷۱؛ ماتیس و دیگران، ۱۹۷۳).

گرچه لوان (۱۹۵۸) و آسوالد و دیگرن (۱۹۵۹) از بسامد کلمه یا عبارت برای انتخاب جملات استفاده کردند، اما سایر محققین معیار جایگزینی را پیشنهاد کرده یا مورد استفاده قرار دادند. ادموندسون (۱۹۶۹) چهار روش را شناسایی کرده است:

۱. روش راهنما ” . به معیار بسامد کلمه، که لوان مورد استفاده قرار داده بود، شباهت دارد. براساس مجموع وزن های کلمات سازنده، به جملات وزنی نعلق میگیرد.

۲. روش نشانه ۳ حضور کلماتی خاصی در یک جمله نشانگر این حقیقت است که این جمله احتمالاً همان جمله ای است که محتوای متن را به خوبی نشان خواهد داد. یک واژه نامه نشانه، فهرستی از کلماتی که وزن مثبت دریافت کرده اند و یک فهرست از کلمات با وزن منفی را در بر دارد. ارزش اعتباری  جمله عبارت است از وزن هاي کلمات سازنده آن.

۳. روش عنوان ” . در این روش فرض بر این است که کلمات موجود در عناوین و عناوین فرعی، نشانگرهای مناسبی از محتوای مدرک هستند. جملات براساس تعداد کلماتی از عنوان و عنوان فرعی که در بر دارند ارزش اعتباری دریافت میکنند.

۴. روش محلی”. در این روش به جملات براساسی محلی که در آن رخ میدهند وزن داده می شود. جملاتی که در بخش های خاصی ظاهر می شوند (اولین و آخرین جملات پاراگرافها، اولین و آخرین پاراگرافها، جملاتی که پس از سرعنوان هایی مثل مقدمه و نتایج می آیند)، به نسبت سایر بخش ها، معرفی بهتری از محتوای متن هستند.

مشخص شد که در روش های نشانه، عنوان و محلی، احتمال توافقی بر روی جملات انتخابی بیشتر از هر نوع روش دیگری است که از ترکیب این روش ها با روش راهنما حاصل آمده باشد. این مسئله باعث شد تا ادموندسون نتیجه گیری کند که روش راهنما که فقط بر معیار بسامد تکیه دارد، نسبت به بقیه روش ها اهمیت کمتری دارد.