بخشی از پاورپوینت
--- پاورپوینت شامل تصاویر میباشد ----
اسلاید 1 :
مقدمه
خلاصهسازی متن
انواع خلاصه سازی
خلاصهسازی چکیده ای
فشرده سازی جملات
آمیختن اطلاعات
اسلاید 2 :
خلاصهسازی متن
خلاصهسازی متن
فرایند تولید خودکار نسخه ای کوتاه شده از یک متن که اطلاعات مفید را برای کاربر فراهم می آورد
اسلاید 3 :
انواع خلاصهسازی
از دیدگاه تغییر در جملهها:
گزینشی
چکیده ای
از دیدگاه تعداد سند ورودی:
تکسندی
چندسندی
از دیدگاه انعطافپذیری در نوع سندهای ورودی:
عمومی
محدود به حوزه
از دیدگاه تعامل با کاربر:
مبتنی بر پرسوجو
غیرمبتنی بر پرسوجو
اسلاید 4 :
خلاصهسازی چکیدهای
فشرده سازی جملات
آمیختن اطلاعات
اسلاید 5 :
فشردهسازی جملات
فشردهسازی جملات
Knight و Marcu (2002)
استفاده از پیکره Ziff-Davis و تولید 1067 جفت جملات فشرده شده و غیر فشرده شده
استفاده از درخت تجزیه
استفاده از دو روش برای یادگیری فشرده سازی
Noisy channel
Decision tree
اسلاید 6 :
Noisy channel
دیگر موارد کاربرد: ترجمه ماشینی، pos tagging ، تشخیص گفتار
با داشتن درخت غیرفشرده به دنبال زیردرخت فشرده اولیه هستیم
جمله کوتاه s و جمله بلند t
استفاده از فرمول های احتمال شرطی
P(s | t) = P(s) · P(t | s)
محاسبه احتمال P(s | t) برای هر زیر درخت ممکن با استفاده از پیکره
انتخاب زیر درخت محتمل تر
اسلاید 7 :
Decision tree
آموزش درخت بر اساس پیکره
انجام عمل shift یا reduce
اسلاید 8 :
آمیختن اطلاعات
آمیختن اطلاعات
Barzilay] و همکارانش، 1999[
استفاده از چندین سند
خوشه بندی جملات اسناد با استفاده از مولفه SimFinder (Hatzivassiloglou و همکارانش ، 1999)
تجزیه جملات به عبارات
اسلاید 9 :
تبدیل عبارات به فرم DSYNT
یک بازنمایی وابستگی که توسط یک تجزیه گر آماری ساخته می شود
فرم DSYNT برای جمله “U.S. fighter was shot by missile.”
یافتن اشتراک بیشینه ای که همه جمله های خوشه را در برگیرد
دادن خروجی مرحله قبل به مولد زبان FUF/SURGE و گرفتن جمله خروجی
اسلاید 10 :
روش پیشنهادی
پیکره مورد استفاده
تشابه جملات
حذف کلمات اضافه
حذف ویا ادغام جملات
ارزیابی