بخشی از پاورپوینت
--- پاورپوینت شامل تصاویر میباشد ----
اسلاید 1 :
نگاهی کوتاه
مقدمه
روش پیشنهادی
اسلاید 2 :
خلاصهسازی متن
انواع خلاصه سازی
خلاصهسازی چکیده ای
فشرده سازی جملات
آمیختن اطلاعات
اسلاید 3 :
خلاصهسازی متن
فرایند تولید خودکار نسخه ای کوتاه شده از یک متن که اطلاعات مفید را برای کاربر فراهم می آورد
اسلاید 4 :
انواع خلاصهسازی
از دیدگاه تغییر در جملهها:
گزینشی
چکیده ای
از دیدگاه تعداد سند ورودی:
تکسندی
چندسندی
از دیدگاه انعطافپذیری در نوع سندهای ورودی:
عمومی
محدود به حوزه
از دیدگاه تعامل با کاربر:
مبتنی بر پرسوجو
غیرمبتنی بر پرسوجو
اسلاید 5 :
فشرده سازی جملات
آمیختن اطلاعات
اسلاید 6 :
فشردهسازی جملات
Knight و Marcu (2002)
استفاده از پیکره Ziff-Davis و تولید 1067 جفت جملات فشرده شده و غیر فشرده شده
استفاده از درخت تجزیه
استفاده از دو روش برای یادگیری فشرده سازی
Noisy channel
Decision tree
اسلاید 7 :
Noisy channel
دیگر موارد کاربرد: ترجمه ماشینی، pos tagging ، تشخیص گفتار
با داشتن درخت غیرفشرده به دنبال زیردرخت فشرده اولیه هستیم
جمله کوتاه s و جمله بلند t
استفاده از فرمول های احتمال شرطی
P(s | t) = P(s) · P(t | s)
محاسبه احتمال P(s | t) برای هر زیر درخت ممکن با استفاده از پیکره
انتخاب زیر درخت محتمل تر
اسلاید 8 :
Decision tree
آموزش درخت بر اساس پیکره
انجام عمل shift یا reduce
اسلاید 9 :
آمیختن اطلاعات
Barzilay] و همکارانش، 1999[
استفاده از چندین سند
خوشه بندی جملات اسناد با استفاده از مولفه SimFinder (Hatzivassiloglou و همکارانش ، 1999)
تجزیه جملات به عبارات
اسلاید 10 :
آمیختن اطلاعات
تبدیل عبارات به فرم DSYNT
یک بازنمایی وابستگی که توسط یک تجزیه گر آماری ساخته می شود
فرم DSYNT برای جمله “U.S. fighter was shot by missile.”
یافتن اشتراک بیشینه ای که همه جمله های خوشه را در برگیرد
دادن خروجی مرحله قبل به مولد زبان FUF/SURGE و گرفتن جمله خروجی