بررسی ساختار برنامه ی تولید متن پیچیده

بخش های مختلفی این پاسخ نسبتاً پیچیده از متون ضبط شده ای استخراج شده اند که در بخش های مختلف شبکهٔ ابررسانه ای وجود داشته اند.                                                                  

دماسکو و مک کوی (۱۹۹۲) یک برنامهٔ تولید متن پیچیده را توضیح داده اند. آنها درصدد تهیه یک میانجی بوده اند تا در نوشتن متن به افراد ناتوان حرکتی کمک کند. یک صفحه کلید مجازی به بهره گیران اجازه می دهد تا از میان نامه ها، کلمات یا عبارات نمایش داده شده دست به انتخاب بزنند؛ سپس برای تهیه یک جملهٔ خوش ساخت . از یک تجزیه گر معنایی استفاده می شود. آنها برای اشاره به فرآیند دریافت کلمات انتخابی "جان"، " میخواند . جغرافیا، بزرگ" و "دانشگاه و ساختن جملهٔ جان در یک دانشگاه بزرگ جغرافیا می خواند ، اصطلاح جمله سازی را به کار برده اند. این برنامه هنوز در مرحله ازمایشی قرار دارد و از سال ۱۹۹۲ به بعد، با واژگان محدودی متشکل از ۰ ۰ ۲۰ کلمه اجرا می شود. کرجی یو (۱۹۹۲) با موقعیت تولید متن تخصصی دیگری سروکار داشته است. در این نمونه، از داده های هواشناسی می توان گزارشات هواشناسی چندوجهی تهیه کرد. متناسب با درخواست بهره گیر، میتوان این گزارشات را به صورت متن روایی، نقشه ها، جداول یا ترکیبی از انها ارائه داد.

بعضی از فعالیت های مربوط به پردازش متن که در چند سال گذشته صورت گرفته، حاصل پیشرفت کاملی است که در سیستم های عامل پدید آمده است. مثلاً سیستم کانسترو که گروه کارنگی" برای خبرگزاری رویترز ایجاد کرده اند از سال ۱۹۸۸ فعالیت خود را آغاز کرده است. سیستم کانسترو برای انجام طبقه بندی های محدود (قراردادن اخبار در ۲۰۰ مقوله مختلف) موفقیت آمیز بوده است. هرچند هزینهٔ تهیه آن زیاد بوده است (۹/۵ نفر سال)، اما این سیستم جایگزین چندین نمایه ساز انسانی شده است. برآورد شده بود که استفاده از این سیستم در سال ۱۹۹۰، بالغ بر ۷۵۲٫۰۰۰ دلار از هزینه های خبرگزاری رویترز میکاهد و پیش بینی می شد که در سال ۱۹۹۱ بالغ بر ۱٫۲۶۴,۰۰۰ دلار از هزینههای آن خواهد کاست. پردازش بسیار سریع و متجانس تر، از دیگر ادعاهای تولیدکنندگان این سیستم بوده است .

نرمافزاری که برای خبرگزاری رویترز تهیه شده است را میتوان در گروه محصولات تجاری، بستر مقوله بندی متن (تکس)"، قرار داد که با حداکثر ۶۷۴ مقوله عمل میکند. بستر مقوله بندی متن (تکس) در یک برنامه طبقه بندی دولتی نیز مورد استفاده قرار گرفته که مستلزم ارسال پیام ها به تحلیلگران هوشمند است. در این سیستم فقط پنج مقوله وجود دارد (هایز1992a)