بخشی از پاورپوینت
--- پاورپوینت شامل تصاویر میباشد ----
اسلاید 1 :
امروزه در عمدۀ روشهای هوشمند پردازش زبانی از دادگان و پیکرههای متنی برچسبدار استفاده میشود.
با وجود هزینۀ زیاد برای آمادهسازی پیکرهها، پروژههای بسیاری در زبانهای مختلف تعریف شده است.
در رویکردهای مبتنی بر پیکرهها نتایج پردازشی بهتری نسبت به رویکردهای مبتنی بر قاعده به دست آمده است.
اسلاید 2 :
در پروژههای اخیر پژوهشهای دفاعی ایالات متحده، یکی از دغدغههای اصلی در پردازش هوشمند متون، فرایند تهیۀ دادگان زبانی اعلام شده است.
انتخاب نظریۀ زبانی مناسب برای تهیۀ پیکرههای زبانی از اهمیت بسیار زیادی برخوردار است
اسلاید 3 :
معمولاً تهیۀ پیکرۀ زبانی هزینههای بسیار زیادی را از نظر زمانی و نیروی انسانی در بر میگیرد.
به عنوان مثال دو مرحله از تهیۀ پیکرۀ درختی چینی در مجموع 5 سال به طول انجامید.
برای این که پیکرۀ متنی نمایندگی کافی برای دادگان زبانی داشته باشد، باید اطلاعات اولیۀ مناسبی در مورد ویژگیهای زبانی کسب کرد که این خود فرایندی زمانبر است.
اسلاید 4 :
با توجه به دغدغههای موجود در زبان فارسی، پروژههایی با حمایت دبیرخانۀ شورای عالی اطلاعرسانی شکل گرفت.
پروژۀ ویراستیار اولین گام جدی در کاربردی کردن مسائل علمی دنیای پردازش متن در نرمافزارهای زبان فارسی بوده است.
پس از اتمام نسخۀ 1 ویراستیار دغدغههای پردازشی برای تحلیل نحو و معنا در زبان فارسی به وجود آمد.
اسلاید 5 :
برای پردازش نحو در زبان فارسی نیاز به دو مسألۀ اساسی است:
انتخاب یک نمایش زبانی مناسب و اصولی با توجه به خاصیتهای زبان فارسی
نیاز جدی به یک پیکرۀ برچسبخوردۀ نحو در زبان فارسی
در 28 زبان زندۀ دنیا چنین پیکرهای وجود داشته است.
اسلاید 6 :
تا آن زمان تنها پیکرۀ برچسبخوردۀ مناسب برای فهم زبان فارسی، پیکرۀ متنی بیجنخان بوده است.
تنها در آن اطلاعات ساختواژی زبان برچسب خورده است و اطلاعاتی در مورد ساختار نحوی و معنایی جملات وجود ندارد.
اسلاید 7 :
هماکنون دو نوع بازنمایی مرسوم در پیکرههای نحوی و معنایی زبانی در دنیا وجود دارد:
دستور زایشی: مانند پیکرۀ درختی پن، در این نوع از نمایش، جمله به عبارتهایی و عبارات به زیرعبارات و زیرعبارتها به واژهها تقسیمبندی میشوند.
دستور وابستگی: مانند پیکرۀ وابستگی پراگ که در این نوع از نمایش، ارتباطهای وابستگی بین واژهها مشخص میشود.
اسلاید 8 :
در هر دو نوع از بازنمایی میتوان سطح نحو و معنا را پوشش داد.
در بازنمایی وابستگی امکان نشان دادن جملات با بیترتیبی زبانی نسبت به بازنمایی زایشی بیشتر و مناسبتر است.
به همین دلیل در زبانهای بیترتیب مانند چکی، ترکی و عربی پیکرههای وابستگی ترجیح داده شدهاند.
در زبان فارسی نیز بیترتیبی وجود دارد.
اسلاید 9 :
پیکرههای با بازنمایی دستور وابستگی قابل تبدیل به پیکرۀ زایشی هستند ولی عکسِ این مسأله به صورت صد در صد امکانپذیر نیست.
دستور وابستگی به نمایش انسانی نزدیکتر است.
در دستور وابستگی بسیاری از اطلاعات واژگانی (مانند ظرفیت نحوی و معنایی) را میتوان به طور صریح در کمانهای وابستگی نشان داد.
با وجود این مسائل به این نتیجه رسیدهایم که دستور وابستگی را به عنوان بازنمایی نحوی پیکرۀ زبان فارسی برگزینیم.
اسلاید 10 :
این اصطلاح در کتاب «Dependency Parsing» دیده شد و با توجه به غریب بودن این مطلب تحقیقات در جهت شناخت این مسأله به وجود آمد.
در نهایت کتاب «ظرفیت فعل در زبان فارسی» به عنوان تنها کتاب مربوط به زبان فارسی پیدا شد.