بخشی از پاورپوینت

--- پاورپوینت شامل تصاویر میباشد ----

اسلاید 1 :

امروزه در عمدۀ روش‌های هوشمند پردازش زبانی از دادگان و پیکره‌های متنی برچسب‌دار استفاده می‌شود.
با وجود هزینۀ زیاد برای آماده‌سازی پیکره‌ها، پروژه‌های بسیاری در زبان‌های مختلف تعریف شده است.
در رویکردهای مبتنی بر پیکره‌ها نتایج پردازشی بهتری نسبت به رویکردهای مبتنی بر قاعده به دست آمده است.

اسلاید 2 :

در پروژه‌های اخیر پژوهش‌های دفاعی ایالات متحده، یکی از دغدغه‌های اصلی در پردازش هوشمند متون، فرایند تهیۀ دادگان زبانی اعلام شده است.
انتخاب نظریۀ زبانی مناسب برای تهیۀ پیکره‌های زبانی از اهمیت بسیار زیادی برخوردار است

اسلاید 3 :

معمولاً تهیۀ پیکرۀ زبانی هزینه‌های بسیار زیادی را از نظر زمانی و نیروی انسانی در بر می‌گیرد.
به عنوان مثال دو مرحله از تهیۀ پیکرۀ درختی چینی در مجموع 5 سال به طول انجامید.

برای این که پیکرۀ متنی نمایندگی کافی برای دادگان زبانی داشته باشد، باید اطلاعات اولیۀ مناسبی در مورد ویژگی‌های زبانی کسب کرد که این خود فرایندی زمان‌بر است.

اسلاید 4 :

با توجه به دغدغه‌های موجود در زبان فارسی، پروژه‌هایی با حمایت دبیرخانۀ شورای عالی اطلاع‌رسانی شکل گرفت.

پروژۀ ویراستیار اولین گام جدی در کاربردی کردن مسائل علمی دنیای پردازش متن در نرم‌افزارهای زبان فارسی بوده است.

پس از اتمام نسخۀ 1 ویراستیار دغدغه‌های پردازشی برای تحلیل نحو و معنا در زبان فارسی به وجود آمد.

اسلاید 5 :

برای پردازش نحو در زبان فارسی نیاز به دو مسألۀ اساسی است:
انتخاب یک نمایش زبانی مناسب و اصولی با توجه به خاصیت‌های زبان فارسی
نیاز جدی به یک پیکرۀ برچسب‌خوردۀ نحو در زبان فارسی
در 28 زبان زندۀ دنیا چنین پیکره‌ای وجود داشته است.

اسلاید 6 :

تا آن زمان تنها پیکرۀ برچسب‌خوردۀ مناسب برای فهم زبان فارسی، پیکرۀ متنی بی‌جن‌خان بوده است.
تنها در آن اطلاعات ساخت‌واژی زبان برچسب خورده است و اطلاعاتی در مورد ساختار نحوی و معنایی جملات وجود ندارد.

اسلاید 7 :

هم‌اکنون دو نوع بازنمایی مرسوم در پیکره‌های نحوی و معنایی زبانی در دنیا وجود دارد:
دستور زایشی: مانند پیکرۀ درختی پن، در این نوع از نمایش، جمله به عبارت‌هایی و عبارات به زیرعبارات و زیرعبارت‌ها به واژه‌ها تقسیم‌بندی می‌شوند.
دستور وابستگی: مانند پیکرۀ وابستگی پراگ که در این نوع از نمایش، ارتباط‌های وابستگی بین واژه‌ها مشخص می‌شود.

اسلاید 8 :

در هر دو نوع از بازنمایی می‌توان سطح نحو و معنا را پوشش داد.
در بازنمایی وابستگی امکان نشان دادن جملات با بی‌ترتیبی زبانی نسبت به بازنمایی زایشی بیش‌تر و مناسب‌تر است.
به همین دلیل در زبان‌های بی‌ترتیب مانند چکی، ترکی و عربی پیکره‌های وابستگی ترجیح داده شده‌اند.
در زبان فارسی نیز بی‌ترتیبی وجود دارد.

اسلاید 9 :


پیکره‌های با بازنمایی دستور وابستگی قابل تبدیل به پیکرۀ زایشی هستند ولی عکسِ این مسأله به صورت صد در صد امکان‌پذیر نیست.
دستور وابستگی به نمایش انسانی نزدیک‌تر است.
در دستور وابستگی بسیاری از اطلاعات واژگانی (مانند ظرفیت نحوی و معنایی) را می‌توان به طور صریح در کمان‌های وابستگی نشان داد.

با وجود این مسائل به این نتیجه رسیده‌ایم که دستور وابستگی را به عنوان بازنمایی نحوی پیکرۀ زبان فارسی برگزینیم.

اسلاید 10 :

این اصطلاح در کتاب «Dependency Parsing» دیده شد و با توجه به غریب بودن این مطلب تحقیقات در جهت شناخت این مسأله به وجود آمد.

در نهایت کتاب «ظرفیت فعل در زبان فارسی» به عنوان تنها کتاب مربوط به زبان فارسی پیدا شد.

در متن اصلی پاورپوینت به هم ریختگی وجود ندارد. برای مطالعه بیشتر پاورپوینت آن را خریداری کنید