بخشی از مقاله

چکیده

این پژوهش با هدف شناسایی گرایشهاي پژوهشی اصلی حوزه ترجمه ماشینی انجام شد. براي شناسایی این گرایشها از روش متن کاوي استفاده شد. ترجمه ماشینی حوزهاي میان رشته است که هدف آن ترجمه متون علمی در یک زبان با متن مشابه در زبانی دیگر است. در این پژوهش انتشارات پژوهشی این حوزه در سالهاي 2006 تا 2015 به روش متن کاوي مورد تحلیل قرار گرفت.

پیکره پژوهش از انتشارات علمی این حوزه در پایگاه اسکوپوس استخراج گردید. متن کاوي با استفاده از روش هم رخدادي واژهها انجام شد. این روش بینشی کامل نسبت به ساختار علمی و گرایشهاي پژوهشی این حوزه ارایه نمود. تحلیل هم رخدادي واژهها یکی از روشهاي تحلیل محتوا است که در این پژوهش روي پیکره انتشارات حوزه ترجمه ماشینی اجرا شد. از دیداري سازي حوزههاي دانش،براي نمایش شبکه واژگان عناوین و چکیدههاي مقالات ترجمه ماشینی استفاده شد.

در نهایت نتایج تحلیل متن کاوي، ساختار علمی این حوزه را بر اساس خوشههاي موضوعی آن شناسایی کرد. یافتههاي پژوهش شامل شنا سایی چهار خو شه مو ضوعی ا ست که گرایشهاي ا صلی تحقیقاتی در این حوزه ب شمار میآیند. در این میان دو خوشه برتر تحت عنوان ترجمه ماشینی آماري و ترجمه خودکار و ارتباطات کاربران به عنوان گرایشهاي اصلی پژوهشی حوزه ترجمه ماشینی معرفی شد.

-1 مقدمه

با افزایش بهره گیري از امکاناتی که فناوري اطلاعات و ارتباطات در اختیار محققین قرار داده است، فرایندهاي تولید، ذخیره سازي و ا شاعه اطلاعات دچار تغییرات شگرفی شده ا ست. امروزه پایگاههاي اطلاعاتی عظیم میلیونها رکورد اطلاعاتی را در اختیار دارند. علاوه بر این شبکه جهانی وب نیز سر شار از منابع متنی ا ست. به جرات میتوان گفت کمتر مو ضوعی را میتوان یافت که جستجوي اطلاعات در وب، حجم عظیمی از منابع را در آن خصوص بازیابی ننماید.

این حجم عظیم منابع متنی باعث شده است که تحلیل و پردازش متون به صورت دستی در محیط اطلاعاتی امروز کاري صعب و طاقت فر سا تلقی شود. نتایج بازیابی شده نیز دیگر چندان قابل اعتماد و تعمیم نی ست. ا ستفاده از سی ستمهاي خودکار تحلیل متن، میتواند جوابگوي این نیاز باشد. این دستاوردها به نحو شگفت انگیزي در وقت و انرژي کاربر صرفه جویی مینماید.

از جمله نظامهاي خودکاري که در این زمینه به یاري کاربر شتافته تا بهره مناسبی از منابع سایر زبانها ببرد، نظام ترجمه ماشینی است. ترجمه ماشینی زیر شاخهاي از حوزه پردازش زبان طبیعی است. علوم دیگر از جمله فناوري اطلاعات و زبانشناسی نیز در تحقیقات آن مشارکت دارند. هدف ترجمه ماشینی، ترجمه زبانهاي انسانی به شکلی خودکار است که کاربر را قادر سازد از این زبانها و منابع نوشتاري آنها بهره ببرد.

حوزههاي درگیر در تو سعه دانش ترجمه ما شینی داراي تنوع ب سیار میبا شد. در عین حال جامعه پژوه شی بزرگی نیز در سراسر دنیا به پژوهش در این حوزه و انتشار یافتههاي آن از طریق مجلات علمی و یا ارائه در کنفرانسهاي بین المللی مشغولند.

حجم زیاد پژوهشها و ابزار ترجمه ماشینی، نیاز به معیارهاي ارزیابی در این حوزه را ضروري ساخته است.[1] از جمله حوزههاي پژوه شی مهم ترجمه ما شینی میتوان به برر سی کارامدي این نظامها در اجراي دقیق ترجمه متون ا شاره نمود. بدیهی است که علاوه بر سرعت، کیفیت ترجمه ماشینی از نکات حائز اهمیت بشمار میرود. این افزایش کیفیت در طول زمان به مدد ارزیابی نظامهاي موجود و مشخص شدن نقاط ضعف آنها حاصل شده است. پژوهش در این حوزه با شتاب و وسعت مثال زدنی به پیش میرود. جنبههاي اقتصادي ترجمه ماشینی و نیاز به معیارهاي جدید بررسی کارامدي، از حوزههاي پژوهشی دیگري است که به موارد پیشین اضافه شده است. بنابراین نیازي ضروري براي بررسی وضعیت تولید علم و پژوهش در این حوزه و پیش بینی سمت و سوي تحقیقات آینده در آن احساس میشود.

در جهت آشنایی با وضعیت کنونی تحقیق در این حوزه باید به شناسایی نقاط اصلی پژوهشی این حوزه پرداخت. با شنا سایی آنها میتوان به تحقیقات جدید د ست زد. باید دید جامعی ن سبت به گذ شته، حال و پیش بینی آینده این حوزه دا شت. چنین چشم اندازي با تحلیل متن کاوي انتشارات حوزه ترجمه ماشینی حاصل میشود. بنابراین مساله اصلی این پژوهش شناسایی حوزههاي موضوعی اصلی و چالشهاي تحقیقاتی این حوزه است.

-2 مروري بر پژوهشهاي مرتبط

ترجمه ماشینی استفاده از سیستمهاي رایانهاي براي ترجمه متن است. دو زبان منبع و هدف در این فرایند دخیل میباشد.[2] هدف این فرایند آن است که مشارکت انسانی در آن به حداقل برسد. رویکردهاي مختلفی در این حوزه وجود دارد که جدیدترین و موفق ترین آنها شیوه ترجمه ماشینی آماري است. دراین رویکرد براي ترجمه از پیکرههاي متنی موازي استفاده میشود. این شیوه، برخلاف دیگر رویکردها چندان وابستگی به دانش انسانی ندارد.

امروزه در بسیاري از رشتههاي علمی از تحقیقات علم سنجی براي شناسایی موثرترین مولفین، مقالات و نشریات یک حوزه استفاده شده است. در رشته زبانشناسی رایانهاي و حوزه ترجمه ماشینی اما چنین پژوهش هایی کمتر انجام شده است. از معدود پژوهشهاي انجام شده در این خصوص میتوان به پژوهشی تحت عنوان از زبانشناسی رایانهاي تا تاریخ نگاري الگوریتمیک اشاره کرد.[3] در این پژوهش برخی مشکلات ترجمه ماشینی ذکر شده است. ضمنا بر اهمیت نگاشت معنایی واژهها در پژوهشهاي علم سنجی تاکید ویژه شده است.

در پژوهشی دیگر[4] به بررسی علم سنجی حوزه ترجمه ماشینی پرداخ ته شده است. روش تحلیل کمی و تحلیل استنادي مقالات این حوزه نشان داد که ترجمه ماشینی به شاخص هایی علاوه بر کارامدي احتیاج دارد. این پژوهش از جمله اولین گامها در تحلیل علم سنجی ترجمه ماشینی است. در آن تحلیل مجموعه مقالات یک کنفرانس آمریکایی در حوزه زبانشناسی با شاخصهاي علم سنجی تحلیل شد. همانگونه که م شخص ا ست این تحلیل به دلیل محدودیت پیکره مورد برر سی قابل اعتماد و تعمیم نمی باشد.

با برر سی پژوهشهاي داخل ک شور، پژوه شهایی که در آن از روش علم سنجی یا متن کاوي براي برر سی تحقیقات ترجمه ماشینی استفاده شده باشد کمترمشاهده میشود. از موارد محدود مرتبط با این زمینه میتوان به پژوهشهاي زیر اشاره کرد:

فلاحتی، احمدي نسب و خانی - در دست چاپ - به بررسی روند مطالعات ترجمه در ایران پرداختند. آنها با بررسی نشریات رتبه دار وزارت علوم تلاش نمودند تا حوزههاي پژوهشی برتر و کمبودهاي تحقیقاتی در این زمینه را مشخص سازند. در نهایت موضوعاتی چون اصول و روش ترجمه، آموزش ترجمه و ترجمه متون مذهبی از جمله مهم ترین حوزههاي پژوهشی در این مجموعه شناخته شد. تفاوت پژوهش حاضر با این پژوهش در گستره بین المللی آن و استفاده از روش تحلیل علم سنجی و متن کاوي حوزههاي دانش است.

در پژوهشی دیگر مجموعه مقالات دو دهه اخیر کنفرانسهاي زبانشناسی با روش علم سنجی تحلیل شد.[5] مقالات هفت سمینار زبانشناسی داخلی با معیارها و شاخصهاي علم سنجی تحلیل شد. یافتههاي این پژوهش نشان داد که در طول زمان چه حوزه هایی بیشتر مورد استقبال قرار گرفته است. موثر ترین مقالات و مولفین و دانشگاهها مشخص شد و افزایش سهم زنان مولف نشان داده شد.

بهره گیري از روش متن کاوي براي تحلیل ساختارعلمی و گرایشهاي پژوهشی در حوزههاي مختلف به کرات انجام شده است. متن کاوي به روشهاي مختلف انجام میشود. یکی از شیوههاي مرسوم، استفاده از تحلیل هم رخدادي واژهها است. این شیوه اولین بار تو سط محققان فران سوي بکار گرفته شد.[6] از آن زمان پتان سیلها و امکانات این روش با بهره گیري از تکنیکها و ابزار جدید توسعه بیشتري یافته است. برخی پژوهشگران تحلیل هم واژه را نوعی تحلیل کتابسنجی دانسته اند، که در آن هم رخدادي واژهها مورد بررسی قرار میگیرد.[7] در این روش، پویایی رشتههاي علمی با استفاده از ماتریس هم رخدادي واژهها که از پیکرههاي انتشارات علمی استخراج شده است، متن کاوي و بازنمون میگردد.

از این روش در تحلیل موضوعی بسیاري از رشتههاي علمی استفاده شده است. کارهایی در حوزه نانوتکنولوژي[8]، مدیریت دانش[9]،فنوم انسانی[10]، ژنتیک[11] و اطلاعات پزشکی[12] از این جمله است. این روش تاکنون در حوزه ترجمه ماشینی استفاده نشده است و این پژوهش در نوع خود اولین بار صورت میپذیرد.

-3 روش شناسی

این پژوهش به روش متن کاوي انجام شده است. در روش متن کاوي واژههاي کلیدي انتشارات حوزه ترجمه ماشینی از عناوین و چکیده مقالات پیکره پژوهش استخراج گردید. جامعه پژوهش، کلیه مقالات منتشره این حوزه در سطح بین المللی در سالهاي 2006 تا 2015 است. پیکره پژوهش با جستجوي عبارت ترجمه ماشینی و ترجمه خودکار در فیلد عنوان و چکیده مقالات پایگاه اسکوپوس استخراج شد.

آنگاه با استفاده از فیلتر مقاله، تنها مقالات نشریات و کنفرانسهاي علمی مورد بررسی قرار گرفت. اطلاعات مورد نیاز براي تحلیل متن کاوي از این پیکره استخراج گردید. براي تحلیل متن کاوي، کلید واژههاي عناوین و چکیده مقالات موجود در پیکره استخراج شد. سپس کلیدواژههاي استخراج شده با نرم افزار ووسویور نرمال سازي شد.

جهت تولید ماتریس هم رخدادي واژهها که نشان دهنده گرایشات موضوعی حوزه ترجمه ماشینی است از الگوریتم دیداري سازي مشابهتها استفاده شد. پس از تشکیل ماتریس هم رخدادي از نرم افزار ووسویور جهت دیداري سازي شبکه واژهها استفاده شد. با تشکیل شبکه واژهها از روشهاي تحلیل شبکه، نگارههاي تولید شده تفسیر شد. بر این اساس خوشههاي موضوعی تشکیل شده و روابط بین آنها بعنوان بازنمون متن کاوي پیکره پژوهش معرفی شد. این خوشهها نشان دهنده گرایشات پژوهشی برتر حوزه ترجمه ماشینی است که در بخش بعد به تفصیل شرح داده میشود.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید