مقاله خلاصه‌سازی خودکار متون با استفاده از شبکه عصبی بازگشتی

فایل pdf

7 صفحه

قیمت مقاله 000 49 تومان

شرکت مگ ایرانز ضمانت می کند تا 48 ساعت ،اگر به هر دلیلی از خرید خود ناراضی بودید ، مبلغ آن به صورت کامل و بدون چون و چرا، برگشت داده شود .جهت درخواست برگشت وجه ، با پشتیبانی تماس بگیرید .

بخشی از مقاله

چکیده

خلاصه سازی متن، عبارت است از حذف دادههای تکراری به صورتی که اطلاعات مهم استخراج شده، به بهترین شکل ممکن نمایش داده شوند. همزمان با رشد سریع و مواجهه با حجم وسیعی از اطلاعات در فضای وب نظیر وبسایتها و شبکههای اجتماعی، این شیوه کمک شایانی به تحلیل متن در بحث جستجوی اطلاعات میکند و از آن به عنوان یک امتیاز در برنامه های کاربردی استفاده میشود.از سالها پیش شیوه خلاصه سازی خودکار در مباحث پردازش زبان طبیعی و خلاصه متون خصوصا وقتی همراه با خلاصه سازی نظرات نویسنده همراه شد، به نقطه اوج خود رسید. دیدگاهها نقش کلیدی در تصمیمات گرفته شده توسط جوامع دارند از اینرو برای افراد تصمیم گیرنده بسیار حائز اهمیت هستند. در این مقاله خلاصهسازی متون با استفاده از شبکه عصبی بازگشتی ارائه خواهد شد، که از یک معماری کدگذاری دقیق و کدگشای بازگشتی بهره گرفته است. نتایج تجربی، نشان از برتری روش پیشنهادی نسبت به برخی از روشهای پایه دارد.

واژگان کلیدی: خلاصهسازی متن، افزونگی داده، معماری کدگذاری-کدگشای، شبکه عصبی بازگشتی.

-1 مقدمه

بسیاری اوقات مشاهده حجم زیادی از اطلاعات در سطح وب میتواند یانگر نقطهنظرات یکسانی باشند. خلاصه سازی از روی محتوای غیرضروری یک ضرورت محسوب میشود . - Steinberger, 2007 - همچنان، تقاضا برای خلاصههای با کیفیت، رو به افزایش است خواه راجع به خلاصه سازی از محتوای متنی باشد - مثل کتاب و ... - یا محتوای چند رسانهای از قبیل کپیهای ویدئویی . - Ding, 2012 - بعضا به جز مواردی که اسناد با محتوای زائد بسیار - از قبیل باز بینی محصول، بلاگها، مقالات روزنامهها - داشته باشیم، ممکن است نیازی به کارامدی خلاصه سازی چکیده - Carenini, 2008 - نسبت به خلاصههای استخراجی نداشته باشیم. چرا که تولید یک خلاصه چکیده به مراتب سختتر از خلاصه استخراجی است.

تکنیکهای خلاصه سازی چکیده متن شامل شیوه مبتنی بر قواعد - Genest, 2012 - و متراکم سازی جمله - Clarke, 2006; Knight, 2002; - Zajic, 2007 و همچنین ادغام جمله بر پایه ارتباطات معنای - Liu, 2015; Wang, 2008 - میباشد. الگوریتمهای مبتنی بر گراف به طور خاص ثابت کردهاند که به خوبی روی خلاصه سازی متون با حجم زیادی از دادههای زائد کار میکنند . - Ganesan, 2010; Lloret, 2011 - اهرم ویکی پدیا با قدرت نفوذ بالا در کنار دیگر الگوریتمها به تولید خلاصه سازی استخراجی میپردازد . - Wang, 2008 - نحوه انجام کار بدین صورت است که ابتدا تمام جملات را به موضوع ویکی پدیا نظیر به نظیر نگاشت میکند. حاصل انجام کار یک گراف دو قسمتی است که در آن یکی از رئوس موضوعات ویکی پدیا را نشان می-دهد و دیگر رئوس جملات را در آن سند مشخص میکند .

در مرحله بعد، یک الگوریتم رتبه بندی تکرار شونده استفاده می-شود تا بهترین جملات کاندید را در سند پیدا کند. به این صورت، خلاصههای افزایشی از نوع استخراجی در لحظه ایجاد می-شوند که دقت انجام کار در آن در مقایسه با نتایج حاصله از تکنیکهای چکیده کمتر خواهد بود.لیو اف - Liu, 2015 - از پیشرفتهای صورت گرفته در ارائه معنایی متن در قالب گراف برای شکل گیری خلاصه ها استفاده میکند. چارچوب خلاصه سازی شامل تجزیه جملات ورودی برای شکلگیری گرافهای منحصر به فرد AMR میباشد که همزمان با ترکیب این گراف-ها، یک گراف خلاصه AMR شکل میگیرد و سپس تولید متن از روی این گراف خلاصه انجام میگیرد. تک گرافها با استفاده از یک مدل پیش بینی با الگوریتم پرسپترون به گراف خلاصه تبدیل میشوند. بدین شکل زیرگرافی که میبایست برای تولید خلاصه انتخاب گردد، پیش بینی میشود.

گانسان کی - Ganesan, 2010 - شیوه ای را توصیف میکند که در آن از گرافهای جهتدار و ترتیب کلمات جمله اصلی برای تولید خلاصههای انتزاعی میشود. از طریق این تکنیک، یک قالب گرافیکی از متن ورودی به منظور کاهش افزونگی، در دسترس قرار میگیرد. اگر الگوریتم، دو جمله با قابلیت کوچک شدن پیدا کند، میتواند از یکی از کانکتورها به عنوان کانکتور برای جمله نهایی استفاده کند. این تکنیک در حین کارآمدی، یک اشکال دارد، آن هم زمانی است که ممکن است دو جمله با قابلیت ترکیب شدن وجود داشته باشند اما به خاطر فقدان کانکتور، قابل ترکیب شدن نباشند. لیورت ای - Lloret, 2011 - تکنیکی را توصیف میکند که در آن یک گراف کلمه وزندار - جهتدار - ساخته شده که هر کلمه متن نشان دهنده یک نود است و لبه در بردارنده یک ارتباط مجاور بین کلمهای است.

برای تعیین جملات مهم، اولین نود شامل اولین ده کلمه با بالاترین امتیاز TF-IDF است. صحت جمله با استفاده از قواعد پایهای گرامر، نظیر اینکه طول جمله نباید بزرگتر از سه کلمه باشد، یک جمله بایستی شامل یک فعل بوده و نباید با یک حرف تعریف یا حرف رابط خاتمه یابد، تضمین میشود. یک نقص بزرگ در این روش این است که اطلاعات مهم زیادی به خاطر تحمیلهایی از سوی گرامر روی جملات و مجوز انتخاب ده کلمه با بالاترین مقدار TF-IDF از دست میروند . علاوه بر آن، یک تعداد زیادی جمله زائد هستند که در خلاصه نمایش داده خواهند شد. زیرا مقادیر TF-IDF بیشترین اهمیت را به آنها خواهد داد. متدلوژی ما با ناکارآمدی مواجه نمیشود زیرا افزونگیها در ساختار گراف ایجاد شده ماهیتا گنجانده شدهاندW{1,2,3} و

-2 معماری بازگشتی مبتنی بر دقت

فرض کنید x بیانگر جمله ورودی باشد که شامل ترتیبی از M کلمه باشد، x= [x1, .., xM]، به طوری که هر کلمه xi بخشی از مجموعه واژگان V باشد که اندازه |V| = V است. کاری که ما باید انجام دهیم این است که ترتیب y = [y1, ..., yN] با N کلمه را که N < M باشد تولید کنیم، به طوری که از مفهوم x محافظت شود، y = armaxy P - y|x - که y یک متغیر تصادفی است و بیانگر ترتیبی از N کلمه میباشد.معمولا احتمال شرطی توسط تابع پارامتری با پارامترهای θ مدل میشود، - .P - y|x - = P - y|x; فاز آموزش شامل یافتن است که احتمال شرطی دوتاییهای جمله خلاصه را در یادگیری بیشینه میکند. اگر مدل برای تولید کلمه بعدی خلاصه جمله با توجه به کلمه قبلی آموزش دیده باشد، آنگاه شرط فوق را میتوان به صورت ضرب احتمالات شرطی در رابطه - 1 - نوشت.ما در این مقاله این احتمال شرطی را با استفاده از معماری کدگذاری- کدگشای شبکه عصبی بازگشتی - RNN - 1 مدلسازی کردهایم که الهام گرفته از روش چو و همکارانش - Cho, 2014 - میباشد که بعدها توسط باهدانا و همکارانش - Bahdanau, - 2014 گسترش داده شد. این مدل خلاصه ساز دقیق بازگشتی - RAS - 2 نامیده میشود.

1؛-2 کدگشای بازگشتی
احتمال شرطی فوق با استفاده از یک RNN به صورت - 2 - مدل میشود.

که ht حالت مخفی RNN به صروت نشان داده شده در - 3 - است.

در اینجا ct خروجی ماژول کدگذار است که میتواند مانند یک بردار محتوا رویت شود که به صورت تابعی از حالت بازگشتی ht-1 و ترتیب ورودی x محاسبه میشود. در این صورت RNN به صورت - 4 - است . - Elman, 1990 -
که در آن یک تابع سینوسی و p سافتمکس است و به صورت مربوط به پارامترهای قابل یادگیر با اندازههای

کدگذار 3LSTMبه صورت زیر تعریف میشود : - Hochreiter, 1997 -

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید

ادرس کوتاه https://magirans.com/id/86401

مقالت رو پیدا نکردی ؟

ما رایگان واست سرچ میکنیم .فقط کافیه موضوع و شماره موبایلت را در کادر ثبت موضوع ، وارد کنی و تمام . ما لیستی از بهترین عناوین که مرتبط با موضوع شماست را در (روبیکا ، ایگپ ، ایتا یا واتساپ) تقدیمتون میکنیم.

ثبت موضوع

با تشکر از شما
درخواست بررسی موضوع مقاله شما با موفقیت ثبت گردید . کارشناسان ما بزودی نتیجه بررسی را به شما اطلاع میدهند .

درباره مگ ایرانز

مگیرانز برندی معتبر در بین کاربران فضای علمی ایران

مگ ایرانز یک سایت خدماتی اینترنتی محسوب می شود که روزانه مقالات و پاورپوینت های زیادی را جمع آوری ، تهیه و در دسترس دانشجویان ، دانش‌آموزان و محققین قرار می‌دهد . گروه مگ ایرانز در سال 1390 زمانی که هنوز کسب و کارها حالت سنتی داشتند و کافی نت ها به صورت حضوری در سطح شهر فعالیت می‌کردند با ایده کافی نت آنلاین راه اندازی شد . طرح اولیه این شرکت در ابتدا با ایده و تلاش دو دانشجوی خلاق راه اندازی گشت . سپس در سال دوم راه اندازی ، پس از مستقر شدن در دفتر کاری مجهز و استخدام چند نیروی ماهر ،توانستند در طول 5 سال به اهداف خود یعنی 1- رضایت و اعتبارحداکثری در بین کاربران اینترنتی 2- گرد اوری بانکی جامع از مقالات ( 60 هزار مقاله و پاورپوینت فارسی وقابل ویرایش ) 3- همکاری با بیش از 100 کافینت در سطح ایران ، دست پیدا کنند و این راه همچنان ادامه دارد . . .

تماس با ما

سوالات متداول

مقاله خلاصه‌سازی خودکار متون با استفاده از شبکه عصبی بازگشتی

بخشی از مقاله

چرا مگ ایرانز؟

دانلود مقاله بررسی روش های خلاصه سازی خودکار متن

دانلود فایل پاورپوینت مدلسازی سیستم های بیولو ژیکی توسط شبکه های عصبی بازگشتی

مقاله ارائه روشی جهت خلاصه سازی خودکار چندسندی با کمک تکنیک فاکتورگیری ماتریس نامنفی ( NMF )

مقاله رنگی سازی خودکار فیلم های سیاه و سفید به کمک فیلترهای گابور و شبکه های عصبی مصنوعی

مقاله ارائه یک مدل جدید مبتنی بر گراف جهت خلاصه سازی چندسندی متون

مقاله شبیه سازی معماری شبکه عصبی مبتنی بر مدل مرجع نانوسنسور زیستی تشخیص بیماری سرطان و دستگاه تحویل خودکار دارو با نرم افزار مطلب

مقاله تاثیر مدل‌سازی سیستم زمین بر ولتاژ بازگشتی گذرای ناشی از کلیدزنی بانک خازنی در نیروگاه بادی متصل به شبکه‌ی قدرت

مقاله تحلیل اجزای محدود فازی با استفاده از شبکه های عصبی بازگشتی و الگوریتم تکاملی تفاضلی

مقاله تخمین نشست تحکیمی خاک با استفاده از پارامترهای فیزیکی خاکهای ریزدانه ارومیه بوسیله شبکه عصبی بازگشتی

مقاله تعمیم با لا بردن سرعت الگریتمهای مرتب سازی بازگشتی با پیاده سازی الگریتم مرتب سازی ادغامی بر روی FPGA

مقاله تشخیص دست نوشته با استفاده از شبکه های عصبی مصنوعی بازگشتی LSTM

مقاله تشخیص کاراکترها در متون فارسی با استفاده از شبکه عصبی

مقاله تشخیص محل کسره اضافه در متون فارسی با استفاده از شبکه های عصبی

مقاله جبران¬سازی مدل خطی ربات زیرآبی با قابلیت کنترل از راه دور با تلفیق شبکه عصبی بازگشتی و کنترل مدل پیش¬بین

مقاله سامانة خودکار خلاصه‌سازی با استفاده از روش‌ تعبیة متن

مقاله سامانه شناسی ، مدل سازی و تحلیل ایمنی راکتور تحقیقاتی تهران در شرایط حوادث ناشی ازدست رفتن جریان خنک کننده با شبکه عصبی مصنوعی بازگشتی

مقاله شبیه سازی دمای خاک در اعماق مختلف با استفاده از الگوریتم ترکیبی شبکه عصبی ژنتیک ( ANN - GA ) و شبکه عصبی ( ANN ) ( منطقه موردی : ایستگاه سینوپتیک زابل )

مقاله شناسایی ذهنیت متون زبان طبیعی با استفاده از شبکه های عصبی مصنوعی

مقالت رو پیدا نکردی ؟

درباره مگ ایرانز

مگیرانز برندی معتبر در بین کاربران فضای علمی ایران

مقاله خلاصه‌سازی خودکار متون با استفاده از شبکه عصبی بازگشتی

بخشی از مقاله

چرا مگ ایرانز؟

مقالات مرتبط با این مقاله

دانلود مقاله بررسی روش های خلاصه سازی خودکار متن

دانلود فایل پاورپوینت مدلسازی سیستم های بیولو ژیکی توسط شبکه های عصبی بازگشتی

مقاله ارائه روشی جهت خلاصه سازی خودکار چندسندی با کمک تکنیک فاکتورگیری ماتریس نامنفی ( NMF )

مقاله رنگی سازی خودکار فیلم های سیاه و سفید به کمک فیلترهای گابور و شبکه های عصبی مصنوعی

مقاله ارائه یک مدل جدید مبتنی بر گراف جهت خلاصه سازی چندسندی متون

مقاله شبیه سازی معماری شبکه عصبی مبتنی بر مدل مرجع نانوسنسور زیستی تشخیص بیماری سرطان و دستگاه تحویل خودکار دارو با نرم افزار مطلب

مقاله تاثیر مدل‌سازی سیستم زمین بر ولتاژ بازگشتی گذرای ناشی از کلیدزنی بانک خازنی در نیروگاه بادی متصل به شبکه‌ی قدرت

مقاله تحلیل اجزای محدود فازی با استفاده از شبکه های عصبی بازگشتی و الگوریتم تکاملی تفاضلی

مقاله تخمین نشست تحکیمی خاک با استفاده از پارامترهای فیزیکی خاکهای ریزدانه ارومیه بوسیله شبکه عصبی بازگشتی

مقاله تعمیم با لا بردن سرعت الگریتمهای مرتب سازی بازگشتی با پیاده سازی الگریتم مرتب سازی ادغامی بر روی FPGA

مقاله تشخیص دست نوشته با استفاده از شبکه های عصبی مصنوعی بازگشتی LSTM

مقاله تشخیص کاراکترها در متون فارسی با استفاده از شبکه عصبی

مقاله تشخیص محل کسره اضافه در متون فارسی با استفاده از شبکه های عصبی

مقاله جبران¬سازی مدل خطی ربات زیرآبی با قابلیت کنترل از راه دور با تلفیق شبکه عصبی بازگشتی و کنترل مدل پیش¬بین

مقاله سامانة خودکار خلاصه‌سازی با استفاده از روش‌ تعبیة متن

مقاله سامانه شناسی ، مدل سازی و تحلیل ایمنی راکتور تحقیقاتی تهران در شرایط حوادث ناشی ازدست رفتن جریان خنک کننده با شبکه عصبی مصنوعی بازگشتی

مقاله شبیه سازی دمای خاک در اعماق مختلف با استفاده از الگوریتم ترکیبی شبکه عصبی ژنتیک ( ANN - GA ) و شبکه عصبی ( ANN ) ( منطقه موردی : ایستگاه سینوپتیک زابل )

مقاله شناسایی ذهنیت متون زبان طبیعی با استفاده از شبکه های عصبی مصنوعی

مقالت رو پیدا نکردی ؟

درباره مگ ایرانز

مگیرانز برندی معتبر در بین کاربران فضای علمی ایران