بخشی از مقاله
چکیده – تکامل سریع ویدئو دیجیتال بسیاری از برنامههای کاربردی جدید را به ارمغان آورده است و در نتیجه میزان پژوهش در تکنولوژیهای جدید با هدف بهبود اثر بخشی افزایش یافته است و بهره وری اکتساب ویدئویی، آرشیو کردن، فهرست و نمایه سازی و همچنین قابلیت استفاده از فیلمهای ذخیره شده را افزایش میدهد. در میان حوزههای تحقیقاتی ممکن، خلاصهسازی ویدئو یک موضوع مهم است که بصورت بالقوه مرور سریعتر مجموعههای ویدئویی بزرگ و همچنین دسترسی و نمایهسازی کارآمدتر محتوا را قادر میسازد.
اساسا این حوزه پژوهش شامل تولید خلاصه خودکار از یک ویدئو است. از جمله چالشهای خلاصهسازی ویدئو مبتنی بر خوشهبندی میتوان به اندازه بردار ویژگیها، انتخاب زیر مجموعهای از فریمها و انتخاب فریم کلیدی اشاره کرد. در این مقاله برای حل چالشهای فوق یک روش جدید برای تولید خلاصه ایستا ویدئو مبتنی بر استخراج ویژگی ارائه شده است. در روش پیشنهادی پس از استخراج تمام فریمهای ویدئو، ویژگی بافت فریمهای استخراج می شود و بعد از حذف فریمهای بیمعنا، فریمها خوشه بندی می شوند. سپس فریمهای کلیدی از هر خوشه انتخاب شده و در آخر فریم های کلیدی مشابه از خلاصه به دست آمده حذف می شوند. . نتایج بدست آمده از نرخ دقت و خطا به ترتیب 91% و 15% نشان میدهد که راهکار پیشنهادی نسبت به روشهای پیشین برتری داشته است.
-1 مقدمه
امروزه ر سانههای دیداری- شنیداری مهمترین ر سانه تاثیرگذار بر جوامع بشری میباشند. با ورود سامانههای تولید، ضبط و پخش دیجیتال، سرعت ر شد این ر سانهها ب سیار زیاد شده ا ست. این رشد مدیون فناوریهای کامپیوتر، مخابرات و الکترونیک میباشد. یکی از جدیدترین و جذابترین کاربردهای این فناوریها تحلیل محتوا و استخراج مفاهیم درونی ویدئو است. تحلیل محتوا و ا ستخراج مفاهیم درونی ویدئو از دو جنبه اهمیت دارد.
اول اینکه میتوان به طور خودکار یک تحلیل آماری از رویدادهای اتفاق افتاده در ویدئو دا شت و دوم ینکه میتوان خلا صهای از ویدئو که شامل رویدادها و مفاهیم رخداده در آن است را استخراج و در غالب یک فایل ویدئویی با مدت زمان کوتاه ارائه نمود. اصطلاحاً به ساختن یک خلاصه ویدئویی خلاصهسازی ویدئو1 گفته میشود که به عنوان یکی از کاربردهای تحلیل ویدئو مطرح است .1 اساساً دو نوع سیستم خلاصهسازی ویدئو وجود دارد: - الف - خلاصهسازی ایستا - ب - رونوشتبرداری پویا. در این مقاله خلاصهسازی ایستای ویدئو مدنظر میباشد. خلاصهسازی ایستای ویدئو فرآیندی است که در آن یک مجموعه از تصاویر مهم به نام فریم های کل یدی برای ن مایش محتوای یک و یدئو انتخاب میشوند.
خلاصهسازی محتوای بصری ویدئوهای دیجیتال با فریمهای کلیدی یکی از مهمترین تکنیکها برای اندیسگذاری، مرور و جستجوی محتوای ویدئو است. با استفاده از فریمهای کلیدی میتوان حجم داده مورد نیاز برای اندیسگذاری ویدئو را کاهش داد و یک چارچوب مناسب برای کار با دادههای ویدئویی فراهم آورد .[2] در سال 2010 فیورینی و همکاران [3] یک تکنیک خلاصهسازی ویدئو به نام "STIMO" را که مبتنی بر خو شهبندی هی ستوگرام رنگ HSV ا ست، پی شنهاد دادند. بحث ا صلی این مقاله در مورد STIMO - خلاصه ثا بت و متحرک - است که یک تکن یک خلاصهسازی برای تولید خلاصههای متحرک و در پرواز میباشد. این تکنیک در نهایت به دقت 72% و خطای 58% د ست یافت.
در سال 2011 اویلا و همکاران[4 ] روشی به نام "VSUMM" پیشنهاد کردند که ویژگیهای رنگی را از فریمها بعد از مرحله پیش نمونهبرداری از فریمهای ویدئویی، استخراج میکند. بعد از حذف فریمهای بیمعنا، فریمهای باقیمانده بر اساس الگوریتم خوشهبندی K-Means خوشهبندی میشوند. برای ارزیابی این روش، خلا صههای دیگری که تو سط ان سان ساخته شده بود، با تکن یک VSUMM و چ ندین روش دیگر موجود در این حوزه مقایسه شدند.
مزیت اصلی این روش ارزیابی که مرور خلاصه کاربران - CUS - نامیده میشود و در این مقاله پیشنهاد داده شده، این است که ارزیابی ذهنی را برای انجام ارزیابی عملکرد تکنیک پی شنهادی کاهش میدهد، کیفیت خلا صه را به صورت کمی بیان میکند و امکان مقایسه عینیتری بین تکنیکهای مختلف را فراهم میکند. این تکنیک برای معیارهای دقت و خطا به ترتیب به %85 و %35 دست یافته است.
در سال 2012 اسدی و مقدم[5] یک روش جدید برای استخراج فریم کلیدی با استفاده از خوشهبندی C-Means فازی ارائه دادند؛ به این صورت که فریمهای با بیشترین درجه عضویت از هر خوشه را به عنوان فریم کل یدی معرفی میکن ند. ت عداد خوشهها با استفاده از یک روش ساده تخمین زده میشود. خلاصههایی که به وسیله افراد تولید شدهاند، برای ارزیابی این تکنیک استفاده شده و نهایاتاً به دقت %75 و خطای %30 رسیده است. در این مقاله یک روش جدید برای خلاصهسازی ایستای ویدئو ارائه شده است. در ادامه در بخش 2 به بررسی روش پیشنهادی خواهی پرداخت، در بخش 3 آزمایشها و نتایج به ستد آمده مورد ارزیابی قرار خواهد گرفت و نهایتاً در بخش 4 جمعآوری مطالب را خواهیم داشت.
-2 روش پیشنهادی
در شکل 1 دیاگرام روش پیشنهادی نشان داده شده است. در این روش ابتدا ویدئوی ورودی به فریمهایی شک سته شده، پس از آن با استفاده از ماتریس همرخدادی ویژگی بافت فریمها استخراج میشود و بعد از حذف فریمهای بیمعنا، مابقی فریمها خوشه بندی میشوند. سپس از هر خوشه یک فریم به عنوان فریم کلیدی انتخاب شده و در آخر فریمهای کلیدی م شابه از خلا صه نهایی حذف میشوند.
-1-2 استخراج فریمهای ویدئو
در برخی از تکنیکها مانند اویلا و همکاران[4 ] و اسدی و مقدم [5] تمام فریمهای ویدئو را در نظر نمیگیرند، بلکه زیرمجموعهای از فریم ها را در نظر میگیر ند که از نرخ نمو نهبرداری از پیش تعیین شده به دست میآیند و ویژگی فریمهای نمونهبرداری شده را، ا ستخراج میکنند.
-2-2 استخراج ویژگی بافت مبتنی بر ماتریس هم-رخدادی
شکل :3 اندازهگیری سطح خاکستری ماتریس همرخدادی در چهار زاویه 0، 45، 90 و 135 درجه .[7]
در روش پیشنهادی این مقاله ویژگی استخراج شده برای فریم های و یدئو، ویژگی با فت مبتنی بر ماتریس همر خدادی میباشد. با توجه به اینکه در بیشتر روشهای خلاصهسازی مبتنی بر طبقهبندی از روشنایی تصویر بعنوان ویژگی استخراجی ا ستفاده شده ا ست، که این کار میتواند وجود نویز و اثر مخرب آنرا در پی دا شته با شد، بنابراین در این مقاله برای کاهش نویز و اثر مخرب آن بر روی تصویر، از اطلاعات مکانی پیکسلها در قالب ویژگی بافت استفاده شده است. ماتریس همرخدادی یک ابزار قدرتمند برای استخراج ویژگی بافت تصویر میباشد که با نقشهبرداری از سطح خاکستری تصویر، ماتریس همرخداد احتمالات، براساس روابط فضایی از پیکسلهای مختلف در
به عبارت دقیقتر در این شیوه تصویر تبدیل به یک ماتریس دو بعدی میشود که هر درایه آن احتمال قرار گرفتن شدت رنگ i و j را در هم سایگی به فا صله d و زاویهای به اندازه بیان میکند. در نهایت با استفاده از تابعی که بر این ماتریس تعریف شده است مشخصههایی استخراج شده و با مقایسه آنها کلاسبندی انجام میشود .[7] در شکل 4 برای ماتریس 5 × 5 یک تصویر، ماتریس همرخدادی آن ت شکیل شده ا ست. M و N در ماتریس همرخدای با هم یکسان و برابر با تعداد سطوح رنگ در تصویر میباشد و در این مثال تصویر ما دارای هشت سطح رنگ مختلف است.