بخشی از مقاله
چکیده :
سوپر رزولوشن با هدف غلبه بر شرایط بد یک تصویر بیان می شود. سوپر رزولوشن باعث تسهیل در تشخیص تصاویر با کیفیت پایین می گردد. روش های مختلفی برای تبدیل تصاویر با وضوح پایین به تصاویر با وضوح بالا وجود دارد. ما در این مقاله از روش منطق فازی برای سوپر رزولوشن تصاویر استفاده می کنیم. در ابندا دو تصویر را با استفاده از SIFT-BP-RANSAC ثبت می کنیم. در مرحله دوم، با توجه به اهمیت نسبت ضرائب به دست آمده در نتایج سوپر رزولوشن، با استفاده از طرح منطق فازی و با اضافه کردن جزئیات از دست رفته در تصاویر با رزولوشن پایین یک مدل خطی را تهیه مینماییم. روش ما مکرراً تلاش می کند تا یک تصویر با وضوح بالا را بر اساس قوانین تنظیم شده پیش بینی کند. پس از آن تصاویر جدید با وضوح بالا از تصاویر با وضوح پایین ساخته می شوند.
هدف ما در اینجا به حداقل رساندن تفاوت بین نتیجه تصویر با وضوح پایین و تصویر ورودی با کیفیت پایین است. ویژگی های انعطاف پذیر منطق فازی باعث تاثیر گذاری بر لبه ها، جزئیات سگمنت ها و هموارسازی مناطقی از تصویر می گردد. منطق فازی در اینجا رفتاری متفاوت از روش های دیگر ایجاد می کند. در نتیجه این روش تصاویری را که در شرایط بد گرفته شده و یا دارای نویز هستند را باز سازی می کند. نتایج نشان می دهد که کار ما باعث کاهش Aliasing در مقایسه با روش های مشابه گردیده است.
-1 مقدمه
حفظ ویژگیهای طبیعی تصاویر به منظور داشتن یک تصویر با کیفیت بهتر برای بیننده یک نیاز مسلم سیستمهای تصویربرداری در حال حاضر است. هدف SR این است که برای تولید یک تصویر با وضوح بالاتر بر اساس مجموعهای از تصاویر است که از همان صحنه به دست میآید.
بسیاری از کارها نیز برای افزایش جزئیات یک تصویر انجامشده است.[1] محدودیت های سختافزاری، شرایط بد تصویر و الگوریتمهای فشردهسازی سیستم های بازیابی تصویر، از موانع اصلی در دستیابی به اطلاعات کامل از یک صحنه هستند. تصویر با وضوح بالاتر لزوماً به این معنا نیست که سایز از لحاظ فیزیکی بالاتر رود. روش های قدیمی برای حل مشکل تصاویر استفاده از یک روش واحد برای هر نوع از سیستمهای تصویربرداری است.[2] این روشها سعی دارند یک مدل مشاهده معکوس را نشان دهند.
برخی از مشکلاتی که این الگوریتم دارد بلورشدن تصاویر است. مسدودکردن مصنوعات، باعث انتشار نویز و ناتوانی در خلق تصاویر فرکانس بالا با توجه به مدل مشاهدات مختلف میشود. اغلب روش های سوپر رزولوشن در مناطق هموار به خوبی کار میکنند، اما در مناطق لبه و یا مناطق فرکانس بالا، مشکل هنوز حل نشده باقیمانده است.[1] هر یک از تصاویر وضوح پایین - SR - یک بخشی از کل جزئیات با تصاویر با وضوح بالا - HR - است.
فرض اساسی برای افزایش رزولوشن مکانی در تکنیکهای SR در دسترس بودن تصاویر متعدد LR گرفته شده از همان صحنه است. تصاویر LR زیر نمونه مانند هم را با زیر پیکسلها منتقل میکنند. اگر تصاویر LR در واحد عدد صحیح منتقل شوند، پس از آن هر تصویر شامل اطلاعات مجزاست، در نتیجه هیچ اطلاعات جدیدی را برای بازسازی یک تصویر HR وجود ندارد. تصمیمگیری مناسب برای ترکیبکردن تصاویر LR باعث یک نتیجه عالی میگردد که به طور مستقیم به مدل مشاهده شده مرتبط است. ما یک مدل منطق فازی جدید برای الحاقکردن تصاویر LR با توجه به استفاده از تخمین مدل مشاهده شده توسعه داده میشود.
در این مقاله بر روی یکی از مدلهای فراگیر کلی کار میشود، هرچند که امکان استفاده مدل های مختلف وجود دارد.[4] این مدل شامل چهار عملیات زیر است. تبدیل هندسی، بلورکردن، down sample کردن به وسیله یک فاکتور از q1 × q2 و حذف نویز - معمولا نویز گاوسی است - . در اینجا، تبدیل هندسی شامل انتقال، چرخش و پیمایش است. بلورشدن نیز، معمولا به حرکت یا خارج از فوکوس تقسیم می گردد.
-1-1 مفاهیم
-1-1-1 مدلهای مشاهده شده
بسیاری از روش های تصاویر سوپر رزولوشن با چهار جزء اصلی زیر بازسازی شدهاند:
تخمین حرکت، درونیابی، ترمیم بلوری تصویر و و حذف نویز. در مرجع [21]، برای تخمین حرکت از نگاشت حرکت از تمام فریمهای در دسترس با کیفیت پایین در یک چارچوب مشترک استفاده می شود. زمینه حرکت را می توانید به صورت بردارهای حرکت و یا به عنوان یک مدل تبدیل آفین نشان داد. قسمت دوم به نگاشت حرکت پیکسلها به یک شبکه سوپر رزولوشن اشاره دارد. دو جزء آخر برای حذف تاری سنسور و اپتیکال و اثرات نویز مورد نیاز است. تصویر واقعی با وضوح بالا باید با تصاویر بازسازی شده با وضوح بالا از مجموعهای از تصاویر وضوح پایین مقایسه شود این را میتوان در فرمول ریاضی - 1 - دید.
که در آن Y، k امین تصویر وضوح پایین و x تصویر واقعی است. بر این اساس ماتریسی از D - k - ، - P - k، W - k - ، - V - K در - 1 - به ترتیب نشاندهنده D نابودی،P ماتی،W تاب یا چرخش و V نویز هستند. تا آنجا که تفاوت بین تصویر واقعی نتیجه تصویر سوپر رزولوشن شده را از طریق روشهای SR بهبود میبخشد.
-2-1-1 مطالعات گذشته
سوپر رزولوشن - SR - توسط بسیاری از محققان مورد بررسی قرار گرفته و تکنیکهای پیشنهادی خود شامل روش گستردهای مختلف از جمله فرکانس مبتنی بر دامنه [5]، الحاق غیریکنواخت[6]، قطعی و تنظیم تصادفی[7]، طرحریزی بر روی مجموعه محدب .[8] - POCS - تکنیک های ترکیبی، جریان نوری[9] و روشهای دیگر را ارائه نمودهاند.[2] سوپر رزولوشن برای اولین بار توسط Tsai و هوانگ [5] در حوزه فرکانس معرفی شد. آنها با تبدیل فوریه گسسته - DFT - ضرایب با توجه به رابطه بین تصاویر با کیفیت پایین مشاهدهشده و تصاویر نا شناخته با وضوح بالا را ترکیب میکنند. با این حال، نتایج تار میشود. رابینسون و همکاران [11] یک افزونه ترکیب فوریه و تبدیل موجک غیرخطی برای افزایش وضوح تصاویر SR ارائه کردند. نتایج آنها یک شروع بسیار خوب در حوزه SR شد. کار با دامنه طیف نتایج منطقی را نشان داده است.
به منظور افزایش عملکرد محاسبات، Qinlan و همکاران در [12] یک روش دستهبندی برای تقسیم تکه فرکانس بالا از تصاویر وضوح پایین برای دستههای مختلف را پیشنهاد کردند. سینگ و همکاران [12] مجموعه نمونه را برای سوپر رزولوشن برای به حداکثر رساندن دقت بازسازی تعیین کردند، در حالی که تعداد مجموعه نمونهها را به حداقل رساندند. Vrigkas و همکاران [13] یک طرح حداکثر MAP برای تصاویر سوپر رزولوشن در رابطه با به حداکثررساندن اطلاعات متقابل استفاده کردند. در واقع آنها تصاویر بهتری را برای تصاویر سوپر رزولوشن ثبت میکنند. MAP ارتباط بسیار بالا بین تصویر واقعی و تصاویر سوپر رزولوشن نشان میدهد.
Haidawati و همکاران [14] سه روش گامبهگام شامل ثبت تصویر، تجزیه مقدار منفرد - SVD - مبتنی بر تلفیقی تصویر و الحاق را توسعه دادند. نتایج حاصل از روشها را با روش پیشنهادی این مقاله مقایسه می شود. الگوریتم پیشنهادی این مقاله بر اساس منطق فازی و الحاق جزئیات بیشتری را به تصویر ثبت شده اضافه میکند. تصاویر ناشناخته با وضوح بالا را میتوان با برخی روشهای آماری توزیع احتمال از تصویر با وضوح بالا ناشناخته را برآورد کرد. تصاویر HR ایجاد با استفاده از استنتاج اطلاعات خود را از هر دو تصویر با کیفیت پایین مشاهدهشده و دانش قبلی از تصویر با وضوح بالا ناشناخته استخراج میکنند. این مفهوم اصلی در روشهای مبتنی بر تنظیم است. در [15] به عنوان یک نمونه خوب از روش تنظیم یک فرمول استنتاج بیزی مورد استفاده قرار گرفته است. پایه آن بر اساس تصاویر با کیفیت پایین مشاهده شده و مدل تصاویر با وضوح بالا است که از نظر ریاضی مشتق شده است.
نتایج آنها دارای یک مشکل جزئی از اثرات قالبدار در نتایج خود است. روشهای مختلف ریاضی برای ایجاد یک تصویر ترکیبی استفاده میشود. تئوری فازی یکی از این مدلهای ریاضی است که در روش SR استفاده میشود .[16] ترکیبی از محتویات در تصاویر متعدد مربوط به محاسبات رابطه فازی است که برای بهدستآوردن بیشترین اطلاعات مفید است.
اشتراک رابطه فازی بین محتویات تصاویر نتایج بهتری از لحاظ درستی دید و جزئیات درونی تصویر نسبت به روش کریسپ به ما میدهد. بنابراین روش منطق فازی برای SR تعریف میشود که بر اساس کلاسهای از پیش تعریف شده میباشد.
ادامه مقاله به شرح زیر تدوین شده است. مفاهیم اصلی در بخش 2 مورد بحث قرار گرفته است، مشخصات جزئیات فنی در بخش 3 توضیح داده میشود در بخش 4 و 5 اجرای روش و نتایج تجربی بیان میشود. نتیجهگیری مقاله در بخش 7 ذکر شده است.
-2 مفاهیم اصلی
در این بخش، مفاهیم کلی و اصلی بیان میشود و به تفصیل به تشریح تکنیک جدید به کار رفته در روش پرداخته می شود. برای سادگی بیان، تمام روشهای پیشنهادی با فرض بر اینکه دو عکس ورودی با وضوح پایین، همراه با دو کلاس مشاهدهشده توضیح داده میشود . تعمیم به بیش از دو عکس و کلاسهای مختلف ساده و آسان است.
-1-2 ثبت SIFT-BP-RANSAC
انواع گستردهای از تکنیکهای ثبت در حوزههای مختلف وجود دارد. اولین روش شامل استفاده از همبستگی بین تصاویر است با عنوان اینکه آیا میتواند نشان دهد که دو عکس به درستی بر روی هم قرار گیرند. بسیاری از این روشهای تغییرات در مطالعات گذشته مطرح شده است. به طور کلی، این روش دو بخش اصلی دارد: روشهای مبتنی بر شدت و روشهای مبتنی بر ویژگی. روشهای مبتنی بر شدت مقایسه الگوهای شدت در تصاویر از طریق معیارهای همبستگی، در حالی که روشهای مبتنی بر ویژگی پیدا کردن ارتباط بین ویژگی های تصویر است. ویژگی های تصویر شامل انواع مدلهای ارائه شده در مطالعات است. هنگامی که ویژگیهای SIFT استخراج شدهاند، اجماع نمونهبرداری تصادفی - RANSAC - [17]است و معمولاً جهت حذف نقاط نامتناسب بین دو عکس به کار می رود.
نقاط متداول دو تصویر از یک صحنه تصویر دقیقی از آنها را میسازد. تصاویر ورودی با استفاده از ثبت به روش SIFT-BP-RANSAC شناخته شده میشود.[17] یکی از تصاویر به عنوان یک تصویر مرجع در نظر گرفته میشود. مرجع با تصویر دیگر ثبت خواهد شد. همانطور که در شکل 1 نشان داده شده است نتایج این مرحله به نام تصویر ثبت شده بیان میشود.
در مرحله اول، [18] SIFT الگوریتم استخراج ویژگی های محلی است که مقاوم به تغییرات در مقابل قیاس، روشنایی و چرخش است. در مرحله بعد، belief propagation، - [19] - BP برای مطابقت با ویژگیهای مشترک استفاده شده است. BP تلاش برای برآورد احتمال - باور - از هر راهحل ممکن و منطبق بر آنهایی که بهترین ارتباط را با هم دارند. همانطور که واضح است، برخی از نکات کلیدی ممکن است به درستی مطابقت داشته باشند. برای غلبه بر این مشکل، RANSAC [17] پس از BP گام بعدی است که برای حذف نقاط دورافتاده باقی مانده استفاده میشود. RANSAC ماتریس homographic ،H را برآورد می کند. وقتی ماتریس H به مختصات یک پیکسل در تصویر اول ضرب می شود، پیکسل متناظر با آن در تصویر دیگر بیش از حد تولید می شود. این موضوع در - 2 - نشان داده شده است.
که در آن - X',Y' - , - X,Y - مختصات نقاط تطبیق مربوطه در تصویر اول و دوم هستند. در نهایت، تصویر ثبت ساخته شده است.
-2-2 مفاهیم منطق فازی
مدل مشاهده تعریفشده در معادله - 1 - تلاش دارد توضیح دهد به اینکه چگونه تصویر مستقیم LR از تصویر واقعی به دست می آید. بر اساس معادله - 1 - ، می توان تصویر HR مربوطه را از تصاویر LR مشاهدهشده برآورد کرد . یک روش معمول برآورد یک تصویر HR اولیه در مرحله اول است. فاصله بین این تصویر جدید LR با تصویر اصلی LR میتواند یک راهنمای عملی برای نشاندادن این باشد که چقدر تصویر HR ایجاد شده به واقعی نزدیک است. همان طور که در معادله - 3 - نشان داده شده L یکی از معیارهای فاصله مکرر [20] است. این برآورد باید مکرراً با به حداقل رساندن خطای تخمین با استفاده از یک بازخورد از نتایج حاصل از مراحل قبلی توجیه شود.