بخشی از مقاله

چکیده

فشرده سازی تصاویر دیجیتال دارای کاربردهای فراوانی در مواردی مانند تصویرگری پزشکی، مخابره تصاویر ماهواره-ای، تلفن تصویری، سیستمهای چندرسانهای، کنفرانس ویدئویی، سیستمهای ذخیره اطلاعات، اینترنت و نظایر آن است. کیفیت، سهولت و تحمل خطای بالا، قابلیت پیاده سازی موازی و بالاخره نرخ فشرده سازی بالا از شاخصهای یک روش فشرده سازی مناسب است که معمولا همهی آنها در یک روش جمع نمیشوند.

روش فشرده سازی ارائه شده در این مقاله که یک روش ترکیبی- تطبیقی از فشرده سازیهای BTC و DCT است تلاش دارد در این مرحله با استفاده از روش ترکیبی اولیه دلپ- میشل - که در این مقاله به عنوان روش مبنا مورد استناد خواهد بود - و ایدههایی نو، بهبود قابل ملاحظه بیشتری در کیفیت تصاویر بازساری شده ایجاد نماید. مقاله فعلی در راستای نتایج تحقیق جامعی در همین موضوع به ارائه بخشی از مراحل تحقیق میپردازد.

1 .مقدمه

کدینگ کوتاه ساز بلوک - Block Truncation Coding - که اولین بار در سال 1979 توسط آقایان دلپ و میشل ارائه شد یک روش فشرده سازی با اتلاف - - Lossy تصاویر دیجیتال است. برتری روشهای فشرده سازی بااتلاف نسبت به روشهای بدون اتلاف - - Lossless مربوط به نرخ فشرده سازی بالای آنها است.

ایده اصلی الگوریتم BTC تقسیم تصویر به بلوکهای مجزای غیر همپوشان و جایگزین کردن هر بلوک تصویر با تنها دو مقدار جداگانه است. این مقادیر به نحوی تعیین میشوند که معمولا دو کمیت با اهمیت آماری بلوک اصلی حفظ شود. در BTC اولیه مقادیر میانگین و انحراف استاندارد در دو بلوک اصلی و بازسازی شده محفوظ میمانند. هرچند نرخ کدینگ BTC به تکنیکهای فشرده سازی موجود مانند JPEG یا JPEG2000 نمیرسد ولی پیچیدگیهای محاسباتی BTC به میزان قابل ملاحظهای از آنها کمتر است. این مزیت و ویژگی امکان ایجاد سیستمهای نظارت و بازرسی با نرخ فریمهای بالا و مصرف انرژی کم را فراهم میآورد.

علاوه بر اینکه ویژگیهای BTC امکان استفاده از آن در نهان نگاری - Watermarking - و پنهان نمودن داده در اطلاعات تصاویر دیگر را میدهد در تحقیقات و مطالعات مختلف انجام شده تا کنون برخی محققان با اهداف مختلف مانند افزایش بهرهی فشرده ساز و برخی دیگر با هدف بهبود کیفیت تصاویر بازسازی شده راهکارهایی پیشنهاد دادهاند. دلپ و میشل در مقاله خود نوعی BTC ارائه دادهاند که علاوه بر دو کمیتآماری قبلی کمیت سوم با اهمیت را نیز حفظ میکند.

این کار هرچند زمان کدکردن را افزایش میدهد ولی تاثیری بر زمان بازسازی تصویر ندارد. با این روش برخی ویژگی های تصویر در نواحی لبه ها بهتر حفظ میشود. وانگ و چونگ نیز روشی تطبیقی و چند لایه برای BTC ارائه نمودهاند. در روش این دو با توجه به خواص لبهای بلوک تصویر، از BTC دو سطحی یا چهار سطحی استفاده شده است. هالورسون و همکارانش روشی ارائه دادهاند که میتواند کمیت های مهم آماری از رتبه های بالاتر را نیز نگه دارد. در مقاله لما و میشل به جای حفظ کمیت انحراف استاندارد، مقدار گشتاور مرکزی قدر مطلق اول حفظ میشود.

برای این منظور کافی است از دو کمیت میانگین مقادیر کمینه و بیشینه در بلوک استفاده شود. این کار باعث سادگی محاسبات در فاز کدینگ میشود. آدپیکار و راینا روشی ارائه کردهاند که تنها گشتاور مرتبه اول را حفظ مینماید. این روش از نظر خطای MSE بهینه است. هان و همکارانش نیز با ارائه گونهای BTC که مبتنی بر کوانتیزاسیون برداری است توانستهاند به نرخ فشرده سازی بالا و کیفیت شهودی خوب دست یابند.

کانافانی و همکارانش هم در مقاله خود بلوک تصویر را به قسمت همگن و ناهمگن تفکیک نموده و بر هر یک به ترتیب الگوریتم BTC یا کوانتیزاسیون برداری - VQ - را بکار بردهاند. روش جدید ارائه شده در مقایسه با هر یک از روشهای BTC یا VQ میتواند باعث بهبود کیفیت تصاویر و نرخ بیت شود. یانگ و همکارش نیز با ارائه روشی ترکیبی از BTC مبتنی بر نهان نگاری داده در یک راهکار تطبیقی که بر خصوصیات ادراک شهودی تصاویر استوار است توانستهاند توازن و تعادل خوبی میان نرخ بیت ومقادیر PSNR برقرار نمایند. در این روش با نرخ بیت یکسان تا 4,0db افزایش در PSNR حاصل شده است.

هربرت و کروکرفت هم یک الگوریتم کدینگ ویدئویی جهت فشرده سازی ارائه کردهاند که از تبدیل گسسته کسینوسی - DCT - کمک میگیرد. ایده اساسی این روش مبتنی بر کارآیی BTC در نواحی دارای جزئیات با کنترست بالا است در حالیکه DCT روی نواحی نرم خوب کار میکند. در هر حال وقتی که بخواهیم نرخ بیت را کاهش دهیم، BTC موجب کاهش کیفیت تصویر میشود. چن و لیو گونهایBTC مبتنی بر الگوهای شهودی - visual pattern - ارائه دادهاند که نقشه بیتی بلوک را با یکی از چند الگوی شهودی الگوریتم تطبیق داده و کد میکند. این روش ضمن کاهش نرخ بیت باعث افزایش پیچیدگی محاسبات میشود.

اخیرا نیز چند نمونه از روشهایBTC مبتنی بر هالفتونینگ - Halftoning - توسعه یافته است که هدف آنها افزایش کیفیت تصویر و کمینه سازی پیچیدگی محاسبات است. هالفتونینگ روشی برای چاپ اسناد، کتب، مجلات و مانند آن است که از دو سطح کمی سازی شده در هر کانال رنگی استفاده میکند. تصاویر بوجود آمده از این روش به گونهای است که برای سیستم ادراک شهودی انسان از فاصله دور به مانند تصویری با تغییرات پیوسته رنگی است. آقای جیو در مقلات خود چندین نوع از این گونهی فشرده سازی ترکیبی مبتنی بر BTC و هالفتونینگ را ارائه نمودهاند.

روش مورد استفاده در این مقاله برگرفته از روش ترکیبی دلپ- میشل است که طی چند مرحله به بهبود آن مبادرت شده است.

. 2   مرور روش فشره سازی مبنا - فشرده سازی ترکیبی - DCT- BTC

در انتهای مقاله [2] دلپ و میشل روشی از فشرده سازی برای تصاویر دیجیتال ارائه کردهاند که ترکیبی از دو روش BTC و DCT است. روش و نحوهی کار اینگونه است که ابتدا تبدیل DC بر بلوکهای 16*16 پیکسلی تصویر اصلی اعمال میشود و سپس با هشت ضریب غیر dc از ضرایب تبدیل DC هر بلوک، تصویری کمکی بدست میآید. پس از این بر تصویر حاصل از تفاضل تصاویر اصلی و کمکی کدینگ BTC اعمال میشود. در انتها مقادیر دادههای کوانتیزاسیون و نقشه بیتی بلوک حاصل از BTC به همراه هشت ضریب غیر dc کدینگ DCT برای آن بلوک کد می-شوند. نرخ بیت گزارش شده در این مقاله 1,88 bpp است. بلوک دیاگرام مرحله کدینگ این روش در شکل 1 آمده است.

شکل: 1 بلوک دیاگرام مرحله کدینگ روش ترکیبی دلپ- میشل

در مرحله کدبرگردان، هر یک از دو تصویر تفضلی و کمکی بازسازی و تصویر نهایی از مجموع آن دو تولید میشود. در شکل2 دیاگرام کدبرگردان تشریح شده است.

شکل:2 بلوک دیاگرام مرحله کدبرگردان روش ترکیبی دلپ- میشل

ایدهی بکار رفته در روش دلپ- میشل بکار گیری مزایای هر یک از روش های مورد استفاده در فشرده سازی است. به عبارتی حفظ کیفیت عمومی تصویر بر عهده تبدیل DC است در صورتیکه حفظ لبه ها و نواحی با فرکانس بالا به کدینگ BTC سپرده شده است. این مطلب در بررسی ها و نتایج ارائه شده در مقاله قبلی و همین مقاله نمایان است.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید