بخشی از مقاله
چکیده :
تطابق دوگانه در تصاویر بویژه تصاویر هوایی یکی از مسایل مهم در بینایی ماشین و بدست آوردن مدلهای ارتفاعی رقومی - - DEM است که پژوهشهای گستردهای در مورد آن انجام گرفته و این پژوهشها در سالهای اخیر بیشتر شده است. هدف اصلی از تطابق تصاویر دوگانه که بعنوان مهمترین زیر شاخه بینایی دوگانه، تعیین فاصله اشیا موجود در صحنه یا به عبارتی بدست آوردن اطلاعات عمق است.
کاربردهایی نظیر، مدل کردن سهبعدی تصاویر، شناسایی موانع بکمک ربات و مسیریابی، مراقبت در محیطهای امنیتی و تحلیل تصاویر پزشکی به اطلاعات عمق صحنه نیاز دارد. با گسترش روزافزون کاربرد تصاویر سهبعدی به منظور مکانیابی از حسگرهای مختلفی استفاده میشود تا بتوان اطلاعات دیداری را با کیفیتی بالا شبیهسازی نمود.
بینایی دوگانه، یکی از حسگرهای بینایی است که با داشتن دستکم دو تصویر از یک صحنه و بر پایه تطابق دوگانه به استخراج عمق میپردازد. در این روش برای یافتن مختصات سهبعدی یک نقطه در فضا با دستکم دو دوربین - یا یک دوربین که به گونهای پشت سرهم عکسبرداری انجام دهد - ، باید نقطه مورد نظر را در یک تصویر مشخص کرد و متناظر این نقطه را در تصویر دیگر یافت. توسط این تناظر و خط مبنای دو دوربین میتوان مختصات سهبعدی و الگوی رقومی ارتفاع را بدست آورد.
یافتن همه نقاط متناظر هزینه محاسباتی بالایی به سامانه تحمیل میکند، اما با اجرای همزمان و ترکیب روشها هزینه محاسباتی تا مقدار قابل توجهای کاهش پیدا میکند. در این راستا مهمترین کار، افزایش سرعت اجرا، دقت و نیز کاهش پیچیدگی محاسباتی است. بنابراین از تصاویر دوگانه رقومی هوایی با وضوح تصویر بالا برای افزایش دقت استفاده میشود. این مقاله به معرفی هندسه سامانه بینایی دوگانه و روابط حاکم بر آن و نیز بازسازی سهبعدی تصاویر میپردازد
-1 مقدمه
برای تولید مدل سهبعدی زمین راههای زیادی وجود دارد، مانند استفاده از روشهای نقشهبرداری، استفاده از اطلاعات بدست از GPS ، استفاده از رادار، استفاده از فاصلهسنج لیزری، بینایی دوگانه از میان منابع مورد استفاده در استخراج مدل سهبعدی عوارض زمین، تصاویر ماهوارهای نسبت به منابع دیگر مزایایی دارد. یک تصویر ماهوارهای منطقه وسیعی را پوشش میدهد و تهیه تصاویر دربازههای مناسب آسانتر است
روش مورد بررسی برای بازسازی اطلاعات سه-بعدی تصاویر در این مقاله، جز میان روشهای بینایی دوگانه است و از مسایل مهم در بینایی ماشین به حساب میآید. پرهزینهترین قسمت بینایی دوگانه تناظریابی است.
با اینکه مساله بینایی دوگانه یکی از چالشهای قدیمی است ولی همچنان مورد پژوهش قرار دارد واز نظر سرعت و دقت بهبود داده میشود. در ادامه این مقاله ابتدا مساله بینایی دوگانه و تناظریابی که مهمترین بخش آن است تشریح شده سپس کارهای انجام شده در این رابطه بررسی شده است. در ادامه از نتایج تجربی بدست آمده ارائه شده و میزان افزایش دقت اعلام شده است. در انتها نتیجهگیری و کارهای آینده بیان گردیده است.
-2 کارهای گذشته
کارهای بسیاری برای بازسازی سهبعدی الگوی رقومی سطح زمین - DSM - 1 از تصاویر هوایی انجام شده است. به دلیل آنکه پردازش سهبعدی هوایی به صورت دستی کار زمانبری است بنابراین پژوهشهای گستردهای در زمینه خودکار یا نیمه خودکار کردن این پردازش انجام شده و در حال انجام است که البته این موضوع بسیار مهم و لازم است.
جهت خودکارکردن پردازش تصاویر هوایی باید از تصاویری که توسط هواپیما یا حسگرهای هوایی تصویربرداری شده برای تولید الگوی رقومی سطح زمین استفاده شود
الگوریتمهای بسیاری برای تولید الگوی رقومی سطح زمین، با استفاده از تصاویر هوایی و ماهواره توسعه و معرفی شده-اند .[3] یکی از روشها، استفاده از دو تصویر در یک لحظه برای بازسازی سهبعدی الگوی دوگانه است که میتوان اطلاعات قابل توجهی از آن استخراج نمود .[4] الگوهای سهبعدی میتوانند از جفت تصاویر دوگانه توسط هواپیما و یا ماهوارههای QuickBind ، GeoEye و Iko-nos بدست آیند
عملکرد انطباق تصویر برای تولید الگوی رقومی سطح زمین و استخراج ویژگی نیازمند تصاویر هوایی با وضوح تصویر بالا است تا بتوان به عنوان نمونه نقشه اختلاف سطح برای یک منطقه شهری را با دقت بیشتری محاسبه نمود .همچنین در پژوهش دیگری در این زمینه [8]، از روش برنامهنویسی پویا و الگوریتم تقریق دودویی استخراج عمق به صورت بلوکی انجام شده است.
-3 تناظریابی
هنگام تصویربرداری تنها دوبعد از سهبعد نقاط صحنه ثبت میشود و بعد سوم از بین میرود. این بعد سوم را میتوان با مقایسه دو عکس که از دو زاویه مختلف از یک صحنه گرفته شده برای تعداد زیادی از نقاط بازیابی کرد. اساس این کار تشخیص نقاط متناظر در دو تصویر و اندازهگیری مقدار جایجایی آنها و دانستن اینکه نقاط نزدیکتر به دوربین بیشتر از نقاط دور جابجا میشوند است. یک نقطه از صحنه دارای مختصات متفاوتی در هریک زوج تصویر دوگانه است. این اختلاف مختصات که به آن جابجایی گفته میشود متناسب با فاصله آن نقطه از دوربین است. یعنی نقاط دورتر از دوربین تغییر مختصات کمتری نسبت به نقاط نزدیکتر به دوربین دارند.
در شکل 1 با استفاده از تشابه مثلثهای LPlcl با LPzl و تشابه مثلثهای RPrcr با RPzr رابطه - 1 - بدست میآید. با استفاده از این رابطه فاصله نقاط از دوربین محاسبه میشود.
شکل :1 روش تصویرشدن یک نقطه در دو تصویر دوگانه
دانستن مشخصات دوربین و محلهای تصویربرداری، تنها متغیر مجهول مکان نقطه در تصویر چپ و راست است. برای محاسبه این تغییر مختصات باید نقطه متناظر با نقطه مورد نظر در تصویر چپ، در تصویر راست پیدا شود. این کار تناظریابی نام دارد.
-4 الگوریتمهای استخراج ویژگی
برای پیدا کردن نقاطی حساس در تصویر باید دنبال ویژگیهایی بود که از آن بتوان برای یک تناظریابی ایدهآل استفاده نمود. این نقاط میتوانند گوشهها، روشنایی یا تاریکی اشیا داخل تصویر باشند به همین سبب باید از الگوریتمهای مختلفی استفاده کرد تا بتوان بهترین ویژگی را استخراج نمود. تعدادی از مهمترین الگوریتمها در ادامه شرح داده می-شود.
-1-4 الگوریتم Fast
الگوریتم Fast جز الگوریتمهایی است که سرعت بالایی برای تشخیص گوشههای تصویر دارد. در این الگوریتم یک نقطه به عنوان پیکسل کاندید مشخص میشود. برای این که بتوان این نقطه را به عنوان یک گوشه تصویر شناسایی شود ابتدا یک دایره دور پیکسل کاندید انتخاب میشود و اگر پیکسلهای اطراف پیکسل کاندید از آن تاریکتر یا روشنتر بود پیکسل کاندید به عنوان یک پیکسل گوشه انتخاب میشود
-2-4 الگوریتم Brisk
این الگوریتم از الگوریتمهای مقیاسپذیر ثابت و مقاوم دودویی است که در مسایل بینایی ماشین بسیار پرکاربرد است. در این الگوریتم بدون آنکه اطلاعات اولیهای در مورد صحنه و دوربین وجود داشته باشد، اطلاعات قابل استفادهای جهت توصیف و انطباق نقاط کلیدی تصویر به ما میدهد. برخلاف بسیاری از الگوریتمهای معروف مانند Sift یا Surf که اجرای بالای آنها ثابت شده است، این روش به طور چشمگیری در مقایسه با اجرای الگوریتم های دیگر سریعتر عمل میکند. الگوریتم Brisk متکی بر الگوی نمونهبرداری دایروی قابل پیکربندی است که درخشانی تصویر را به صورت رشته توصیفی دودویی با هم مقایسه میکند