بخشی از مقاله

چکیده

گردشگری، یکی از بزرگترین منابع درآمد اقتصادی یک کشور و مقصد اصلی گردشگران، بازدید از بناهای تاریخی و دیدنی آن کشور می باشد. یکی از بزرگترین معضلاتی که گردشگران در طی بازدید از این بناها با آن مواجه می شوند، عدم آگاهی نسبت به اطلاعات مربوط به بنای مورد بازدید می باشد. با توجه به اینکه امروزه تجهیزات عکس برداری بر روی اکثر دستگاه های الکترونیکی مانند تلفن همراه، لپ تاپ و غیره یافت می شود، استفاده از تصویر بنا به منظور دریافت اطلاعات درباره بنای مورد بازدید بسیار مورد توجه می باشد .

تشخیص بنا از طریق تصویر، یکی از چالش برانگیزترین حوزه های پژوهش بر روی تصاویر دیجیتال، به طور خاص تشخیص اشیا در تصویر می باشد. در پژوهش پیش رو فریمورکی مبتنی بر شبکه ی عصبی پیچیده ی عمیق به منظور تشخیص بناهای کشور ایران ارائه شده است.

تصویر ثبت شده توسط دستگاه تلفن همراه گردشگر، بر روی بستر اینترنت به سرورهای غیر متمرکز به منظور پردازش، ارسال و پس از تشخیص بنا توسط سیستم، اطلاعات مربوط در مورد بنای تشخیص داده شده برای گردشگر ارسال می گردد. آزمایش به منظور ارزیابی مدل پیشنهادی، بر روی 535 تصویر از 9 بنای تاریخی و دیدنی کشور ایران انجام شده است. مدل پیشنهادی پس از انجام ارزیابی، قادر به شناسایی بنا با دقت %95 می باشد.

مقدمه

با توجه به قدمت هنر و معماری و وجود بناهای تاریخی و دیدنی با معماری های خاص و متفاوت در کشور ایران، این کشور سالانه پذیرای گردشگران زیادی از سراسر دنیا می باشد. مقصد اصلی گردشگران، بازدید از بناهای تاریخی و دیدنی و معماری این بناها می باشد. با توجه به گستردگی در تعداد و نوع معماری بناهای موجود در کشور ایران، تولید سیستمی خودکار، به منظور ارائه ی اطلاعات در ارتباط با بنای مورد بازدید به گردشگران، می تواند بسیار سودمند باشد.

امروزه ابزار تصویر برداری به صورت گسترده در اختیار اکثر گردشگران قرار دارد. همچنین به دلیل وجود تصاویر بسیار زیاد از بناهای مختلف در شبکه جهانی اینترنت استفاده از تصویر به منظور دریافت اطلاعات در مورد بنای مورد بازدید، بسیار کارآمد می باشد.

وظیفه ی سیستم تشخیص بنا، شناسایی ساختمان ها و اشیای ثبت شده در تصاویر مورد پرس و جو و ارائه ی اطلاعات مربوط به آن ها به کاربر می باشد

استخراج ویژگی ها بصری ٌ از تصویر اصلی ترین مرحله ی ارائه ی سیستمی به منظور تشخیص بنا در تصویر می باشد. در طی پژوهش های صورت گرفته، استفاده از ویژگی های بصری سطح پایین و توصیفگر های محلیٍ در بسیاری از کاربردهای تشخیص و طبقه بندی بنا ها به کار گرفته شده است.

از توصیفگر های محلی، تبدیل ویژگی مقیاس نابستهَ، ویژگی های قوی تسریع داده شدهُ و سرعت جهت دار و اختصار چرخانِ و  از دو توصیفگر تبدیل ویژگی مقیاس نابسته و ویژگی های قوی تسریع داده شده به همراه روش برجستگی بصری مبتنی بر گرافّ به منظور تشخیص بنا در پژوهش خود استفاده کرده اند. در - - P. Desai et al, 2013 از ویژگی های مبتنی بر شکل بافت به کمک عملگر های مورفولوژیکیْ و ماتریس هم-رویداد سطح سیاه و سفیدَ و در - Bhawana Ghildiyal et al, 2017 - از معماری کیسه ی کلماتُ به منظور طبقه بندی تصاویر استفاده شده است.

همچنین روش های مبتنی بر شبکه های عصبی پیچیدهًٌ به منظور استخراج ویژگی های بصری سطح بالا در تشخیص و طبقه بندی بناها توسط - - Aradhya Saini et al, 2017 و - - Pushkar Shukla et al, 2017 به کار گرفته شده است.

سیستم پیشنهادی به منظور تحقق و پیاده سازی راهکاری جهت اطلاع رسانی به گردشگران در مورد بناهای تاریخی و دیدنی کشور ایران، به صورت کاملا مستقل از سکو و غیر متمرکز ارائه شده است. کاربر با استفاده از دستگاه در اختیار خود تصویر بنای مورد بازدید را ثبت و از طریق امکان ساز و کار پیشنهاد شده بر روی بستر اینترنت به نزدیکترین سرور موجود ارسال می کند. سرور تصویر را مورد پردازش قرار داده و پس از تشخیص بنای موجود در تصویر، اطلاعات مربوط به بنا را از پایگاه داده ی اطلاعات تهیه شده ، استخراج، نتیجه را به کاربر ارسال و بر روی دستگاه کاربر نمایش می دهد. لازم به ذکر است که پایگاه داده ی ذکر شده محدود به اطلاعات در رابطه با داده های تصاویر مورد استفاده شده در این پژوهش می باشد.

شکل 1 نمونه ای از نرم افزار ساخته شده بر اساس فریمورک پیشنهاد داده شده را نشان می دهد. با توجه به وجود معماری های خاص و ریزه کاری های موجود در تزئین بنا و پیچیدگی در ساختار بناهای کشور ایران، ارائه ی راهکاری با دقت بالا به منظور تشخیص یا به طور کلی دسته بندی بنا بسیار حائز اهمیت می باشد. همچنین با توجه به این که پژوهش بر روی تشخیص بنا بر اساس تصویر، دارای قدمت زیادی نمی باشد، در این پژوهش سعی بر آن شده است که با توجه به پیچیدگی در ساختار و در بعضی موارد شباهت بناهای کشور ایران، مدلی بهینه و با دقت بالا ارائه شود.

روش پژوهش، محاسبات و فرمول ها

روش پیشنهادی

در روش پیشنهادی تصویر ثبت شده توسط گردشگر با استفاده از تکنولوژی وب سرویس بر اساس موقیت کاربر و آدرس آی پی به نزدیکترین سرور به منظور پردازش ارسال می گردد. در مرحله پردازش، با استفاده از معماری شبکه ی عصبی پیچیده و تکنیک انتقال یادگیریٌٌ، ویژگی های بصری سطح بالای تصویر استخراج و ثبت می شود. در مرحله ی بعد با استفاده از روش طبقه بندی و به کار گیری طبقه بند های ماشین بردار پشتیبانٌٍ یا جنگل تصادفی ٌَ، تصویر طبقه بندی، در کلاس مخصوص قرار گرفته و برچسب متناظر با آن کلاس تعیین می شود. سپس بر اساس کلاس تشخیص داده شده داده های متناظر با بنای مورد نظر از پایگاه داده ی اطلاعات بناها، استخراج و از طریق وب سرویس به دستگاه کاربر ارسال می شود.

•    استخراج ویژگی های بصری تصویر از شبکه ی عصبی پیچیده

در این مرحله به منظور استخراج ویژگی های سطح بالای تصویر، از مدل شبکه ی عصبی پیچیده استفاده می شود. به منظور طراحی و آموزش شبکه ی عصبی پیچیده نیاز به داده های تصویری بسیار زیادی می باشد به همین دلیل در روش پیشنهادی به علت محدودیت در مجموعه تصاویر، به جای طراحی شبکه ی جدید و آموزش آن، از تکنیک انتقال یادگیری بر روی مدل پیش آموزش داده شده ی وی جی جی ٌُ19 در پژوهش - - K. Simonyan, and A. Zisserman, 2014 با 19 لایه به منظور استخراج ویژگی های بصری استفاده می شود. معماری مذکور به صورت شماتیک در شکل 2 نشان داده شده است.

تصویر به عنوان ورودی به شبکه ی وی جی جی تحویل، سپس بدون در نظر گرفتن دو لایه ی آخر اتصال کاملٌِ، خروجی آخرین لایه ی بزرگترین استخرٌّ، با ابعاد 7 * 7 * 512 استخراج و در فرآیند مسطح سازی، بردار ویژگی با ابعاد 1 در 25088 به دست آورده می شود.

•    طبقه بندی تصاویر

در این مرحله به منظور طبقه بندی تصاویر بر اساس ویژگی های بصری حاصل از مرحله قبل، ایجاد مدل و آموزش آن از طبقه بند های ماشین بردار پشتیبان چند کلاسه با هسته تابع پایه ی شعاعیٌْ و استراتژی یکی در برابر باقیٌَ و جنگل تصادفی با 10 تخمین گر استفاده شده است.

شکل - 1 استفاده آزمایشی از نرم افزار تشخیص بنا مبتنی بر فریمورک ارائه شده بر روی پلتفرم اندروید

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید