بخشی از مقاله

چکیده

استخراج اطلاعات مکانی از صوت ضبط شده در آن مکان، کاربرد های متفاوتی دارد. ما می توانیم از اطلاعات مکانی، برای جرم یابی دیجیتال، استناد قانونی به فایل صوتی و ... کمک بگیریم. یکی از اطلاعات مکانی بسیار مهم، ابعاد فضای اتاق است.

در این مقاله ما سعی داریم با در دست داشتن پاسخ به ضربه صوتی اتاق، تخمینی از ابعاد اتاق بدست آوریم. بدین منظور، ما با بررسی تاخیر های زمانی پژواک های رسیده از منبع تا میکروفون، تابعی معرفی کرده ایم که ورودی آن، مقادیر تاخیر های زمانی است و خروجی اش، مقداری است که وابستگی شدیدی به حجم اتاق دارد. به این ترتیب ما توانسته ایم درباره ابعاد اتاق اظهار نظر کنیم. عدم استفاده از فاصله منبع صوت تا میکروفون،استفاده از یک میکروفون به جای آرایه میکروفونی و مستقل بودن از محل قرارگیری منبع صوت و میکروفون، از مزایای این روش هستند.

کلمات کلیدی جرم یابی صوت؛ تخمین هندسی اتاق؛ پاسخ به ضربه صوتی اتاق؛ معرفی صوتی محیط

مقدمه

در سالهای اخیر، استفاده از فناوریهای دیجیتال توسعه چشمگیری داشته است، تا حدی که تقریباً لحظه ای از زندگی افراد از آن جدا نیست. عکس، فیلم و صوت، تنها بخشی از محصولات این فناوری هستند که کاربردهای آنها در زندگی روزمره غیر قابل انکار است. با افزایش کاربردهای فایلهای چندرسانهای دیجیتال، فعالیتهای فراوانی در زمینههای مرتبط با آن صورت گرفت و نرمافزارهای زیادی جهت تولید یا ویرایش این فایلها تولید شدند. بنابراین امکان ایجاد تغییرات روی این فایلها به وجود آمد.

در نگاه اولیه این موضوع بسیار مطلوب بود، اما چندی بعد، تبدیل به چالشی شد که نیازهای جدیدی در این زمینه را به وجود آورد. این چالش زمانی ایجاد شد که فایلهای دیجیتال به عنوان مدرک در محاکم قانونی مورد توجه قرار گرفتند. برای مثال اگر در یک دادگاه، از یک عکس، فیلم و یا صوت ضبط شده بعنوان مدرک استفاده شود، این سوال پیش می آید که آیا این فایل، اصل بوده یا دچار تغییر شده است. همچنین صحت ادعای انجام شده روی آن نیز باید بررسی گردد. همه این موارد، ضرورتی ایجاد کرد که سازوکاری برای امکان استناد قانونی به فایل های دیجیتال به وجود آید. این سازوکار، با عنوان جرم یابی دیجیتال شناخته شده است.

آنچه ما بدان پرداخته ایم، جرم یابی صوت است. امکان استناد قانونی به فایل صوتی، از منظرهای متفاوتی میتواند مورد بررسی قرار گیرد. برای مثال تشخیص هویت از روی صدا، هم برای استناد قانونی مفید است و هم میتواند در احراز هویت کمک کننده باشد. اطمینان از یکپارچگی فایل صوتی، مورد دیگری است که در جرم یابی صوت اهمیت دارد، به این معنا که بتوانیم مطمئن شویم که آیا قسمتی از فایل صوتی بریده و یا جابهجا شده است یا نه. در این زمینه فعالیتهای فراوانی صورت گرفته است.

برای مثال با استفاده از روشهای مختلف، سیگنال حاوی فرکانس برق شهر - ENF - را از فایل صوتی استخراج می کنند. هرجا که تغییر فاز ناگهانی در این سیگنال مشاهده شود، بیانگر بریده شدن قسمتی از فایل اصلی می باشد. استخراج اطلاعات مکانی، مورد دیگری است که می تواند در جرم یابی صوت مفید باشد. به این معنا که با دردست داشتن یک فایل صوتی، درباره محل ضبط شدن آن اظهار نظر کنیم. کار ما در این مقاله، بدست آوردن تخمینی از اندازه اتاقی است که فایل صوتی در آن ضبط شده است.

برای این منظور، میبایست از ویژگیهای موجود در فایل صوتی استفاده کرد. در فایل صوتی، علاوه بر آنچه بهطور طبیعی شنیده می شود، ویژگیهای دیگری نیز قابل استخراج است که برای این کار باید به سراغ آنها برویم. پژواکها، مهمترین این ویژگیها را دارا هستند. در بعضی کارهای انجام شده مانند ، بازتابهای از مرتبه اول مورد بررسی قرار گرفته اند. در این قبیل فعالیت ها، لحظه رسیده پژواک ها مورد تحلیل قرار می گیرند و از روی آن، تحلیلی هندسی روی شکل اتاق صورت می گیرد.

گروه دیگری از مقالات، یک تابع تبدیل برای اتاق در نظر می گیرند و با تخمین آن، دنبالههای هر پالس صوتی را از آن جدا می کنند. منظور از دنباله پالس صوتی، قسمتی از سیگنال ضبط شده است که پس از اتمام صوت اصلی منتشر شده از منبع، هنوز در حال ضبط شدن توسط میکروون است. در  و  با استفاده از این روش، روی دنباله های پالسهای صوتی بررسیهایی انجام داده اند. مانند و، سرعت میرایی این دنباله ها تحلیل شده است و رابطه ای میان آنها و ابعاد کلی اتاق بدست آمده است.نیز هرکدام سعی دارند با تحلیل هندسی متفاوتی از نحوه انتشار پژواکها در اتاق، روشی برای تخمین فضای اتاق ارائه دهند.

ما در این مقاله، روی لحظه رسیدن پژواکها تحلیل انجام دادهایم، اما سعی کرده ایم به شیوهای حساسیت پاسخ نسبت به جابجایی تاخیرها را کم کنیم. بعبارت دیگر اگرچه زمان رسیدن پژواکها، مسیر تخمین ما را شکل می دهند، اما با معرفی یک تابع، تاثیر تغییرات اندک آن بر نتیجه کار را کم کرده ایم. از مزایای این روش، میتوان به استفاده از یک میکروفون تنها به جای آرایه میکروفونی اشاره کرد. همچنین در بسیاری از مقالات، لحظه انتشار صوت را معلوم فرض کرده اند که چندان معقول نیست، به همین جهت ما از این فرض اجتناب نمودهایم. در ادامه خواهیم دید با تحلیلی ساده روی لحظات رسیدن پژواکها، نتایجی به دست می آید که شدیداً به ابعاد اتاق وابسته است.

توضیح مساله

در این مقاله ما قصد داریم با بررسی سیگنال صوتی ضبط شده درون یک اتاق، درباره ابعاد اتاق اظهار نظر کنیم. برای این منظور، می توان از ویژگی-های متفاوتی که در فایل صوتی است، استفاده کرد. این کار در روش ما، برمبنای تاخیرهای پالسهای رسیده شده از منبع تا میکروفون صورت می-گیرد. چند نکته درباره مساله حائز اهمیت است که آنها را یک به یک بیان می کنیم. ابعاد اتاق برای ما مجهول است، اما فرض معقولی است که اتاق را به شکل مکعب مستطیل در نظر بگیریم. همچنین فرض می کنیم ابعاد اتاق، اعدادی متناسب با اتاق های متعارف باشد، به این معنا که نسبت طول به عرض آن، خیلی زیاد نباشد.

ما درباره فایل صوتی ضبط شده توسط میکروفونی اظهار نظر خواهیم کرد که محل آن میکروفون در اتاق، مجهول باشد. یعنی اگرچه محتویات خروجی میکروفون در اختیار ماست، لیکن از جایگاه میکروفون در اتاق اطلاعی نداریم.محل منبع - یا منابع - صوت نیز مجهول است. با داشتن یک میکروفون تنها و عدم اطلاع از ابعاد اتاق و محل میکروفون در آن، اظهار نظر درباره محل منبع صوت تقریبا ممکن نیست، مگر آنکه فرض شود محل منبع صوت، در اختیار ماست که چندان فرض معقولی نیست و ما از این فرض اجتناب کرده ایم، زیرا هدف ما، تحلیل فایل صوتی و بدست آوردن اطلاعات ابعاد اتاق توسط آن است، بدون در دست داشتن اطلاعاتی دیگر.

فرض ما درباره فایل صوتی، فایل ضبط شدهای است که منبع صوت در آن، پالسی کوچک شبیه به ضربه تولید کرده است. یعنی با در دست داشتن آن، بتوان تاخیر های مسیر های مختلف رسیدن صوت از منبع تا میکروفون را بدست آورد. البته اگر منبع صوت، صدایی به جز پالس گفته شده را تولید کند، روش های متعددی برای تشخیص اکو در فایل صوتی وجود دارد که می توان به کمک آن ها، به تاخیر های مورد نیاز جهت تحلیل دست یافت.

حال با توجه به این نکات، مساله پیش رو را بیان می کنیم. در ابتدا مساله را برای تک میکروفون و تک منبع مطرح می کنیم. ما از فایل صوتی ای که در دست داریم، تعدادی پالس در لحظات مختلف استخراج کرده ایم که هر یک، نماینده یک مسیر مجزای رسیدن صوت از منبع تا میکروفون است. با توجه به لحظات رسیدن صوت از مسیر های مختلف، قصد استخراج اطلاعات مکانی اتاق را داریم.

بررسی تاخیرها

همانطور که گفتیم، از محل قرارگیری منبع صوت و میکروفون در اتاق، اطلاعی نداریم. به همین دلیل نمی توان فاصله منبع صوت تا میکروفون را معلوم دانست. یعنی نخستین پالسی که در فایل صوتی مشاهده می شود و مربوط به مسیر مستقیم منبع تا میکروفون و بدون برخورد با دیوارهها است، با تاخیری نسبت به لحظه تولید آن به میکروفون رسیده که آن تاخیر برای ما قابل محاسبه نیست. بنابراین مرجع زمانی ما، همین لحظه رسیدن پالس اول خواهد بود.

هر پالس دیگری به جز پالس اول، مربوط به مسیری است که در آن، صوت حداقل توسط دیوار بازتابیده شده است. مسیرهایی از صوت که در آن ها فقط توسط یک دیوار بازتاب رخ داده است را پژواک اولیه می نامیم. همچنین مسیرهایی که در آن ها دقیقاً توسط دو دیوار بازتاب رخ داده است را پژواک ثانویه نامگذاری می کنیم. اتاقی 4×6 را ملاحظه می کنید که برای مکان های مشخص منبع صوت و میکروفون، مسیر مستقیم و پژواک-های اولیه نشان داده شده اند.

چه درمورد مسیر مستقیم و چه درمورد پژواکها، اگر تاخیر رسیدن صوت نسبت به لحظه ی تولید آن در دست بود، طول مسافت طی شده توسط صوت بدست می آمد کار بسیار ساده تر می شد. اما ما لحظه تولید صوت را نمی دانیم، بنابراین همه تاخیرها را نسبت به لحظه دریافت اولین پالس میسنجیم. نکته قابل توجه در این تاخیرها این است که در این تاخیرها نیز اطلاعات مکانی نهفته است. یعنی اگر دو نقطه ثابت را بعنوان محل منبع و میکروفون در نظر گرفته باشیم، تاخیر رسیدن پژواکها نسبت به پالس اول، کاملاً وابسته به محل دیوار است.

اگر همین کار را برای پژواکهای اولیهی حاصل از دیگر دیوار ها نیز تکرار می کردیم، به نتایج مشابهی می رسیدیم. با این تفاوت که جهت کانتور های هذلولی شکل، به سمت دیوار های دیگر می چرخید. هر کدام از این توابع، حاوی اطلاعات مکانی مربوط به دیواره ی خویش هستند، اما ما به دنبال اطلاعات مربوط به اتاق هستیم، بنابراین باید تابعی تعریف کنیم که در بر گیرنده همهی این توابع باشد.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید