بخشی از مقاله
چکیده
با توجه به گسترش روش های آماری در بین محققان علم ژئومورفولوژی و عدم استفاده مناسب و صحیح از این مدلها، این مقاله سعی دارد که مزایا و کارکردهای مدل آماری مطمئن رگرسیون لجستیک را در تقابل با دیگر روش های آماری در حیطه علم ژئومورفولوژی بیان نماید.
این مدل کارایی و دقت بالایی برای تهیه نقشه های حساسیت زمین لغزش و فرونشینی فروچاله های کارستی و دیگر پدیده ها داشته و از اشتباهات انسانی با توجه به مدل هایی همچون AHP می کاهد. لذا، با برنامهریزی و مطالعات بیشتر، میتوان اقدام به راهکارهای مناسب اجرایی نمود و پیشنهاد میشود تا، برای مدلسازی ها و تهیه نقشه های حساسیت از روش لجستیک استفاده نموده تا از مقدار خطا کاسته شود.
-1مقدمه
رگرسیون یک روش آماری برای بررسی و مدلسازی رابطه بین متغیرهاست. این روش تقریبا در کلیه رشتههای علوم از جمله پزشکی، مهندسی، فیزیک، اقتصاد، مدیریت، علوم زیستی و کشاورزی مورد استفاده واقع میشود. در حقیقت، رگرسیون یکی از کاربردیترین روشهای آماری است - کامیاب، . - 4: 1387 در تحلیل رگرسیون گاهی نیاز به ایجاد یک مدل برای یک متغییر دو وضعیتی میباشد. در این حالت مدلهای متداول رگرسیونی مانند رگرسیون خطی ساده و رگرسیون خطی چندگانه مناسب نیستند.
رگرسیون لجستیک این امکان را فراهم میکند تا مدلهای رگرسیونی برای چنین متغیرهایی ساخته شود. رگرسیون لجستیک از مدلهای تحلیلی چند متغیره از گروه مدلهای آماری خطی تعمیم یافته می-باشد، که از تابع لوجیت به عنوان تابع پیوند استفاده میکند
هدف اصلی از رگرسیون لجستیک، مدلسازی احتمال وقوع یک رویداد دو حالتی متداول، حضور و عدم حضور عوامل مختلف و معنیداری این حضور یا عدم حضور است
بر همین اساس متغیرهای وابسته عموما دودویی - باینری - بوده و دادهها بین 0 - و - 1 را نشان میدهند که از این فاکتور برای تعیین حضور یا عدم حضور پدیدههای ژئومورفولوژی استفاده میشود.
متغییرهای مستقل در این مدلها برای پیشبینی متغیر وابسته و اندازه گیری فاصلههای زمانی و خطاها و یا نسبت موقعیتها یا وضعیتهای نسبی کاربرد دارند. رگرسیون لجستیک زمانی مورد توجه قرار میگیرد که متغیرهای مستقلی که برای تعیین متغیرهای وابسته مورد استفاده قرار میگیرند، دارای اهمیت باشند. انتخاب متغیر مستقل دارای اهمیت، کار مشکلی میباشد.
معمولا متغیرهای مستقل بایستی دارای درجه ویژهای از همبستگی با متغیرهای وابسته داشته باشند. به علاوه آنها بایستی عملگرا، قابل اندازهگیری و غیرتکراری باشند رگرسیون لجستیک یکی از روشهای آماری محبوب در علوم زمین است که با استفاده از متغیرهای مستقل، احتمال وقوع یک حادثه را مورد پیش-بینی قرار میدهد. این روش اولین بار توسط - مک فادن2، - 1974 به کار گرفته شد. در پژوهش های علمی جهان حاضر، از مدل رگرسیون لجستیک به منظور تحلیل ارتباط فضایی بین وقوع رخدادهای ژئومورفولوژیکی و عوامل موثر در وقوع این رویدادها استفاده میشود .
لاملاس3و همکاران - - 2008 برای اولین بار از مدل رگرسیون لجستیک برای تهیه نقشه خطر دولینها در شهر زاراگوزای اسپانیا استفاده نمودند. لاملاس در طی این تحقیقات رویکرد ایجاد مرکز مطالعات و پایگاه دادههای سیستم اطلاعات جغرافیایی GIS کارست را در منطقه پیشنهاد داد، تا اطلاعات یکپارچه از عوامل زمین شناسی، محیط زیست و انسانی با توجه به نیاز روز در دسترس باشد.
همچنین در شمال یونان باسرلوس1 و همکاران - - 2013، به بررسی ریزش کارست با استفاده از مدل رگرسیون لجستیک پرداخته و پارامتر برآورد خطر زمین لرزه PGA با دوره بازگشت 475 ساله نیز به پارامترهای موثر بر فروریزش اضافه نموده و در انتها با توجه به نتایج مدل، دو عامل زمینلرزه و زاویه شیب بر ریزش کارست در منطقه اثر منفی داشته و نقشه حساسیت فروپاشی کارست با دقت بالا را تهیه نمودند. برای ارزیابی حساسیت فروچالهها آنجلا2 و همکاران در جدیدترین مطالعاتشان 2015 - - ، در منطقه شهری در جنوب ایتالیا از سه مدل روش، دو متغیره اکتشافی، چند متغیره آماری - رگرسیون لجستیک - و شبکه عصبی مصنوعی ANN استفاده نمود. وی پس از محاسبات و اعمال مدلها، مدل رگرسیون لجستیک را به عنوان مدل برتر و با دقت بیشتر معرفی نمود. همچنین از اولین تلاشهای صورت گرفته، پژوهش دکتر ثروتی و همکاران - - 1393، است که برای اولینبار در ایران با استفاده از رگرسیون لجستیک به شناخت عوامل موثر بر پراکنش و رخداد فروچالهها در منطقهی گازورخانی کرمانشاه پرداخته شده است
با توجه به گسترش روش های آماری در بین محققان علم ژئومورفولوژی و عدم استفاده مناسب و صحیح از این مدلها، لذا این مقاله سعی دارد که مزایا و کارکردهای مدل آماری مطمئن رگرسیون لجستیک را در تقابل با دیگر روش های آماری در حیطه علم ژئومورفولوژی بیان نماید.
-2مواد و روشها
برای انجام یک مدل آماری برمبنای روش رگرسیون لجستیک برای ساخت نقشه های حساسیت در حوضه ژئومورفولوژی مراحل ذیل باید طی شود، اولین مرحله پیشروی آنالیز آماری، آمادهسازی متغییرها و ورود دادهها در رگرسیون لجستیک میباشد. اگر این فرآیند به درستی انجام نگیرد، مشکلاتی در تفسیر نتایج نهایی پیش خواهد آمد. پس از این مرحله، چنانچه عدد حاصله معادل 1 باشد، پدیده ژئومورفولوژی قابلیت وقوع را خواهد داشت و در صورتی که عدد صفر در محاسبات به دست آید، احتمال وقوع کاهش مییابد
بنابراین به پهنه-های رخداد لندفرمها عدد یک و به پهنههایی که در آن لندفرم حضور ندارد عدد صفر داده میشود. استفاده از این پهنهها در اجرای مدل، نیازمند تبدیل آنها به لایه نقطهایست. لایهای که بر اساس همان صفر و یک ایجاد میشود . پس از ایجاد این لایه، با استفاده از روش ایجاد نقاط تصادفی3 و با توجه به این اصل که کاربرد مدل آماری رگرسیون لجستیک ایجاد رابطه بین متغیرهای مستقل و متغیر وابسته دوحالته یعنی وقوع و عدم وقوع لندفرم است، لذا علاوه بر تعداد سلولهای وقوع لندفرم n1 - سلول - در حوضهها، n2 سلول یا نقطه رستری دیگر به عنوان نقاط بدون رخداد لندفرم به طور تصادفی - رندوم - از سراسر منطقه در محیط نرمافزار Arc Gis گرفته میشود و با هم ترکیب میشوند.
سپس نقشه رندوم شده پراکنش لندفرمها با n1+n2 سلول با لایههای مدل ارزش اطلاعاتی با متغیر مستقل انقطاع میشوند و پایگاه اطلاعاتی این لایهها از محیط اکسل برای آنالیز آماری وارد محیط نرمافزار Spss میشود . از آنجایی که متغیرهای مستقل به صورت لایههای گسسته - طبقهبندی شده - هستند، نیاز است که این طبقهبندی برای مدل تعریف شود. یکی از مهمترین مشکلات در اجرای تحلیل رگرسیون لجستیک، وجود متغیرهای ترتیبی است. در هنگام اجرای رگرسیون لجستیک، فرض بر این است که تمامی متغیرهای مستقل در سطح سنجش فاصلهای- نسبی هستند، در حالی که در عمل چنین نیست و برخی از آنها اسمی و ترتیبی نیز هستند.
اما از آنجا که در رگرسیون لجستیک با نسبت احتمال وقوع یک پدیده به احتمال عدم وقوع آن پدیده سروکار دارد، بنابراین متغیرهای مستقل حتما باید به متغیرهای شبه فاصلهای - با دو کد صفر و یک - تبدیل شوند تا بتوانیم نسبت طبقات آن در متغیر وابسته را بررسی کنیم. به همین خاطر، در نرمافزار SPSS در هنگام اجرای دستور رگرسیون لجستیک، این امکان وجود دارد که متغیرهای طبقهبندی شده - اسمی و ترتیبی - را به صورت تصنعی به متغیرهای فاصلهای تبدیل کنیم.
در ادامه ضرایب هر یک از متغیرها را در جداول مربوطه در محیط Ilwis بر ارزشهای اطلاعاتی موجود اعمال کرده - معادله خطیZ - و رندوم تهیه میکنیم و دادههای به دست آمده را به صورت پایگاه اطلاعاتی وارد محیط Excel نموده و رابطه لاجیت - - 2 بر روی آن اعمال مینماییم . در انتها دادههای نهایی احتمال وقوع لندفرم را وارد محیط Ilwis نموده و بر اساس میانیابی نقطهای نقشه حساسیت به روش رگرسیون لجستیک را تهیه نموده و در محیط Arc Gis بر اساس روش شکست طبیعی - به دلیل مشاهده نوسانات شدید در دادهها - نقشه شاخص حساسیت لندفرمها را بر پایه مدل رگرسیون لجستیک به 5 طبقه تفکیک میکنیم.
-3بحث و نتایج و یافته ها
پس از انجام مراحل ابتدایی، نرمافزار Spss خروجی لازم را تولید کرده و برای تفسیر به نمایش میگذارد . در خروجی های گرفته شده چندین آماره و آزمون به نمایش گذاشته می شود که عبارتند از: آزمون کاکس و اسنل، آزمون نکوئی برازش هوسمر-لمشو و آماره والد. آزمون کاکس و اسنل نشاندهنده مقدار تغییرپذیری متغیر وابسته هستند که توسط مدل تبیین میشود؛ یعنی مقدار ضریب کاکس و اسنل نشاندهندهی میزان وابستگی میان متغیر وابسته - لندفرم - و مستقل - عوامل موثر در تشکیل لندفرم - میباشد.
لازم به توضیح است که در مدلهای رگرسیون لجستیک، توان پیش-بینی در حدود20 الی30 درصد، توان مناسبی میباشد - مومنی و فعال قیومی، - 160: 1387 آماره نکوئی برازش هوسمر- لمشو یک مربع کای دو است، این آزمون تطابق بین تعداد موارد مشاهده شده و مورد انتظار را برای دو طبقه وقوع وعدم وقوع لندفرم نشان میدهد - ثروتی، - 191: 1393، که میزان سطح معناداری 0/000 نشان دهندهی تطابق خوب است .
آماره والد، مهمترین آماره برای آزمون معناداری حضور هر متغیر مستقل در مدل میباشد، که میشود از طریق سطح معناداری آن - sig - به این امر پی ببریم. مقدار این آماره برای هر متغیر در سطح خطای کوچکتر از 0/05 معنادار باشد و برهمین اساس آماره والد آن بیشتر از 3/84 باشد، در آن صورت نتیجه میگیریم که وجود آن متغیر در مدل مفید و اثر آن معنادار است. یا به عبارتی متغیرهای مستقلی مانند فاصله از جاده، گسل و آبراهه بر متغیر وابسته ای همچون زمین لغزش تاثیر مثبت دارند.
در این روابط احتمال وقوع لندفرم - بین - 0/99-0 ، Z مشخصه خطی مدل ، B0 عرض از مبدا یا ضریب ثابت مدل، ضرایب مربوط به متغیرهای مستقلB1 , B2 ' … ' %n میباشن
رگرسیون لجستیک، مدلی کاملا کمی است که میزان تاثیر هر یک از متغیرهای مستقل بر متغیر وابسته را به صورت کمی و از طریق ضرایب و آنتی لگاریتم ضرایب مشخص میکند. مزیت مدلسازی با رگرسیون لجستیک نسبت به سایر فنون آماری چند متغیره مانند تحلیل رگرسیون چند متغیره، آن است که متغیر وابسته میتواند تنها دو مقدار داشته باشد، که یکی احتمال وقوع پدیده ژئومورفولوژی و دیگری عدم وقوع آن است.
همچنین در این روش مقادیر متغیرهای مستقل میتوانند به صورت باینری 0 - و - 1 و هم به صورت کمیت عددی و اسمی بیان شوند. از اینرو استفاده از متغیرهایی که کاملا پیوسته نیستند و یا به صورت کیفی هستند مانند متغیرهای زمین شناسی، پوشش گیاهی، کاربری اراضی و... که در تشکیل لندفرمها بسیار موثر هستند، امکانپذیر خواهد بود .
لازم به ذکر است که این مدل کارایی و دقت بالایی برای تهیه نقشه های حساسیت زمین لغزش و فرونشینی فروچاله های کارستی و دیگر پدیده ها داشته و از اشتباهات انسانی با توجه به مدل هایی همچون AHP می کاهد. لذا، با برنامه-ریزی و مطالعات بیشتر، میتوان اقدام به راهکارهای مناسب اجرایی نمود و پیشنهاد میشود تا، برای مدلسازی ها و تهیه نقشه های حساسیت از روش لجستیک استفاده نموده تا از مقدار خطا کاسته شود.