بخشی از مقاله

چکیده

اندازه گیری ویژگی هایی از خاک چون CEC ، سرعت نفوذ آب، آب قابل دسترس و برخی دیگر پرهزینه وبسیار زمان بر می باشد. بنابراین، برای تخمین دقیق این ویژگی ها باید بدنبال راه حل های مناسب، ساده و کم هزینه بود. به همین منظور، استفاده از روش های تخمین غیر مستقیم مورد توجه قرار گرفته است. یکی از این روش ها استفاده ا ز توابع انتقالی در علوم خاک می باشد .

یکی از روش های به دست آوردن توابع انتقالی خاک که در سالهای اخیر مورد توجه قرار گرفته، استفاده از شبکه عصبی مصنوعی است. شبکه های عصبی برای پیش بینی، طبقه بندی و کنترل به کار می روند در مدلهای شبکه مصنوعی به علت اینکه شبکه باتعدادی از داده ها مورد آزمایش قرار می گیرد و سپس از آموخته های خود درجهت پیش بینی استفاده می کند بنابراین هرچه تعداد داده ها بیشتر باشد دقت مدل بالاتر خواهد رفت. هدف از نگارش این مقاله بررسی شبکه های عصبی مصنوعی و مفاهیم اصولی آن و مرورری بر مطالعات انجام گرفته در استفاده از این روش در برآورد برخی ویژگی های فیزیکی و شیمیایی در علوم خاک میباشد.

1 -مقدمه

اندازه گیری ویژگی هایی از خاک چون CEC، سرعت نفوذ آب، آب قابل دسترس و برخی دیگر پرهزینه وبسیار زمان بر می باشد. بنابراین، برای تخمین دقیق این ویژگی ها باید بدنبال راه حل های مناسب، ساده و کم هزینه بود. به همین منظور، استفاده از روش های تخمین غیر مستقیم مورد توجه قرار گرفته است. برای نخستین بار، بوما - 3 - روابط رگرسیونی میان متغیرهایی چون مقدار آب قابل دسترس خاک، هدایت هیدرولیکی خاک و خصوصیات زود یافت خاک را بدست آورد و آنها را توابع انتقالی خاک 1 - PTF - نامید. طبق نظر او توابع انتقالی این قابلیت را دارا هستند که بتوانند داده هایی را که در اختیار هستند به آنچه مورد نیاز است تبدیل نمایند

یکی از روش های به دست آوردن توابع انتقالی خاک رگرسیون است. در این روش، رابطه بین یک متغیر وابسته و تعدادی متغیر مستقل در قالب یک معادله بررسی می شود . - 4 - به طور مثال، متغیر وابسته می تواند ویژگی ظرفیت تبادل کاتیونی و متغیر های مستقل مانند مقدار ماده آلی، مقدار رس و pH باشد که با متغیر وابسته رابطه منطقی دارند.

استفاده از شبکه های عصبی مصنوعی 2 شیوه دیگری است که در سالهای اخیر مورد توجه قرار گرفته است. برخی از تحقیقات نشان داده است که برای بدست آوردن توابع انتقالی، این تکنیک دقیق تر و قابل اعتمادتر از روش رگرسیون است . - 5 - این روش توسط محققین مختلف از جمله تاماری وهمکاران - 6 - ، محمدی - 7 - ، پاچپسکی ورالز - 8 - ، امینی و همکاران - 5 - و مردون وهمکاران - 9 - جهت تخمین شاخص های مختلف به کار گرفته شده است. شبکه های عصبی مصنوعی در واقع دسته ای از سیستم های دینامیک می باشند که با پردازش بر روی داده های تجربی، ضمن پیدانمودن روابط نهفته و پنهان درونی داده ها، آنها را به ساختار شبکه منتقل می کنند

شبکه های عصبی در هر زمینه ای و درهر موقعیتی قابل استفاده است به شرطی که رابطه ای بین متغیرهای مستقل - ورودی - و متغیر تابع - خروجی - وجود داشته باشد. این رابطه می تواند خیلی پیچیده باشد به طوری که استفاده از روش های همبستگی و رگرسیون چندان آسان نباشد. در شکل 1 یک مدل شبکه عصبی مشاهده می شود.

شکل -1 یک مدل شبکه عصبی با سه لایه و دو گره در لایه پنهان

این مدل دارای سه لایه است: لایه ورودی شامل 3 متغیر زودیافت خاک است. لایه پنهان از دو گره3 یانرون4 - سلول عصبی - تشکیل یافته است. تعداد گره ها در همین مدل می تواند متغیر باشد. لایه خروجی در این مدل فقط یک پاسخ را پیش بینی می کند ولی در مدلهای پیچیده تر می تواند بیش از یک پاسخ باشد.

در مدل فوق، یک نرون هر یک، سه متغیر ورودی را دریافت می کند. هر ورودی از طریق یک مسیر به نرون وارد می شود. این مسیر دارای یک قدرت 5یا وزن 6است. هر نرون یک مقدار معین به نام مقدار آستانه دارد. در ابتدا جمع وزنی ورودی ها حساب شده و سپس مقدار آستانه از آن کم می شود تا مقدار خروجی از نرون به دست آید. سپس مقدار خروجی از نرون به تابع فعال سازی یا انتقال سپرده می شود تا خروجی یا پاسخ تعیین شودوقتی. شبکه اجرا می شود مقادیر هر متغیر ورودی مرتباً وارد نرون های لایه ی مخفی می شود . هر نرون، جمع وزنی و سپس باکاهش مقدار آستانه ی خود، خروجی خود را حساب کرده و به تابع انتقال می سپارد. این عمل مرتباً برای تمام متغیرهای ورودی و تمام نرون های لایه مخفی اجرا می شود.

همه شبکه های عصبی ورودی عددی لازم دارند و خروجی عددی تولید می کنند. تابع انتقال هر گره طوری انتخاب می شود که می تواند ورودی عددی را با هر دامنه ای بپذیرد و خروجی را در دامنه ی محدودی تولید کند. به عبارت دیگر، تابع انتقال یک اثر منقبض کننده1 دارد. یکی از توابع انتقال بسیار معمول، تابع لاجستیک - 2تابع منطقی - یا تابع سیگموئیدی S - شکل - است. خروجی این تابع دردامنه ی 0 - و - 1 بوده و ورودی دردامنه ی - -1 تا - +1 حساس است. این تابع خوش رفتار3 و مشتق پذیر است و همه ی اینها درکارکرد شبکه های عصبی به ویژه در هنگام آموزش4 آنها اهمیت دارد.

از آنجائی که ورودی شبکه بایستی عددی باشد داده های غیر عددی را نیز بایستی به گونه ای عددی کرد و از آنجائی که خروجی شبکه دامنه ی محدودی دارد داده های عددی هم ممکن است قبل از سپردن به شبکه مقیاس بندی شوند.متغیرهای ورودی معمولاً مقیاس بندی خطی می شوند، لیکنگاهی ممکن است مقیاس بندی غیر خطی مناسب تر باشد مثلاً اگر توزیع داده های خام، نمائی باشد بایستی از لگاریتم گیری استفاده شود.قبلاً گفته شد که منظور از به کارگیری شبکه عصبی، پیش بینی، طبقه بندی و کنترل است که در ادامه ذکر می شود:

طبقه بندی: در اینجا هدف تعیین گروهی است که ورودی به آن تعلق دارد. ماشینی را فرض کنید که با یک شبکه عصبی کار می کند و ورودی ماشین مخلوطی از میوه های سیب و پرتقال است . ماشین بایستی تک تک میوه ها را گرفته و تعیین کند که میوه سیب یا پرتقال است و آن را به طرف معین هدایت کند. در این نوع مسایل، خروجی یک متغیر کیفی بادو حالت 0 - یا 1 ، .... - است.

رگرسیون: در اینجا هدف پیش بینی تعداد یک متغیر پیوسته است.مثلاً هدف پیش بینی CEC خاک با استفاده از دو متغیر درصد رس و درصد مواد آلی خاک است. خروجی این نوع شبکه های عصبی یک متغیر عددی است.
شبکه های عصبی می توانند یکی از این دو نوع مسئله :طبقه بندی یا رگرسیون را حل کنند.

-2 آموزش شبکه عصبی

در این مبحث از یک مدل شبکه عصبی سه لایه ای سخن گفته می شود که طبیعتاً دارای یک لایه ی پنهان است. مدل های عصبی می توانند شامل لایه های پنهان بیشتری باشند. در یک مطالعه ابتدا تعداد لایه های پنهان تعیین می شود. سپس بسیار مهم است که تعداد گره های این لایه تعیین شود. به نوعی، تعداد گره مهمترین شاخص ورودی یک مدل شبکه عصبی است. اگر تعداد گره کم انتخاب شود مشکل کم برازشی5 و اگر تعداد گره زیادتر انتخاب شود مشکل بیش برازشی6 بروز خواهد کرد.

در کم برازشی، انعطاف پذیری مدل در تعیین رابطه ی متغیر ورودی وخروجی کم بوده و مانند آنست که بخواهیم از یک نمودار پراکنش یک خط راست عبور دهیم. اگر داده ها روی یک خط راست قرار گیرند مشکلی پیش نمی آید ولی اگر روند پراکنش غیر خطی باشد با برازش یک خط راست، از واقعیت رابطه فاصله خواهیم گرفت. همین طور اگر تعداد گره ها زیاد باشد رابطه ی برازش شده بسیار انعطاف پذیر شده و همانند برازش مدل های رگرسیون چند جمله ای باتوان بزرگ، منحنی از تمام نقطه ها عبور خواهد کرد - . - 10 در این صورت به جای آنکه داده ها مدل سازی شوند خطای تصادفی مدلسازی می شود

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید