بخشی از مقاله
*** این فایل شامل تعدادی فرمول می باشد و در سایت قابل نمایش نیست ***
استفاده از مدل آماری ARIMA در پیش بینی روند تغییرات پارامترهای کیفی ایستگاه آستانه ی رودخانه سفیدرود
چکیده: رودخانه ها بدلیل ویژگیهای منحصربفرد اکولوژیک اهمیت بسزایی ازلحاظ کشاورزی ، زیست محیطی، اقتصادی و غیره دارند. امروزه یکی از نابسامانی های موجود در سطح جهان آلودگی این منابع باارزش می باشد و ضرورت توجه و کنترل آلودگی وارده به این منابع مهم اقتصادی در مدیریت منابع آبی اهمیت ویژه ای یافته است. در این تحقیق از مدل ARIMA(2,0,0) برای پیش بینی روند تغییرات زمانی پارامترهای pH و NO3 و DO وTSS در ایستگاه آستانه در سال آبی 2010 استفاده شد. ضریب تبیین مقادیر واقعی و برازش شده برای هر پارامتر به ترتیب %90،%78 ،%80، %75 میباشد. برای تست پیش بینی انجام شده نیز از داده های سال 2011 استفاده شد که تاکید بر عملکرد خوب مدل ارایه شده داشت.
کلمات کلیدی: رودخانه سفید رود ، سری زمانی، پارامترهای کیفی، ARIMA
.1 مقدمه
رشد روز افزون جمعیت جهان، گسترش شهرها و اتمام بخش قابل توجهی از منابع غیرقابل احیاء مثل نفت، بیش از پیش مسئله حفاظت و مدیریت زیست محیطی منابع آب بویژه اکوسیستم های رودخانه ای و بهره برداری از آن را به عنوان یک انرژی پایدار ، در سطح بین المللی مطرح ساخته است. آب این منبع حیات بخش به عنوان یکی از سه عامل اصلی تشکیل و بقای محیط زیست (خاک، هوا و آّب) بیش از هر زمان دیگر مورد توجه می باشد. اهمیت آب به خاطر نیاز روز افزون و پایین آمدن کیفیت آن در سطح جهانی در نتیجه سهل انگاری و صرفه جویی افراد و سازمانها روزبروز افزایش یافته به نحوی که می تواند در آینده نزدیک به وجود آورنده مسائل حاد سیاسی و اجتماعی گردد(.(5 رودخانه ها به عنوان یکی از مهمترین منابع تامین و انتقال آب مصرفی بخشهای صنعت، کشاورزی، مصارف شهری و زیستگاه آبزیان از اهمیت خاصی برخوردارند. توسعه روز افزون کشاورزی و صنعتی و افزایش قابل توجه حجم فاضلاب های شهری موجب آلودگی منابع آب و کاهش حجم جریان آن خصوصا در رودخانه ها گشته است. به نحوی که کیفیت این منبع حیاتی در بسیاری از مناطق مورد مخاطره جدی قرار گرفته و حتی در برخی نقاط منجر به مرگ بیولوژیکی آنها شده است.
رودخانه سفید رود با وسعتی حدود 67000 کیلومترمربع یکی از بزرگترین و پرآب ترین رودخانه های کشور است و از مهمترین رودخانه های حوضه آبریز دریای خزر می باشدو همچنین از مهمترین منابع تجدید شونده آب شیرین جهت استفاده در امور کشاورزی، شرب و صنعت به شمار می رود. منطقه مورد مطالعه در جلگه ساحلی جنوب دریای خزر و در دامنه شمالی رشته کوه های البرز و تالش از محل سد سفیدرود (منجیل) تا دریای خزر بین 49 درجه و 15 دقیقه تا 50 درجه و 15 دقیقه طول شرقی و 36 درجه و 45 دقیقه تا 37درجه و 30 دقیقه عرض شمالی واقع شده است. رودخانه سفیدرود، از سرچشمه قز ل اوزن تا مصب آن ( دریای خزر) حدود 786 کیلومتر است .(5) این حوضه آبریز بخشهایی از استانهای گیلان، اردبیل، آذربایجان شرقی، زنجان، قزوین، کردستان، تهران، همدان و آذربایجان غربی را شامل میشود. ضرورت توجه و کنترل آلودگی های وارده به رودخانه در مدیریت آن اهمیت ویژه ای دارد.
هدف از انجام این تحقیق استفاده از سری های زمانی برای پیش بینی پارامترهای کیفی pH) وDO وNO3 وTSS در ایستگاه آستانه ) رودخانه سفید رود و ارائه مدل پیش بینی برای آینده می باشد.
مهمترین هدف از تجزیه و تحلیل سری زمانی، یافتن مدل تغییرات و پیش بینی آینده می باشد. منظور از پیش بینی سری زمانی، تخمین مقادیری از مجموعه داده ها می باشد که در زمان اجرای تحلیل مقدار آن مجهول است. در مبحث آبشناختی همانند بارندگی و رواناب با فرآیندهای تصادفی سروکار داریم. مجموعه متغیرهای فرآیند تصادفی ممکن است وابسته و یا مستقل از هم باشند. اگر فقط مقادیر غیر صفر مد نظر باشد، سری از نوع غیر متناوب و در غیر این صورت متناوب می باشد . پارامترهای کیفی رودخانه بصورت روزانه، ماهانه و سالانه از این نوع سری هستند . از طرف دیگر اگر قوانین احتمال حاکم بر فرآیند در طول زمان تغییر نکند، سری از نوع ایستا می باشد و این ایستایی می تواند در میانگین، واریانس و کوواریانس تعریف شود . به طور نمونه در مباحث هیدرولوژی، تغییرات جوی زمین در یک دوره نامعلوم مانند وقوع سال های پر باران و به دنبال آن خشکسالی های پی در پی موجب می شود تا سری زمانی پارامترهای کیفی نا ایستا شود . یکی از شرایط اولیه استفاده از داده ها در مباحث سری زمانی، ایستا بودن آنهاست، در غیر این صورت باید نا ایستایی ، رفع شود(.(6
در جهت مدلسازی از سریهای زمانی، در اغلب موارد متخصصان از انواع متنوع مدل های ریاضی و آماری بهره میگیرند بطوریکه همبستگیهای موجود ما بین زمان و مشاهدات مد نظر است .(6) یکی از فنون پیش بینی رفتار سری زمانی روش باکس - جنکینز است. اساس رویکرد باکس - جنکینز بر پایه بررسی حوزه وسیعی از مدلهای پیش بینی برای یک سری زمانی قرار گرفته است . گروه عمومی مدل ها برای یک سری زمانی در روش شناسی باکس - جنکینز مدلهای تلفیقی اتورگرسیو و میانگین متحرک می باشند که در آمار به مدل ARIMA معروفند .(2)
مدل به فرم ( ARIMA( p,d,q نوشته می شود. در این فرم p که مرتبه اتورگرسیو یا AR را تعیین می کند بیانگر بستگی یک پارامتر در زمان حال به مقادیر موثر قبلی اش می باشد. در این مدل، رگرسیون هرعنصر بر حسب مقادیر پیشین خود تعیین می شود. q نیز مرتبه میانگین متحرک را تعیین می کند که بوسیله آن وابستگی سری به عناصر تصادفی حال وگذشته اش تعریف می شود. در روش باکس - جنکینز و در مدل ARIMA سه مرحله عمده وجود دارد که از هر یک از آنها ممکن است چندین بار استفاده شود :
-1 شناسایی الگو -2 برازش الگو -3 تشخیص درستی الگو .(2)
مطالعات مختلفی به منظور پیش بینی کیفیت آب رودخانه از طریق روشهای تصادفی در تجزیه و تحلیل سری زمانی توسط محققین مختلف انجام شد. دوردو (2009) غلظت بور را در 5 ایستگاه هیدرولوژی رودخانه بویوک مندرس ترکیه با استفاده از مدلهای ARIMA و SARIMA به مدت 36 ماه پیش بینی کرد(.(11 بن یحیی و همکاران((2007 سری زمانی هفتگی حداکثر دمای رودخانه Deschutes را با استفاده از مدل خود همبسته (AR) و خود همبسته دوره ای (PAR) مدلسازی کردند . (10) کورنچ و همکاران((2005 با اندازه گیری پارامترهای پتاسیم ، سدیم ، کلر ، منیزیم ، کلسیم ، دما ، سولفات ، pH و SAR عملکرد دو روش SARIMA و توماس- فیرینگ را در پیش بینی کیفیت آب و جریان رودخانه در ایستگاه پایش دوروجاسو واقع در رودخانه سیرلماک ترکیه مطالعه کردند(.(13 راگاوان و فرناندز (2006) با استفاده از مدل پارامترهای تنظیمی فصلی ARIMA در نرم افزار SAS روند طولانی مدت کیفیت آب چند رودخانه را که به طور تصادفی انتخاب شده پش بینی کنند(. (14 احمد و همکاران((2001 از مدل ARIMA برای پیش بینی کیفیت اب رودخانه گنگس در هند به منظور مدیریت صحیح حوضه آن رودخانه استفاده کرده و نتیجه گرفتند که در زمان مناسب می توان اقدامات لازم را برای کاهش آلاینده ها در محدوده مجاز استاندارد بعمل آورد(.(9 حسن زاده و همکاران((2008 تجزیه و تحلیل سری زمانی ، توزیع فراوانی و پیش بینی غلظت SO2 را برای دوره 2000- 2005 در پنج ایستگاه هیدرومتری شهر تهران با استفاده از مدل ARMA مورد مطالعه قرار دادند(.(12 و همچنین هالتینر و سالاس (1988) از یک مدل ARMA(1,1) فصلی در مدل سازی دومتغیره جریان ماهانه در رودخانه های یامپا و وایت 1 در شمال غربی کالیفرنیا استفاده کردند . آنها پارامترهای مدل را از دو روش حداکثر درستنمایی و گشتاورها به دست آورده و با یکدیگر مقایسه کردند. دودانگه و کوپایی (1390) با استفاده از مدلهای باکس-جنکینز سری زمانی ماهانه جریان رودخانه پلدختر را بررسی کردند و مدل ARIMA(2,0,2)(2,0,0)12 را به عنوان بهترین مدل برای پیش بینی جریان آن رودخانه انتخاب کردند(.(3
.2 مواد و روشها
روش انجام این مطالعه پایه ای آماری دارد و بر مبنای استفاده از مدل های سری زمانی می باشد. مهم ترین هدف از تجزیه و تحلیل سری زمانی، یافتن مدلی است که بتوان بر اساس مشاهدات موجود، اندازه کمیت را در چند واحد زمانی آینده پیش بینی کرد .(1) یک سری زمانی، نمونه ای از اندازه های تکرار شده ی یک متغیر مجزاست که در فواصل معینی از یک بازه ی زمانی مشاهده شده است. طول فواصل می تواند بر حسب ساعت، روزانه یا ماهانه باشد (در این تحقیق فواصل روزانه مد نظر قرار گرفت)، آن چیزی که مهم است، منظم بودن آن است. (8)
چون پارامترهای کیفی نظیر pH وDO و NO3 وTSS با توجه به زمان اتفاق می افتند و شواهد نشان می دهد که بین مقادیر قبلی داده ها و مقادیر بعدی ارتباطی (وابستگی) وجود دارد لذا بهترین گزینه برای تحلیل داده ها انتخاب روش های سری زمانی می باشد. در این تحقیق روش ARIMA غیر فصلی مورد استفاده قرار گرفت (مدل خود همبسته - میانگین متحرک تلفیق شده .(ARIMA(p,d,q) مدل ARIMA که آن را مدل باکس و جنکینز هم می گویند، به مدلی گفته می شود که یک سری زمانی را از ترکیب یک یا چند سری زمانی دیگر به دست می آورد. مدل ARIMA را باکس و همکاران (1994) با در نظر گرفتن مرتبه تفاضلی برای شرایط ایستا ارائه نمودند. در فرایند ARIMA(p,d,q) ، p,d,q به ترتیب بیانگر تعداد جملات خودرگرسیو، مرتبه تفاضل گیری و تعداد جملات میانگین متحرک می باشند. در صورتی که مدل ARIMA برای پیش بینی استفاده شود می بایست ویژگی های این مدل در طی زمان ثابت باشد. بنابراین دلیل نیاز به سری زمانی ایستا این است که هر مدلی که از این سری های بدست آید را می توان ثابت دانسته و مبنای معتبری برای پیش بینی به شمار آورد.( .(7
مدلهای ARIMA بخش مهمی از رویکرد جعبه-جنکینز به مدلهای سری زمانی را میسازند. مدل های ARIMA برای دادههای با فرآیندهایnon-stationary که روندهایی کاملا قابل تشخیص دارند به کار میروند. (4)
معادله عمومی مدل ARIMA(p,d,q) را می توان به صورت رابطه (1) ارایه داد که در آن p، d و q مقادیر صفر و یا مثبت هستند.(میشرا،( 2005 و φ (B)و θ(B) بترتیب چند جمله ای های از مرتبه p و q هستند(.(11 رابطه (2) و (3) بترتیب مدل AR(p) و MP(q) را نشان می دهند .