بخشی از مقاله
چکیده-
با توجه به نقش پایه اي و اساسی توربین گاز در صنایع و اهمیت بحث تشخیص خطا، این مقاله از دیدگاه داده کاوي، به تشخیص و جداسازي خطاي توربین گاز پرداخته است. در ابتدا با استفاده از الگوریتم k-means، به کاهش بعد داده هاي اولیه پرداخته شده و سپس با پیاده سازي آنالیز مولفه هاي اصلی - PCA - ، دانشی که درون داده هاي شرایط عملیاتی نرمال توربین پنهان بوده استخراج و با استفاده از آن به تشخیص خطاي توربین پرداخته شده است. در مرحله بعد، با به کار گیري ابزار ماشین بردار پشتیبان - SVM - جدا سازي خطاي توربین گاز انجام شده است.
استفاده ترکیبی از تکنیکهاي داده کاوي و بهره گیري از نقاط قوت تکنیک هاي به کار برده شده از نکات بارز این مقاله است. سیستم مورد مطالعه توربین گاز مدل MS6001 از شرکت جنرال الکتریکدر واحد نیروگاه پالایشگاه دوّم پارس جنوبی بوده و با توجه به دانش تجربی سیگنالهاي مهم انتخاب و ثبت شده اند. روش پیشنهادي روي توربین گاز به صورت عملی پیاده سازي و آزمایش شده و نتایج در این مقاله آورده شده است.
-1 مقدمه
شناسایی و تشخیص خطا، مولفهي مرکزي مدیریت رخدادهاي غیرنرمال - Abnormal Event Management - است که در سالهاي اخیر توجه زیادي را به خود جلب کرده است. توربینهاي گازي نقشی بسیار مهم و حیاتی در صنایع نفت، گاز، پتروشیمی و نیرو ایفا میکنند. مدیریت رفتارهاي دینامیکی و پیچیده توربین هاي گازي، نیازمند سی ستمهاي کنترل، حفاظت و مانیتورینگ با قابلیت اطمینان، انعطاف، برنامه ریزي و دسترس پذیري بالاست. از آنجا که هر گونه خطا در توربین گاز و در عملیات و سیستم هاي کنترل و حفاظت آن، عواقب جبران ناپذیري را در پی خواهد دا شت، تشخیص و شنا سایی خطا یک مساله بسیار مهم در توربین هاي گازي است. شناسایی و تشخیص خطاي زود هنگام در تجهیزات، زمانی که هنوز این تجهیزات در ناحیه قابل کنترل هستند، می تواند باعث جلوگیري از پیشرفت رخدادهاي غیرنرمال و کاهش تلفات شود. بنابراین شناسایی و تشخیص خطاي به موقع و تصحیح شرایط غیرنرمال، ما را به سوي عملیاتی دقیق، سود بالاتر و کارکردي ایمن تر سوق خواهد داد.
بحث تشخیص خطاي توربین،قبلاً در مقالات متعددي انجام شده است. در [1] ترکیب PCA و فیلتر کالمن براي تشخیص خطاي موتور هواپیما به کار برده شده است. [2] روشهاي درخت تصمیم گیري - DT - و تحلیل همبستگی - CA - را براي استخراج ویژگی و SVM را براي تشخیص خطا پیشنهاد داده است. [3] از PCA براي تشخیص خطا و از Structured Residual براي جداسازي خطا بهره گرفته است. [4] از PCA براي کاهش بعد و از ICA براي تشخیص خطا استفاده کرده است. PCA [5] و SVM را به صورت جداگانه براي تشخیص خطا در بویلرهاي نیروگاه سیکل ترکیبی کرمان به کار برده است.
در این مقاله از سه روش داده کاوي k-means ، PCA و SVM به صورت ترکیبی استفاده شده که چنین رویکردي در کارهاي پیشین مشاهده نمی شود و داده هاي اولیه، واقعی و شامل یک ت ست کامل توربین گاز ا ستبخش. دوّم این مقاله به سیستم مورد مطالعه و نحوه ي ثبت سیگنالها پرداخته، در بخش سوّم تکنیک هاي تئوري بیان شده اند. روش پیشنهادي در بخش چهارم، نتایج پیاده سازي بر روي توربین گاز پارس جنوبی در بخش پنجم آورده شده و بخش ششم نتیجه گیري است.
-2 سیستم مورد مطالعه و نحوه ي ثبت سیگنالها
سی ستم مورد مطالعه یک توربین گاز در کاربرد توربوژنراتور است که براي تولید برق بوده و داراي توان نامی 39 مگاوات است. این توربین گاز ساخت شرکت جنرال الکتریک - GE - و مدل آن MS6001 و در واحد نیروگاهپالایشگاه دوّم پارس جنوبی واقع شده است. سیستم کنترل و حفاظت این توربین SPEEDTRONIC Mark V و سیستم مانیتورینگ آن IDOS می باشد - شکل - 1 که این دو سیستم، سیستمی خاص کنترل، حفاظت و مانیتورینگ توربین گاز از شرکت جنرال الکتریک ا ست. شبکه اي که بین سی ستم کنترل و مانیتورینگ به تبادل داده می پردازد شبکه ARCNET از خانواده Stage link با نرخ انتقال داده 2.5Mb/s است.
نحوه ي ثبت سیگنالها به این صورت است که یک سیستم HMI با کارت شبکه ي ARCNET و با کابل کواک سیال RG-62 به صورت موازي به پانل سیستم کنترل SPEEDTRONIC از سیستم مورد مطالعه متصل و عملیات ثبت داده از سیگنالهاي مختلف انجام شده است. با استفاده از دانش تجربی و با دقت 29 سیگنال انتخاب شده است
نمونه برداري از سیگنالها به صورت یک ثانیه یک ثانیه و در مدت زمان کلی 4027 ثانیه انجام شده است. بنابراین ماتریس داده اولیه ي ثبتی شامل 29 ستون، 4027 سطر می باشد. که در مجموع 116783 داده را شامل می شود و این داده ها در شرایط بارگیري از 16, 8 مگاوات تا بار کامل 34,4 مگاوات و سپس کاهش بارگیري تا 16,4 مگاوات ثبت شده اند.
شکل :1 شماتیککلّی سیستم کنترل و مانیتورینگ توربین گاز مدل MS6001 شرکت جنرال الکتریک، سیستم مورد مطالعه.
جدول :1 سیگنالهاي ثبت شده در سیستم مورد مطالعه
-3 مساله تشخیص، شناسایی و جداسازي خطا
خطا : - Fault - یک انحراف بدون اجازه - unpermitted - deviation از حداقل یکی از مشخصه ها یا پارامترهاي سیستم از شرایط ا ستاندارد، معمول یا قابل قبول - acceptable, usuall, - standard condition است.[6] مراحل تشخیص، شناسایی و جداسازي خطا به این صورت است که :
در مرحله ي اول بایستی وقوع خطا تشخیص داده شود
در مرحله دوم معلوم شود چه متغیر یا متغیرهایی از فرایند با این خطا مرتبط است
در مرحله ي سوم تعیین می شود که خطاي اتفاق افتاده کدام کلاس خطا است
در مرحله ي چهارم، فرایند اصلاح شده و به حالت نرمال بر میگردد
روشها و رویکردهاي مختلفی در تشخیص و جداسازي خطا وجود دارد که به طور کلی به دو دسته ي بر مبناي مدل - model-based - و درایو شده از داده ها و گذشته ي فرایندي - Data driven-Process history based - تقسیم بندي می شود
-4 در مرحله ي چهارم، مراحل 2 و 3 آنقدر تکرار می شوند که دیگر هیچ تغییري در مراکز خوشه ها تکرار نشود.
-2-3 آنالیز مولفه هاي اصلی - PCA -
آنالیز مولفه هاي اصلی - PCA - ، یک تکنیک آنالیز چند متغیره است و از نظر ریاضیاتی PCA می تواند فضاي اندازه گیري را به دو زیر ف ضاي عمود به نام هاي زیرف ضاي Principal Component - PC - و زیر فضاي Residual تقسیم کند.
مانیتورینگ فرایند و تشخیص خطا بو سیله ي تست هاي فرض آماري در دو زیر فضاي ایجاد شده با PCA انجام می شود. دو اندیس Hotelling-T2 و Q-Statistics - SPE - براي توصیف رفتار فرایندي و ت شخیص خطا ا ستفاده می شوند .[3] الگوریتم PCA در شکل 3 نشان داده شده است.
شکل :2 طبقه بندي روشهاي تشخیص و جداسازي خطا
در روشهاي بر پایه ي مدل، مدلی ریاضیاتی از سیستم استفاده می شودکه این مدل می تواند کمّی - Quantitative - و یا کیفی - Qualitative - باشد. در روشهاي درایو شده از داده ها و یا بر مبناي گذ شته ي فرایندي ، مدلی در نظر گرفته نمی شود و بر اساس حجمی از داده ها، پردازش و تصمیم گیري می شود. در این مقاله که در قسمت روشهاي درایو شده از داده ها - داده کاوي - طبقه بندي می شود از تکنیک هاي k-means براي کاهش بعد، PCA براي تشخیص خطا و از SVM براي جداسازي خطا بهره گرفته شده که در قسمت بعدي به شرح این تکنیک ها خواهیم پرداخت.
-1-3 الگوریتم خوشه بندي k-means
الگوریتم k-means شامل مراحل چهارگانه ي زیر است:
-1 در مرحله اول، ابتدا k نقطه به صورت تصادفی، به عنوان نقاط مراکز خوشه ها انتخاب می شوند.
-2 در مرحله ي دوم، هر نمونه ي داده به خوشه اي که مرکز آن خوشه کمترین فاصله تا آن داده را داراست، نسبت داده می شود.
-3 در مرحله ي سوم، پس از تعلق تمام داده ها به یکی از خوشه ها، براي هر خوشه یک نقطه ي جدید به عنوان مرکز محاسبه می شود. - میانگین نقاط هر خوشه -
شکل :3 شماتیک الگوریتم آنالیز مولفه هاي اصلی - PCA -