بخشی از مقاله

چکیده:

هدف از این مطالعه استفاده از الگوریتم های هوش مصنوعی برای پیش بینی کاهش افلاتوکسین در پنبه دانه ازن دهی شده می باشد. امروزه برای کاهش هزینه های ازمایشگاهی و افزایش سرعت انجام ازمایشات میکروبی استفاده از مدل های ریاضی توسعه یافته است که یکی از ان ها الگوریتم های هوش مصنوعی است . ضرورت کاهش میزان سم افلاتوکسین از مواردی است که به شدت باید رعایت شود زیرا عواقب سنگینی چون سرطان و به ویژه سرطان کبد و در نهایت مرگ انسان و حیوان میشود.

لذا در این پژوهش ما به بررسی میزان کاهش سم مذکور با ازن دهی پرداختیم. تخم کنجاله پنبه دانه را در سه سطح متفاوت از سم از دامپزشکی دریافت کرده و سپس با ازن دهی در زمان های متفاوت و در زمان ماند متفاوت مقدار سم کاهش یافته را بررسی کرده ایم و سپس با داده های در دسترس مدل سازی را انجام داده ایم.نتایج نشان داد از بین تمامی مدل ها بهترین مدل مربوط به ساختار پرسپترون چند لایه با تعداد1لایه پنهان و تابع تحریک تانزانت هایپربولیک و الگوریتم اموزش مومنتوم که بیشترین ضریب همبستگی و کمترین مقدار خطا را دارد، پیشگویی شده است.در این مقاله کلیه متغیرهای موثر در کاهش میزان سم افلاتوکسین و چگونگی تاثیر انها در پیش بینی کاهش سم مورد بحث قرار گرفته است. 

مقدمه

آفلاتوکسین ها به خاطر مشخصه هایسرطان زایی، جهش ژنتیکی و تراتوژنیک شان شناخته شده هستند - اِدلستین - 1999 آنها در کنجاله پنبه دانه ، ذرت، بادام زمینی یافت شده اند که مواد سازنده غذاهای مختلف تغذیه شده برای احشام لبنیات ساز می باشند. آفلاتوکسین - AFB1 - B1 فراوان ترین نوع آفلاتوکسین ها - AFS - می باشد. در پستانداران، AFB1 به AFM1 متابولیز می شود که از شیر دفع می گردد. هر دوی AFB1 و AFM1 خیلی سمی و دارای مواد سرطان زای قوی کبدی هستند. حوزه ای از درمان های شیمیایی، فیزیکی و بیولوژیکی برای توانایی شان در کاهش دادن یا حذف AFS ها در موادغذایی آلوده تست شده اند.

اوزون زدن، یک روشی است که اخیراً برای سم زدایی کردن AFS در موادغذایی به وجود آمده است. اوزون یا اکسیژن سه اتمی - O3 - یک عامل ضدعفونی کننده و اکسیده کننده می باشد. روش کاربرد O3 در غلات به طور کلی در خاک یا آوندها به کار می رود. قبل از کاربرد اوزون، ضروری است تا دینامیک حرکت اوزون از طریق انواع مختلف غلات مشخص شود تا ژنراتور یا تولید کننده های اوزون برای استفاده در مخازن بزرگ کنجاله پنبه دانه بهینه گردند - جین O3 . - 2010یا کاملاً قارچ زهرها را تجزیه کرده یا باعث تغییرات شیمیایی، کاهش یافتن فعالیت بیولوژیکی آنها می گردد.

تقاضای روبه افزایش برای مدل سازی ریاضیاتی در مورد ایمنی میروبیولوژیکی موادغذایی با این آگاهی شروع شد که کنترل کیفی مواد غذایی براساس بازرسی از محصول تولیدی نهایی هزینه بردار بوده و نیازمند نیروی کار استو کارآمدی هم ندارد - کارلونسکی . - 1999 مدل سازی یک مسیر سریع و اقتصادی برای سنجیدن کیفیت موادغذایی است. بنابراین تا به اینجا هیچ مطالعه ای در مورد مدل سازی داده های مربوط به کاهش AFS ها در هر ماده غذایی دیده نشده است، پس هدف این مطالعه استفاده از الگوریتم های هوش مصنوعی و برای پیش بینی کاهش آفلاتوکسین در کنجاله پنبه دانه اوزون زده شده می باشد.

مواد و روش ها

ازن دهی به کنجاله پنبه دانه کنجاله پنبه دانه از یک دامپزشکی در مشهد - ایران تهیه شد و اوزون زنی با استفاده از یک اوزون زن در شرایط متفاوت انجام گردید از جمله : غلظت اولیه 3 - AFBI سطح: 58/22 ، 50/47، - 45 PPb زمان اوزون زنی 3 - سطح، 5، 10، 15 دقیقه - و زمان ذخیره سازی - صفر، 24، 36 ساعت - .

انتخاب داده ها

غلظت اولیه 3 - AFB1 سطح: 58/22 ، 50/47، - 45 PPb، زمان اوزون زنی - 3 سطح، 5، 10، 15 دقیقه - و زمان ذخیره سازی - صفر، 24، 36 ساعت - به عنوان ورودی مدل - متغیرهای مستقل - و غلظت باقی مانده از AFB1 به عنوان خروجی مدل انتخاب گردیدند - متغیر وابسته - .

تقسیم بندی داده ها با استفاده از وارسی اعتبار 10 لایه ای

ما نیاز داریم تا داده ها را در دو طبقه بندی داده های سنجشی و داده های آموزشی - اعتباری تقسیم بندی نماییم. قبل از اینکه داده ها را در مدل هایی برای این هدف ارائه دهیم. به این منظور روش وارسی اعتباری 10 لایه ای استفاده می شود. در این روش، مجموعه داده ها - مجموعه تست - به طور رندومی در تعداد بخشهای برابر Kتقسیم می شوند که 2 نمونه برای هر داده مطالعاتی در هر بخش وجود دارد که در کل 20 روش دیده می شود که به طور تصادفی در میان 20 نمونه انتخاب می گردند .

جفت های K از {X1 , Y1}K1=1 به طور تصادفی استخراج می شوند جایی که X1 متغیر مستقل و Y1 متغیر وابسته نمونه iاُم است. در هدایت کردن بخش اول از ده بخش ، یک بخش برای داده های اعتباریابی و بقیه برای داده های ارزیابی استفاده میشوند. برای مثال، در شکل 1، قطعه دهم به عنوان داده های ارزیابی و قطعه اول به عنوان داده های اعتباریابی بوده و قطعه دوم تا نهم هم به عنوان داده های آموزشی برای اجرای اول استفاده می شوند. در اجرای دوم، بخش دیگر از آن ده بخش برای ارزیابی و 9 تا بخش باقیمانده برای اعتباریابی - آموزش استفاده می شوند.

برای مثال، بر طبق شکل 1 در اجرای دوم، نهمین قطعه به عنوان داده های ارزیابی قطعه برای دادههای اعتباریابی و قطعه های اول و سوم و هشتم و دهم به عنوان داده های آموزشی استفاده شده اند. 10 الگوریتم با روشی مشابه اجرا می شود. شکل 1 نشان دهنده بخش بندی داده ها در 10 مرحله تکرار است - دوبز . - 1988 یک نرخ خطا در هر مرحله تکرار برای آموزش و سنجش داده ها محاسبه می شود و در نهایت، نرخ خطای میانگین بدست آمده به عنوان نرخ خطای داده های آموزش و سنجش تخصیص یافته اند.

سپس، نرخ خطای میانگین کسب شده به عنوان نرخ خطای داده های آموزش و سنجش مشخص شده است. علت استفاده کردن از این روش این است که نرخ خطا یکی از معیارها برای ارزیابی یک طبقه بندی کننده . رگرسور بوده که شامل انواع مختلف است. به طور کلی با مقایسه کردن خطای محاسبه شده بر روی داده های آموزشی، ما نمی توانیم قضاوت خوبی را در مورد توانایی الگوریتم ها اجرا نماییمنرخ. خطا در مورد داده های آموزشی معمولاً کمتر از نرخ خطای داده هایی است که در فرآیند یادگیری و آموزش دیده نشده اند.

براساس این الگوریتم، ما نمی توانیم از خطای یادگیری برای مقایسه کردن دو الگوریتم استفاده نماییم. علت هم این است که برای مدل های پیچیده تر، دسته بندی کردن هایی که دارای معمولاً پارامترهای بیشتر هستند مرزهای پیچیده تری خواهند داشت . مرز پیچیده نرخ خطا را در مورد داده هی آموزشی در مقایسه با مدل های ساده تر کاهش می دهد.

بنابراین، یک مجموعه از داده ها نیاز است تا تست شوند علاوه بر مجموعه های داده های یادگیری. در مورد شبکه های عصبی، ما نیاز داریم تا مجموعه ای از داده ها را به عنوان داده های اعتبار سنجی علاوه بر داده های آموزشی و تستی داشته باشیم به علت پدیده بینش برازش که برای مجموعه داده های آموزشی انتخاب می شود - این پدیده یکی از بزرگترین مشکلات در فرایند یادگیری و یک مسیر برای ممانعت از استفاده داده های اعتبار سنجی می باشد - . بنابراین، هر مجموعه داده به سه زیر مجموعه مستقل داده های یادگیری یا آموزشی، داده های اعتبارسنجی و داده های تست تقسیم می شوند.

داده های یادگیری برای آموزش مدل استفاده می شوند، داده های اعتبارسنجی برای متناسب ساختن پارامترهای مدل و ممانعت از پیش برازش استفاده می گردند. داده های تست برای محاسبه الگوریتم ها، نرخ خطا - درستی پیش بینی مدل - در مورد داده هایی که دیده نشده اند استفاده می شوند. اجرا کردن یک الگوریتم برای متناسب سازی تست کافی نمی باشد.

الگوریتم ها معمولاً تمایلی دارند تا نرخ خطای تخمین زده را به نرخ خطای واقعی - خطاهایی که در جهان حقیقی روی می دهد - ببندند و این امکان وجود دارد تا از طریق اجرا و ارزیابی یادگیری، فرآیندهای تست را تکرار نمود. بنابراین وقتی که یک مجموعه داده فراهم می شود، بخشی از آن برای تست نهایی کنار گذاشته شده و بقیه برای ارزیابی و یادگیری استفاده می شوند و دوباره سه مجموعه تغییر کرده و مدل مجدد تست می گردد. یکی از مسیرهای متداول برای انجام این کار تست عنوان وارسی اعتبار - K لایه است.

ارزیابی مدل و فرآیند آموزش دهی

مدل مورد نظر آموزش داده می شود وقتی که نمونه به دو طبقه بندی داده های یادگیری - اعتبارگذاری آموزشی - و داده های ارزیابی تقسیم شود. برای سنجیدن عملکرد پیش بینی ها، ما از تفاوت های مطلق استفاده نمودیم. S= اگر ، بنابراین یک مجموعه داده تست گیری باشد، عملکرد یک رگرسور F براساس - MSE خطای حداقل مربعات - ، NMSE - خطای حداقل مربعات نرمال سازی شده - ، MAE - میانگین خطای مطلق - و SMAPE - میانگین خطای درصد مطلق - به شکل دنبال و تعریف می شود:

MSE= در جایی که d1 ,y1 همان حساب کل واقعی - بدست آمده از تست گیری - و حساب کل پیش بینی شده - براساس الگوریتم برای نمونه iاُم - و n هم تعداد نمونه هاست - در گام آموزش یا ارزیابی.   , نرخ میانگین ذخیره واقعی و نرخ میانگین ذخیره پیش بینی شده به ترتیب است. در میانگین خطاها، MSE بیشتر استفاده می شود.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید