بخشی از مقاله
چکیده
در سالهای اخیر استفاده از طیف سنجی مادون قرمز برای کیفیت سنجی تخم مرغ مطرح شده است . در این پژوهش با کمک طیف سنجی نور مرئی-مادون قرمز بدون نیاز به تخریب تخم مرغ،کیفیت درونی تخم مرغ بر اساس عدد هاو و ارتفاع حفره هوای آن پیش بینی گردید. برای اینکار ابتدا در آزمایشگاه مهندسی فرآوری، با استفاده از طیف سنج ساخته شده برای همین منظور نمونه های تخم مرغ در شرایط نگهداری رطوبت %40، دمای 25 ° C و دوره نگهداری 5هفته در طیف 300 تا 1100 نانومتر مورد آزمون قرار گرفت . سپس طیفهای به دست آمده برای تعیین کیفیت بر اساس عدد هاو و ارتفاع حفره هوای تخم مرغ مورد بررسی قرار گرفت.
برای این منظور ابتدا داده ها را به دو دسته آزمایش و آموزش طبقه بندی شده سپس با کمک مولفه های اصلی - PCA - تعداد ویژگیها کاهش یافته است . در مرحله بعد به کمک داده های آزما یش 21 عدد طیف - رگرسور - تاثیرگذار انتخاب شده و مدلی بر اساس روش حداکثر احتمال، پیشنهاد شده است . مدل بدست آمده برای پیش بینی عدد هاو و ارتفاع حفره هوا مورد استفاده قرار می گیرد. نتایج به دست آمده نشان میدهد استفاده از پیش بینی کننده حداکثر احتمال بر روی طیف های به دست آمده، روش موثری برای کیفیت سنجی غیر تخریبی بر اساس شاخصهای کیفی تخم مرغ میباشد.
مقدمه
امروزه روشهای اندازه گیری غیر تخریبی متنوعی بوجود آمده اند که میتواند به صورت سریع؛ اقتصادی و قابل اطمینانی کیفیت محصولات کشاورزی و غذایی را تعیین کند . تکنیکهای به روز متنوعی از قبیل روشهای اپتیکی، اشعه ایکس، فراصوت، تشدید مغناطیسی /عکسبرداری تشدید مغناطیسی - - MR/MRI در طول چند دهه گذشته توسعه یافته و برخی از آنها در کشورهای پیشرفته به صورت عملی کاربرد یافته است
در سالهای اخیر در میان ابزارهای کنترل کیفی غیر تخریبی مبتنی بر روشهای اپتیکی، استفاده از طیف سنجی مادون قرمز برای کیفیت سنجی تخم مرغ مطرح شده است . کیفیت درونی تخم مرغ پس از ساعات اولیه تخمگذاری به علت خروج CO2 ازمنافذ پوسته،مبادلات اُسمزی بین سفیده و زرده تخم مرغ و تبخیر آب از پوسته کاهش پیدا میکند . آهنگ این تغییرات در زمان نگهداری به عوامل مختلفی از جمله مدت زمان نگهداری، دما و رطوبت محیط، سن ونژاد مرغ بستگی دارد.
در این پژوهش پیش بینی کیفیت تخم مرغ خوراکی بر اساس پیش بینی کننده حداکثر شباهت به روش طیف سنجی عبوری مورد بررسی قرار گرفته است.
مواد و روشها
شکل شماره 1 طرحواره سامانه ساخته شده در آزمایشگاه مهندسی فر اوری دانشگاه کیوتو- ژاپن برای اندازه گیری طیف عبوری تخم مرغ در طول دامنه 300 تا 1100 نانومتربا دقت - 0.1 - نانومتر را نشان میدهد . در این سامانه تخم مرغ به صورت نشان داده شده توسط نگهدارنده با لایه فومی مخصوص تخم مرغ قرار گرفته، و سپس نور عبوری از قطر کوچک تخم مرغ عبور کرده و طیف به دست آمده با کمک نرم افزار wave viewer 1.17 بر روی یک رایانه قابل حمل ذخیره میشد .
برای انجام تحقیق حاضر تعداد 150عدد تخممرغ در اندازه متوسط در روز اول تخمگذاری از مزرعه مرغ تخم گذار نژاد Boris Brown در سن 33 هفتگی انتخاب شده سپس آزمون طیف سنجی در دمای 24- 25° C و رطوبت40 درصد به مدت 5 هفته در فواصل شش روزه در آزمایشگاه بر روی آنها صورت گرفت. لازم به یادآوریست که قبل از شروع هر مرحله آزمون دقت سامانه طیف سنجی ساخته شده توسط تفلون مخصوص کالیبره میشد. پس از آزمون غیر تخریبی طیف سنجی، تخم مرغ توسط ترازوی الکترونیکی با دقت 0/1 میلیگرم توزین سپس آزمایش های تخریبی کیفی تعیین عدد هاو ٌ و ارتفاع حفره هوا ٍ با کمک ریز سنج بر سطح شیشه ای صاف برای هر تخم مرغ انجام پذیرفت.
شکل -1 سامانه اندازه گیری طیف VIS- NIR تخم مرغ خوراکی در مد عبوری
طیفهای به دست آمده پس از یکنواخت شدن با الگوریتم .مشخص پیش پردازش شدند . در اینجا در 832 باند، طیف سنجی انجام گرفته لذا ما دارای 832 ویژگی برای تفکیک میباشیم . با توجه به تعداد نمونه های محدود آزمایش نسبت به 832 باند، نمونه های آموزشی دریافت شده در آزمایشگاه برای طبقه بندی با پدیده هیوز َ مواجه میشویم.
در پدیده هیوز با تعداد نمونه های آموزشی محدود و با افزایش ویژگیها از یک مقدار بیشتر باعث کاهش کیفیت طبقه بندی میگردد . با افزایش تعداد ویژگیها اطلاعات برای تفکیک پذیری بیشتر میشود اما از طرف دیگر صحت تخمین مشخصه های آماری با تعداد نمونه های آموزشی محدود کاهش یافته و همین امر موجب کاهش صحت طبقه بندی میگردد. لازم به توضیح است که حداقل به تعداد ویژگیها می باید نمونه های آموزشی داشته تا ماتریس کوواریانس معکوس پذیر گردد و بر ای تخمین نسبتا" مناسب حداقل سه برابر تعداد ویژگیها نیاز به نمونه های آموزشی میباشد . برای رفع این مشکل از تبدیل PCA برای کاهش تعداد ویژگیها استفاده گردید . سپس با روش حداکثر شباهت ویژگیهای حاصل برای شاخصهای کیفی عدد هاو و ارتفاع حفره هوا پیش بینی گردید.
نتایج و بحث
بطور کلی در این پژوهش با دو گروه اطلاعات سر و کار داریم، یکی داده های مربوط به طیف در طول موجهای مختلف که تعداد آنها برای یک تخم مرغ برابر با 830 بوده که در ادبیات شناسایی سیستم به آن رگرسور گویند . گروه دیگر شاخصهای کیفی تخریبی عدد هاو و عدد مربوط به ارتفاع حفره هوا - - air cell می باشد . هدف از این بخش رسیدن به مدلی است که بتواند با استفاده از مقدارهای رگرسورها - طیف موج - مقدار عدد هاو و ارتفاع مربوط به حفره هوا را پیش بینی کند .
برای اینکه بتوان بصورت نسبتا" دقیق در مورد اطلاعات قضاوت کرد، داده ها را به دو دسته آموزش و آزمایش طبقه بندی میشود . داده های آموزش برای پیدا کردن بهترین مدل و تنظیم ضرایب و مدل مورد استفاده قرار می گیرد در حالی که داده های آزمایش که در هیچ یک از مراحل آموزش مورد استفاده قرار نگرفته اند و در حقیقت حکم داده های جدیدی برای سی ستم را دارند، برای ارزیابی مدل پیشنهادی مورد استفاده قرار می گیرند . در این مقاله 20 درصد از داده ها برای آزمایش و مابقی داده ها برای آموزش مورد استفاده قرار گرفته اند . برای این منظور ابتدا به کمک الگوریتم PCA رگرسورهایی که بیشترین تاثیر را در شناسایی دارند انتخاب شده، سپس با الگوریتم کمترین مربعات خطا ُ بهترین مدل خطی برای این محموعه به دست می آید.
الگوریتم Principal Components Analysis - PCA -
از آنجایی که ابعاد بردار ویژگی بسیار بزرگ میباشد همان طوری که قبلا بحث شد از روش تجزیه به مولفه های اصلی برای کاهشبُعد بردار رگرسورها استفاده می شود. با استفاده از PCA یک مجموعه ویژگی متعامد جدید ایجاد می شود که در راستای این ویژگی ها واریانس نمونه ها بیشینه می شود و در واقع بیش ترین اطلاعات را در بر خواهد داشت . ایده ی این روش به این صورت می باشد که هر بعدی که بیشترین واریانس را داشته باشد مهمترین بعد می باشد و بعدی که کمترین واریانس را داشته باشد کمترین اهمیت را خواهد داشت و در تخمین مدل اثر خاصی نخواهد داشت .
برای این منظور از الگوریتم - singular value decomposition - SVD استفاده میشود که در حقیقت یک سری رگرسو رهای جدیدی حاصل خواهد کرد و ترکیب خطی از رگرسورهای اولیه است. این ترکیب بر اساس اهمیت هر یک از رگرسورها که شاخصی به نام مقدار تکین که در الگوریتم SVD است، مشخص می شود. با توجه به مقدار اهمیت هر یک از رگرسورها و با توجه به شاخص مذکور، رگرسور انتخاب می شود. الگوریتم مورد استفاده در نرم افزار Matlab پیاده سازی شده، سپس بطور خلاصه تعداد رگرسورها و شاخصهای کیفی مورد مقایسه برای انتخاب بهترین رگرسور با توجه به کمترین میزان خطا برای پیش بینی کیفیت درونی در جدول 1 نمایش داده شده است .
در ابتدا به کمک دستورات برنا مه Matlab این الگوریتم برای کاهش بُعد به کار رفت، سپس با استفاده از LSمعمولی و Maximum liklihood به تخمین پارامترهای مدل کاهش یافته پرداخته شده است . همان طوری که در جدول شماره 1 مشخص است در صورتیکه دقت بیشتری برای داده های آموزش داشته باشیم مقدار انتخابی مقدار تکین، بالاتر انتخاب می شود که در ستون اول جدول بالا نشان داده شده است. با افزایش آن مقدار تعداد رگرسورها افزایش می یابد