بخشی از مقاله

چکیده

در این مقاله، طیقهبندی دو رقم پسته ایرانی "اکبری" و "کله قوچی" از طریق درخت تصمیم - Decision Tree - و منطق فازی مورد بررسی قرار گرفته است. تعداد 800 پسته اکبری و 300 پسته کلهقوچی از طریق یک سطح شیبدار به یک صفحه فولادی برخورد کرده و سیگنال صوتی حاصل از برخورد، توسط میکروفونی اخذ شده و از طریق کارت صوتی، در رایانه شخصی ذخیره گردید. پارامترهای آماری استخراج شده از این سیگنالهای حوزه زمان به وسیله الگوریتم J48 مورد تجزیه و تحلیل قرار گرفتند.

انتخاب ویژگی و طبقهبندی با دو مجموعه آموزش مشتمل بر 600 پسته اکبری و 200 پسته کله قوچی و نیز مجموعه آزمایش شامل 200 پسته اکبری و 100 پسته کله قوچی انجام گرفت. نرخ طبقهبندی صحیح برای داده های مجموعه آموزش، 90% و برای مجموعه آزمایش 87% به دست آمد. خروجیهای درخت تصمیم تصمیم به قواعد اگر- آنگاه فازی تبدیل شده و برای کاربردهای آنلاین، به عنوان ورودی به یک سیستم استنتاج فازی - Fuzzy Interference System; FIS - وارد گردید. نرخهای طبقهبندی صحیح با استفاده از تنظیماتی در درخت تصمیم بهبود یافتند که البته سبب پیچیدهتر شدن درخت و متعاقبا، افزایش تعداد قواعد فازی استخراج شده گردید.

مقدمه

پسته یکی از مهمترین محصولات کشاورزی ایران است. در بخش پس از برداشت، محصول یکنواخت حائز اهمیت بسیاری است، همچنین در بخش بازاریابی، چنین محصولی می تواند در قیمتهای رضایت بخش تری به فروش برسد. از این رو به منظور افزایش بازارپسندی و سهولت فراوری، طبقه بندی پسته اهمیت فراوانی داشته و دارای ابعاد مختلفی است؛ یکی از این ابعاد، جداسازی پسته های خندان از ناخندان است. جنبه دیگر طبقه بندی بر اساس رقم است. گاهی اوقات چندین رقم پسته در یک باغ کشت می شود که ممکن است به همراه هم برداشت و انبار گردند. این امر ممکن است به سبب تفاوت ارقام از نظر اندازه، شکل و محتوای مواد مغذی مشکلاتی را در مرحله فرآوری به وجود آورد.

پیرسن [2001] یک سیستم صوتی جهت جداسازی دانه های پس ته خندان از ناخندان ایجاد کرد. همچنین پس از آن الگوریتمی با استفاده از تکنولوژی تشخیص صوت برای تمیز دادن پسته خندان از ناخندان ایجاد گردید .[Cetin et al., 2004] بعدها سیستم صوتی توسط [2006] Kalkan and Yardimci برای جداسازی فندق های با پوسته شکسته از فندق ه ای سالم مورد استفاده قرار گرفت . همچنین فندق های نرسیده از رسیده با استفاده از سیستم صوتی جدا گردیدند Onaran, Pearson, Yardimci, & Cetin, ] .[2006 کاربرد روشهای طبقه بندی بر پایه تکنیک های داده کاوی - Data Mining; DM - ابزار مناسبی جهت ارائه مدل های دقیق طبقهبند به دست می دهد. DM شامل چندین تئوری و روش می گردد که به رغم متفاوت بودن از یکدیگر، دو مخرج مشترک دارند:

[1] ارائه غیر سمبلیک اجزای دانش و [2] معماری پایین - بالا که ساختارها و الگوها از یک ابتدای نامرتب ظاهر می گردند DM .[Omid, 2011] شامل درخت های تص میم ، شبکههای عصبی مصنوعی - Artificial Neural Networks; ANNs - ، الگوریتم ژنتیک، مجموعه های فازی، سیستم های خبره و ... می گردد [2009] Omid et al. .[Mollazade et al., 2012] یک سیستم طبقه بندی هوشمند پسته بر پایه تکنیک انتشار صوتی ساختند . سیستم آنها ترکیبی از تحلیل انتشارات صوتی، آنالیز جزء اصلی - Principal Component Anlalysis; PCA - و دسته بند شبکه عصبی چندلایه تغذیه به جلو - Multilayer Feedforward Neural Network; MFNN - بود .

همچنین [2010] Omid et al. یک سیستم طبقه بندی پسته با استفاده از PCA و ANN صداهای برخورد ایجاد نمودند . یک سیستم خبره رای جداسازی پسته خندان از ناخندان توسط [2011] Omid ساخته شد. این سیستم بر پایه طبقه بندی از طریق درخت تصمیم و سیستم استنتاج فازی بود . ه دف این مطالعه جداسازی دو رقم پسته به نامهای اکبری و کله قوچی با استفاده از یک سیستم صوتی و الگوریتم J48 جهت طبقه بندی و ایجاد قوانین اگر- آنگاه فازی به منظور استفاده در سیستم استنتاج فازی برای کاربردهای برخط است.

مواد و روشها

در این کار 1100 دانه پسته به عنوان نمونه، شامل 800 دانه پسته اکبری و 300 دانه پسته کله قوچی در قالب دو مجموعه مورد بررسی قرار گرفت؛ مجموعه آموزش شامل 600 پسته اکبری و 200 پسته کله قوچی و مجموعه آزمایش شامل 200 پسته اکبری و 100 پسته کله قوچی. نمونه اولیه سیستم همان است که در Omid et al. [2009] مورد استفاده قرار گرفته است و در تصویر 1 نمایش داده شده است .

این نمونه اولیه مشتمل بر یک سطح شیبدار که با شیب 60œ بالای سطح افق قرار گرفته است، یک بلوک فولادی به عنوان صفحه برخورد، که به اندازه کافی سنگین انتخاب شده بو د تا لرزش ایجاد شده به سبب برخورد دانه های پسته را به حداقل برساند، یک محفظه صوتی به منظور جلوگیری از اختلاط نویز با سیگنال برخورد، یک میکروفون کاملا حساس به جهت برای برداشت این سیگنال ها، که درون محفظه قرار گرفته بود، و نیز یک کامپیوتر شخصی به همراه یک کا رت صوت برای دریافت داده های ارسالی توسط میکروفون بود . اطلاعات بیشتر در مورد طراحی و ساخت، در Omid et al. - 2009 - در دسترس است - تصویر 1 را ببینید - .

تصویر .1 نمای شماتیک نمونه اولیه سیستم برای ثبت انتشارات صدای برخورد دانه های پسته. [Omid et al ., 2009]

زمانی که دانه پسته از هر یک از ارقام به صفحه برخورد می کند، میکروفون برخورد را برداشت می کند و آن را به سیستم دریافت داده می فرستد . سیگنال صوتی حاصل روی حافظه رایانه ذخیره شده و جهت تشخیص نوع رقم مورد تجزیه و تحلیل قرار می گیرد . از آنجا که سیگنال ها با فرکانس نمونه برداری 44/1 کیلوهرتز با وضوح 16 بیت رقومی می شوند و نیز دریافت داده تا 5/67 میلی ثانیه بعد از برخورد ادامه می یابد، برای هر سیگنال برخورد، 250 نمونه - 44/1×5/67 - تولید می گردد. تکنیک های بسیاری برای استخراج و انتخاب ویژگی، که برای آموزش سیستم و نیز خودکار کردن آن برای کاربردهای برخط مورد نیاز است، وجود دارد . تکنیک های متداول برای انتخاب ویژگی، - Omid et al. 2009 - PCA ، تحلیل ممیزی - Discriminant Analysis; DA - و درخت تصمیم - Samanta & Al-Baulshi, 2003 - هستند.

استخراج و انتخاب ویژگی ما 9 پارامتر آماری را از نمونه های حاصل از مقادیر پیک سیگنال های حوزه زمان محاسبه کردیم که محاسبه آنها ساده بوده و به طور گسترده در تشخیص های مهندسی مورد استفاده قرار می گیرند، از قبیل : میانگین، میانه، مد، انحراف استاندارد، واریانس، چولگی، کشیدگی، مینیمم و ماکسیمم. استفاده از این پارامترها به عنوان ورودی طبقه بند در مطالعات قبلی مورد تایید قرار گرفته است بنابراین کاهشی بالغ بر 96/4% در داده ها از 250×900 به 9×900 به دست آمد که سبب آسان تر شدن انتخاب ویژگی و به دست آمدن درخت تصمیم ساده تر می شود.

واضح است که همه ویژگیهای به دست آمده در طبقه بندی شرکت نمی کنند زیرا این امر سبب پیچیده شدن فرایند تصمیم سازی م ی گردد. از این رو نیاز است که سیاستی برای کاهش ویژگی به منظور به دست آوردن بهترین آنها اتخاذ گردد . روش های متنوعی برای کاهش ویژگی، نظیر PCA، DA و درخت تصمیم وجود دارد. مورد اخیر به سبب مشخصه های سودمند، نظیر شهودی بودن و سهولت استفاده موارد استفاده فراوانی در صنعت دارد. از دیگر رو، یک درخت تصمیم می تواند به آسانی به تعدادی قوانین اگر- آنگاه فازی که یک مجموعه از ورودی ها را به خروجی مرتبط می کنند، تبدیل گردد .

این امر یک خروجی صفر یا یک را به دست می دهد که برای اهداف طبقه بندی اتوماتیک برخط مناسب است . بنابراین الگوریتم J48 - یک اجرا از C4.5 در نرم افزار - WEKA به عنوان طبقه بند مورد استفاده قرار گرفت . پارامترهای آماری به عنوان ورودی به طبقه بند J48 وارد شدند. J48 بهترین ویژگی ها را برای طبقه بندی انتخاب کرده و آنها را در ساخت درخت تصمیم به کار می برد. با تنظیمات مناسب درخت تصمیم نظیر حداقل نمونه طبقه بندی شده بر هر برگ، و نیز استفاده یا عدم استفاده از روش هرس خطای کاهش یافته - Reduced -error pruning - به جای هرس خطای C4.5، می توانیم به یک درخت تصمیم با تعداد کمتر شاخه، گره و برگ - یا گره برگی - و در نتیجه تعداد کمتر قواعد تصمیم، دست یابیم که فرآیند تصمیم سازی را ساده تر می کند.

قواعد تصمیم با حرکت از ریشه به سمت برگهای درخت تصمیم، به سادگی به دست می آیند. گره بالایی - یا ریشه - بهترین گره برای تصمیم گیری است . سایر ویژگی ها در گره ها به ترتیب نزولی اهمیت ظاهر می شوند . درخت های طبقه بند، با نمونه هایی از 600 پسته اکبری و 200 پسته کله قوچی - مجموعه آموزش - آموزش داده شد و با 200 پسته اکبری و 100 پسته کله قوچی - مجموعه آزمایش - تست گردید

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید