بخشی از مقاله
چکیده
در هر برنامه ریزی نیاز داریم اطلاعاتی را از شرایط پیشین، مطالعه و ارزیابی کنیم و با استفاده از دانش بدست آمده از روند گذشته برای آینده ت صمیماتی را اتخاذ نماییم. یکی از علومی که در زمینه ی ارزیابی شرایط پی شین ب سیار خوب و کاربردی عمل کرده ا ست داده کاوی و کشف دانش است. قوانین انجمنی، استخراج روابط مابین داده های یک پایگاه داده بزرگ است و از وظایف مهم در داده کاوی محسوب می شود. بدین منظور، الگوریتم های متنوعی وجود دارند که از نظر سرعت اجرا وکیفیت جواب ها متفاوت می باشند. در این مقاله ما می خواهیم اطلاعات فاکتور خرید قطعات و لوازم یدکی خودرو ، صادر شده در یک نمایندگی مجاز خودرو را برر سی کرده و با روش FP-Growth به تحلیل قواعد انجمی این فاکتور های بپردازیم تا بتوانیم به یک برنامه من سجم جهت تعیین موجودی انبار و افزایش سرعت پاسخگویی و رضایت مشتری دست پیدا کنیم.
کلمات کلیدی: داده کاوی، قواعد انجمنی، الگوریتم Fp-Growth، کنترل موجودی انبار
.1 مقدمه
موجودی کالا دارای رابطه مستقیم با جریان نقدینگی است و حجم بیش از حد آن میتواند حیات نمایندگی را به خطر اندازد. اندک بودن موجودی نیز تهدیدی برای رشد نمایندگی، در صورتی است که نتواند کالاهای مورد نیاز مشتریان را تأمین کند زیرا در این صورت با از دست دادن مشتری با کاهش سهم بازار مواجه خواهد شد. نمایندگی مجاز از طرفی در نظر دارد که با خرید انبوه قطعات از شرکت های سازنده قطعات و خودرو از مزایایی همچون تخفیف های خرید عمده برخوردار شود و همچنین با تعیین میزان موجودی مناسب شرایطی را داشته باشد که با از دست دادن مشتری و سهم بازار رو برو نباشد. همچنین با توجه به محدودیت مالی و محدودیت فضای انبار قادر به نگه داشتن موجودی اضافه نخواهد بود. به علاوه اگر تعداد دفعات خرید زیاد باشد نمایندگی با مشکل هزینه های اضافه جهت سفارش دهی و حمل و ... روبرو خواهد شد.
در نتیجه تعیین موجودی برای این سازمان قابل اهمیت است، که این کار با کمک داده کاوی تسهیل پیدا خواهد کرد. داده کاوی یکی از تکنیک های هوش مصنوعی است که به منظور تجزیه و تحلیل در مقدار زیادی از داده ها، برای کشف الگوها و قوانین معنی دار توسعه یافته است. تکنیک های داده کاوی با استفاده از روش های آماری و هوش مصنوعی، الگوهای رفتاری اطلاعات پیشین را بررسی کرده و در مورد آنها دانش تولید می کند. با رشد سریع در اندازه و تعداد پایگاه داده ها، کاوش دانش و قواعد یا اطلاعات سطح بالا از داده ها به منظور پشتیبانی از تصمیم گیری ها و پیش بینی رفتارهای آتی، ضروری به نظر می رسد. کاوش قوانین انجمنی یک زمینه تحقیقاتی در مبحث داده کاوی و در راستای کشف ارتباطات جالب و با اهمیت بین اقلام اطلاعاتی در پایگاه داده های بزرگ و انبار های تراکنش می باشد، که اخیراً تلاش های تحقیقاتی فراوانی را به خود اختصاص داده است که از مهمترین کاربردهای آنها می توان به مسئله معروف تحلیل سبد خرید، اشاره کرد.
.2 مرور ادبیات
انبار: انبار به هر محل و فضایی که بتوان انواع مواد اولیه قابل مصرف در ساخت انواع محصول و یا محصولات و کالاهای قابل فروش و یا کالاهای نیم ساخته و انواع قطعات و لوازم یدکی و تجهیزات و ما شین آلات , ملزومات , ابزار آلات و یا هرگونه کالای م ستعمل و غیر قابل استفاده و اسقاطی را در آن بطور منظم , روشمند و سیستماتیک برای مدت معین و یا نامعلوم نگهداری و ذخیره کرد, اطلاق می شود. کنترل موجودی: یکی از مهمترین سیا ستها، روشها و رویههایی ا ست که همه شرکتها از آن تبعیت میکنند تا ت ضمین گردد که موجود کالاهای آنها در سطوحی قرار دارند که میتوانند هم استانداردهای از پیش تعیینشده خدمات را رعایت کنند و هم بودجه کافی را برای سرمایه در گردش آزاد سازند.
قوانین انجمنی: قالب کلی قوانین انجمنی به صورت عبارتIF-THEN و یا X آنگاه Y می باشد که نشان دهنده نوعی پیش آمد همزمان بین اقلام X و Y است X - و Y دو مجموعه قلم دلخواه از انباره داده ها هستند - . X و Y به ترتیب مقدم و تالی قانون نامیده می شوند. قواعد انجمنی قواعدی احتمالی ا ست، به عبارتی اگر قاعده X آنگاه Y و قاعده Y آنگاه Mرا دا شته با شیم لزوماً قاعده X آنگاه M را نتیجه نمی دهد. الگوهای مکرر: اصطلاح مجموعه اقلام پر تکرار برای اقلام با پشتیبانی بالا به کار می رود، در حقیقت الگوهای هستند که در یک مجموعه به فراوانی ظاهر می شوند. به عنوان مثال، مجموعه ای از آیتم ها مانند پکیج صفحه کلاچ ، دیسک کلاچ و بلبرینگ کلاچ که به فراوانی با همدیگر در یک مجموعه داده تراکنشی ظاهر می شوند یک مجموعه اقلام مکرر است. که توالی نیز در آن اهمیت دارد، یعنی X آنگاه Y با Y آنگاه X متفاوت است.
بررسی ارزشمندی قواعد انجمنیدر داده کاوی: در قوانین انجمنی ما با قوانینی زیادی روبرو هستیم که لزوماً ارزشمند نیستند، بنابراین معیارهای مختلفی برای ارزیابی میزان صحت و ارز شمندی قوانین ارائه شده اند، که بر ا ساس آنها می توان قوانین خوب را از میان مجموعه وسیعی از قوانین ممکن انتخاب کرد. معروف ترین و پر کاربردترین این معیارها، 2 معیار حداقل درجه پشتیبانی - Min Support - و حداقل درجه اطمینان - Min Confidence - است. حداقل درجه پشتیبانی - : - Min Support در اکثر اوقات تنها قوانینی برای ما جالب و مفیدند که شامل اقلامی باشند که با دفعات تکرار زیاد همراه باشند، نه اقلامی که به ندرت درانباره داده ها یافت می شوند . بنابراین اغلب روش ها فرض شان بر این است که ما به دنبال مجموعه اقلامی هستیم که حداقل در کسر قابل قبولی از تراکنش ها با هم رخ دهند، به عبارتی دیگر پشتیبانی آنها از معیار حداقل پشتیبانی مورد نظر ما کمتر نباشد. پس پشتیبانی عبارت است از نسبت تعداد تراکنش های شامل تمام اقلام موجود درX به تعداد کل تراکنش هاست.
حداقل درجه اطمینان : - Min Confidence - میزان وابستگی یک کالا با یک کالای دیگر را بیان می کند، به عبارتی شاخصی برای اندازه گیری توان یک قاعده استخراج شده است. درجه اطمینان یک قانون X آنگاه Y هم به صورت نسبت تعداد دفعات تکرار همزمان X وY به تعداد تکرار X به تنهایی تعریف می شود یعنی کسری از تراکنش ها ی شامل X که Y را نیز شامل می شوند. الگوریتم :FP-Growth روش جالبی که مجموعه اقلام پرتکرار را بدون تولید مجموعه اقلام کاندید بهدست میآورد، FP-Growth است که از یک استراتژی تقسیم و حل استفاده میکند. این روش پایگاه داده را به مجموعهای از پایگاه دادهها که هرکدام یک قلم پرتکرار دارند، تق سیم میکند و هر پایگاه داده را جداگانه کاوش میکنددر. اوّلین ا سکن پایگاه داده همانند اپریوری مجموعه آیتمهای یکعضوی و پشتیبانی آنها مشخص میشود. مجموعه اقلام پرتکرار به ترتیب نزولی پشتیبانیشان مرتّب میشوند. سپس یک درخت به این صورت ساخته میشود که اوّل ریشه درخت با برچسب null ساخته میشود. بعد از آن پایگاهداده برای بار دوم اسکن میشود. اقلام هر تراکنش بهترتیب L پردازش می شوند و یک شاخه برای هر تراکنش ایجاد می شود. به منظور ت سهیل پیمایش درخت، یک جدول ساخته میشود که هر قلم در آن به محل خودش دردرخت اشاره میکند. درخت پس از اسکن همه تراکنشها کامل میشود.
.3 پیشینه تحقیق
میزان موجودی انبار و بهینه کردن آن توسط روش های مختلف بررسی شده است. همچنین الگوریتم های زیادی برای کشف قوانین انجمنی تا کنون ارائه شده است که تفاوت آنها در نحوه کشف اقلام پرتکرار است و هر کدام مزایا و معایبی دارند. نصیری و همکاران - 1390 - 2 به کشف قوانین انجمنی با الگوریتم PSO در یک مجموعه داده بزرگ پرداختند و توانستند سرعت همگرایی برای کاوش قوانین انجمنی با ا ستفاده از این الگوریتم بالا برده و از درجه اطمینان، مقدار پ شتیبانی و طول قانون تولید شده به عنوان برازندگی این الگوریتم استفاده نمایند. ترابی مقدم و همکاران - 1391 - 3 الگوی رفتار تامین کنندگان در تامین قطعات خودرویی توسط یک شرکت قطعه ساز خودرو را توسط داده کاوی و متدولوژی CRISP-DM مورد بررسی قراد دادند.
صدرالدینی و همکاران - 1385 - 4 با استفاده از داده کاوی و قواعد انجمنی به روش بهینه ای برای شمارش تعداد دفعات رخداد اقلام دست یافتند و کارایی آن را با استفاده از مجموعه داده های ساختگی و واقعی ارزیابی و با چندین روش کارا مقایسه نمودند. هان و کمبر - 2006 - 12 عامل اصلی گرایش هر سازمان به استفاده از تکنیک های داده کاوی را سرعت بالای رشد داده های ذخیره شده در پایگاه های داده سازمان می دانند. بدیهی است که پایگاه های داده مرتبط با مدیریت زنجیره تامین در سازمان هم از این قاعده مستثنی نبوده اند. باقر پور و همکاران - 1391 - 5 به بررسی 23 متغیر مالی و غیر مالی موثر برگریز مالیاتی با استفاده از تکنیک های داده کاوی در صنعت خودرو و ساخت قطعات پرداختند.
فار سیجانی و همکاران - 1390 - 6 برای محا سبه نقاط بهینه سفارش دهی از روش منطق فازی ا ستفاده کردند. از آنجا که در مدل های سفارش دهی نمی توانیم به طور دقیق پارامترهایی مثل هزینه را پیش بینی نماییم و مقادیر دقیق موجب برنامه ریزی اشتباه می شود، بنابراین راهکاری برای استفاده از اعداد فازی در تصمیم گیری های مربوط به کنترل موجودی سیستم های سفارش دهی ارائه کردند. طالعی زاده و همکاران - 1394 - 7 یک مساله کنترل موجودی دوره ای را بررسی کردند. در اصل، مدل میزان سفارش اقتصادی تحت دو سیاست تصادفی بودن فاصله زمانی بین دو بازپرسازی و لحاظ کردن سیاست پرداخت معوقه را توسعه دادند و مقعر بودن تابع متوسط