بخشی از مقاله

چکیده

علی رغم تلاش های متعدد برای خوشه بندی حوزه های مختلف کاری در کشور ولی هنوز حوزه هایی هستند که با شناسایی و دسته بندی آنها میتوانیم معیارهای توسعه و پیشرفت را بدست آورده و بهترین تصمیم ها را برای آن ناحیه اتخاذ کرد. حوزه بهره برداران تجارت الکترونیک یکی مباحثی است که امروزه بسیار ناشناخته اما دارای استعداد های فراوانی برای کسب درامد و تجارت می باشد.با استفاده از این حوزه می توانیم محصولات و کالاهای کشور را در سرتاسر جهان منتشر و کسب مشتری کنیم و این کار تنها با یک کلیک میسر میشود.

خوشه بندی بهره برداران تجارت الکترونیک کمک شایانی به مشخص کردن حوزه های تجارت الکترونیک خواهد کرد. البته مشکلات متعددی برای این کار وجود دارد از جمله اینکه داده های دقیقی از حوزه کاری برای حل این مسئله وجود ندارد و بایستی به داده های موجود اکتفا شود. بنابراین در این مقاله به خوشه بندی بهره برداران تجارت الکترونیک با استفاده از الگوریتم ژنتیک پرداخته شده و نتایج در انتهای مقاله منتشر گردید. نهایتا به این نتیجه رسیده که بیشترین بهره برداری الکترونیک در زمینه بانکداری، بورس و جواهرالات می باشد.

مقدمه و بیان مسئله

استفاده از فناوریهای الکترونیکی در انجام امور بازرگانی پیشینهای نسبتا طولانی دارد . در حقیقت ، نیاز به تجارت الکترونیکی از تقاضاهای بخشهای خصوصی و عمومی برای استفاده از تکنولوژی اطلاعات به منظور کسب رضایت مشتری ، و هماهنگی موثر درون سازمانی نشآت گرفته است . میتوان گفت این نوع تجارت ، از حدود سال 1965 آغاز شد که مصرف کنندگان توانستند پول خود را از طریق ماشینهای خود پرداز - ATM - دریافت کرده و خریدهای خود را با کارتهای اعتباری انجام دهند.

پیش از توسعه تکنولوژی های مبتنی بر اینترنت در سالهای آغازین دهه 90 ، شرکتهای بزرگ دست به ایجاد شبکههای کامپیوتری با ارتباطات مشخص ، محدود و استاندارد شده برای مبادله اطلاعات تجاری میان یکدیگر زدند . این روش ، مبادله الکترونیکی دادها - EDI - نامیده شد . هر بیست ساله ، امکانات تجارت الکترونیکی را متناسب با تواناییهای تکنولوژی اطلاعاتی آن عصر فراهم آورده است . در حالیکه ماشینهای خود پرداز و کارتهای اعتباری در عصر بیست ساله نخست به جریان افتادند ، در عصر دوم امکان استفاده از مبادله الکترونیکی دادهها - EDI - ، سیستم بانکی بین المللی - Swift - و انتقال وجه الکترونیکی - EFT - فراهم شد . اما توسعه اینترنت و کاربردهای تجاری آن ، باعث تحولی اساسی در این روند شده است ، به گونهای که در روند تکاملی تجارت الکترونیک ، میتوان میان تجارت الکترونیکی سنتی و نوع اینترنتی آن تمایز محسوسیقائل - شد.[2]

خوشه بندی به این معنا تفسیر می شود که حجم عظیمی از داده های مخلوط را در دسته های مشابه و نزدیک به هم قرار دهیم تا بتوانیم داده های پرت دارای اغتشاش - - noise را از تفسیر و تحلیل داده ها خارج کنیم. همچنین با استفاده از خوشه بندی می توانیم تصمیمی صحیح در تعیین آینده داده ها گرفته و آنها را در سازمان و یا پایگاه مورد نظر استفاده نمائیم. خوشه بندی داده ها بر دو نوع است: داده های عددی و داده های مختلط. در داده های عددی تعداد خوشه ها از قبل مشخص است و با روشهایی مانند K-means و NearestNighbor می توانیم داده ها را خوشه بندی کنیم و داده های دارای اغتشاش را دور بریزیم. در داده های مختلط تعداد خوشه ها از قبل مشخص نیست و برای دسته بندی آنها باید از روشهای دیگری استفاده کنیم. مطالعه پیش رو به خوشه بندی و شناسایی بهره برداران تجارت الکترونیک در شهر تهران با استفاده از الگوریتم ژنتیک می پردازد.

همچنین میزان بهره برداری هر صنف از تجارت الکترونیک مورد بررسی و تجزیه قرار می گیرد. اغلب روشهای خوشه بندی عددی از کارایی مناسبی برای دسته بندی برخوردارند ولی همیشه مسئله ما یک مسئله عددی نیست و داده های مختلط هم وجود دارند. همچنین در اغلب روشهای خوشه بندی، تعداد خوشه ها را از کاربر به عنوان ورودی طلب می کنند که این بیشتر در روشهای سنتی خوشه بندی وجود دارد. در بیشتر مسائل، به خصوص در این مسئله تعداد خوشه ها برای کاربر نامعلوم است.

بنابراین حدس زدن مقدار آن برای کاربر به خصوص زمانی که داده های بسیار زیادی داریم کاری بس مشکل و طاقت فرساست. این مطالعه به خوشه بندی بهره برداران تجارت الکترونیک در شهر تهران می پردازد. داده ها از قبل معلوم نیست و برای جمع آوری داده ها باید بیشترین جستجو را انجام دهیم . از تمامی وب سایت هایی که کالایی را به صورت الکترونیک و یا از طریق اینترنت به فروش می رسانند،بازدید نمائیم و اطلاعات آماری آنها را بدست بیاوریم و همچنین از وب سایت هایی که بصورت خدماتی کار می کنند، اطلاعات خدماتشان به مشتریان اینترنتی را جمع آوری کنیم و به روش الگوریتم مخصوص ژنتیک خوشه بندی وارد و نتایج را به صورت نمودارها و داده های آماری منتشر کنیم. - نگارنده -

در این بخش نیازی به معرفی الگوریتم پایه ژنتیک وجود ندارد ولی به صورت کلی روند اجرای کلی الگوریتم های ژنتیک مورد بررسی قرار می گیرد. این روند در تصویر شماره 2 آمده است. قبل از این که یک الگوریتم ژنتیکی بتواند اجرا شود, ابتدا باید کدگذاری - یا نمایش - مناسبی برای مسئله مورد نظر پیدا شود. همچنین یک تابع برازندگی نیز باید ابداع شود تا به هر راه حل کدگذاری شده ارزشی را نسبت دهد. در طی اجرا, والدین برای تولید مثل انتخاب میشوند و با استفاده از عملگرهای آمیزش و جهش با هم ترکیب میشوند تا فرزندان جدیدی تولید کنند.

نمودار -1 الگوریتم ژنتیک پایه

این فرآیند چندین بار تکرار میشود تا نسل بعدی جمعیت تولید شود. سپس این جمعیت بررسی میشود و در صورتی که ضوابط همگرایی برآورده شوند, فرآیند فوق خاتمه مییابد.[3]

روش الگوریتم ژنتیک پیشنهادی

درواقع آلگوریتم های ژنتیک مختلفی برای بهینه سازی وجود دارد این تفاوت به این دلیل است که روشهای ژنتیکی ساده برای حل همه مسائل بهینه سازی کارامد نبودند و محققین مجبودر بودند که ژنتیک ساده را دستکاری و بهبود دهند یا در نگاه عام تر با دقت بیشتری به سازوکار طبیعت نگاه کنند. برای مسائل بهینه سازی که چند جواب دارند بهتر است از روشهای دیگری از ژنتیک استفاده کنند. مثلا وقتی یک وب سایت کالاهای خود را در وب سایت نمایش می دهد، باید به شکلی باشد که کالاها و پیشنهاد های متفاوتی برای مشتریان داشته باشد.

در نظر بگیرید اگر این مسئله را با یک ژنتیک ساده حل نمائیم فقط می توانیم یک پیشنهاد داشته باشیم در حالی که اولا معیارهای مشتریان متفاوت است دوما کیفیت کالا یا خدمت ارائه شده هم متفاوت است. پس ما نیاز داریم تا چندین پیشنهاد را برروی وب سایت داشته باشیم. به چنین روشهایی از آلگوریتم ژنتیک که قابلیت تولید چندین جواب را دارند روشهای مالتی مودالٍ می گویند. بنابراین در حل مسئله خوشه بندی بهره برداران تجارت الکترونیک شهر تهران از چنین روشی از آلگوریتم ژنتیک استفاده می کنیم.در ادامه جزئیات این روش را شرح خواهیم داد.

ذکر این نکته حیاتی است که این پروژه با روش الگوریتمی که منبع آن ذکر شده است حل خواهد شد. روش الگوریتم ژنتیک خوشه بندی مورد استفاده - خوشه بندی داده های مختلط با استفاده از الگوریتم ژنتیک - روش ژنتیکی خوشه بندی که برای حل این مسئله استفاده می شود، از نوع روشهای افراز داده مبتنی بر الگوریتم ژنتیک است که قادر به یافتن جواب های بهینه است.همچنین این روش قادر به یافتن داده های مختلط می باشد.

-1قابلیت کار بر روی داده های مختلط

-2تعیین مقدار بهینه برای تعداد خوشه ها

-3استفاده از روشی دقیق برای تعیین فاصله بین داده های دسته ای در این روش فاصله بین دو داده را به صورت زیر در نظر گرفتیم.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید