بخشی از مقاله

چکیده

در پی رشد روزافزون دادههای تولیدشده توسط بازارهای مالی همچون بورس اوراق بهادار و بهمنظور بهرهگیری مؤثر از این دادهها، شناسایی تکنیکهای هوشمند برای استخراج اطلاعات از این مجموعه دادههای بزرگ به امری ضروری و حیاتی تبدیلشده است. یکی از مسائل بسیار مهم سرمایهگذاران در بازارهای سرمایه اطلاع از ارتباط بین سهمهای مختلف و مدلسازی این بازارها است. دادهکاوی فرآیند نوینی است که میتواند منجر به کشف الگوها و مدلهای جالب موجود در دادههای مالی شود. به همین منظور و با هدف کشف یک دانش کاربردی مفید، در این پژوهش دو روش خوشهبندی سلسله مراتبی بهعنوان یک الگوریتم دادهکاوی بر روی 27 سهم از شرکتهای بزرگ پذیرفتهشده در بورس اوراق بهادار تهران اعمال شد. نتایج پژوهش نشان میدهد که با اجرای الگوریتمهای خوشهبندی سلسله مراتبی، خوشههایی از سهمها شناسایی شد که در هر خوشه، سهمها با توجه به صنعتی که در آن فعالیت میکنند، به یکدیگر پیوند خوردهاند. بهکارگیری روش خوشهبندی سلسله مراتبی پیوند میانگین گروهی وزندار توانست یک سلسلهمراتب بهخوبی تعریفشده از همبستگی سهمهای موردمطالعه کشف کرده و ساختار خوشهای واضحتری نسبت به روش تک پیوندی ارائه سازد. نتایج این پژوهش، نویدی از توانایی بالا و قابلتوجه روشهای خوشهبندی سلسله مراتبی بهعنوان یکی از روشهای دادهکاوی در تجزیهوتحلیل بازارهای سهام و مدلسازی نظری از ارتباط این سهمها است.

واژههای کلیدی: بازار سهام؛ خوشهبندی سلسله مراتبی؛ دادهکاوی

.1 مقدمه و بیان مسئله

در دنیای تجارت، دادههای مالی بهعنوان سرمایه راهبردی مطرح هستند. دادههای مالی برای پیگیری عملکرد کسبوکار شرکتها، نظارت بر تغییرات بازار و حمایت از تصمیمگیری مالی استفاده میشوند. حجم بهسرعت رو به رشد دادهها بالاتر از توانایی برای تجزیهوتحلیل دستی آنها است و یک نیاز مبرم به روشهای خودکار جهت استفاده مؤثر و بهینه از دادههای عظیم مالی بهمنظور حمایت شرکتها و افراد در برنامهریزی استراتژیک و تصمیمگیری سرمایهگذاری وجود دارد. روشهای دادهکاوی1 به کشف الگوهای پنهان و پیشبینی روند آینده و رفتار در بازارهای مالی توانا هستند. دادهکاوی فرصتی برای شرکتها فراهم میسازد تا بتوانند بهمنظور به دست آورده مزیت رقابتی تصمیمات فعال و دانشمحور بگیرند.

روشهای دادهکاوی میتوانند برای تعدادی از برنامههای مالی ازجمله توسعه مدلهای تجارت، انتخاب سرمایهگذاری، پیشبینی سهام، ارزیابی و پیشبینی پرداخت وام، بهینهسازی پرتفوی، تجزیهوتحلیل ریسک سرمایهگذاری، تشخیص کلاهبرداری مالی، پیشبینی ورشکستگی، نرخ تبادلات خارجی، تجزیهوتحلیل سیاست اعتباری مشتری، ارزیابی املاک و مستغلات و غیره به کار رود. مزایای رقابتی بهدستآمده توسط دادهکاوی شامل افزایش درآمد، کاهش هزینه، بهبود در واکنش و آگاهی از بازارهای مالی است - ژانگ و ژوو، . - 2004یکی از مهمترین عوامل رشد شکوفایی اقتصاد، سرمایهگذاری است. بورس اوراق بهادار بازاری سازمانیافته و متشکل از سرمایه است که در آن خریدوفروش سهام شرکتها یا اوراق قرضه تحت ضوابط و قوانین خاصی انجام میگیرد.

بورس اوراق بهادار از چنان اهمیتی در سیستم های اقتصاد پیچیده امروزی برخوردار است که از آن بهعنوان میزانی برای سنجش سلامت یا بیماری اقتصاد کشورها نام برده میشود. بورس اوراق بهادار همچنین یکی از کاراترین روشها برای جذب نقدینگی سرگردان و راکد مردمی است که بهراحتی قادر به استفاده بهینه از سرمایه خود نیستند. بورس اوراق بهادار علاوه بر مشارکت گسترده در مالکیت واحدها و انتفاع از مزایای سرمایهگذاری شرکتها، با جذب این نقدینگی و هدایت آن در فعالیتهای سازنده و مفید اقتصادی باعث تحقق اهداف ضد تورمی دولت خواهد شد. بااینوجود، یکی از عواملی که در توسعه و رشد بازار سرمایه نقش مؤثری دارد، آشنایی سرمایهگذاران و معامله گران بازار سرمایه با روشهای تجزیهوتحلیل اوراق بهادار و افزایش توان تحلیلگری آنها است.

از سوی دیگر با افزایش روزافزون دادهها و پیچیدگیهای بسیار در شرایط و متغیرهای بازار، حجم عظیمی از دادهها با ویژگی های مختلف در حال جمعآوری و انبار شدن است. افزایش ویژگیها به دلیل پیچیدگیهای حاکم بر شرایط بسیار گنگ کننده است و نرخ رشد دادههای جمعآوریشده سرسامآور است. مسئله اصلی کشف دانش از این حجم زیاد و پیچیده داده است؛ چراکه برای تصمیمگیری مؤثر و صحیح در این بازارهای مالی چارهای جز بهرهگیری مؤثر از دادهها و اطلاعات حاصل از آنها نیست.

در این شرایط دادهکاوی ابزاری سودمند است که در اختیار تمام شرکتها است. دادهکاوی ابزاری هوشمند است که به جمعآوری و پردازش دادهها و بهرهمندی از آنها منجر میشود - شیفرت، . - 2004 به بیان ساده، دادهکاوی اشاره به استخراج و معدن دانش از مقدار زیادی از دادهها است؛ اما بهتر است تا دادهکاوی، استخراج دانش از دادهها نامیده شود - هان و کمبر، . - 2001 اهداف دادهکاوی با استفاده از روشهای دادهکاوی محقق میشوند. روشهای دادهکاوی درواقع بیانگر جمع کثیری از الگوریتمها و فنون است که از علومی مانند آمار، یادگیری ماشینی و پایگاه داده و تجسم سازی استنتاج شدهاند. امروزه استفاده از الگوریتمهای دادهکاوی و یادگیری ماشینی درزمینه انتخاب بهینه پرتفوی سهام بسیار مورد کاربرد بوده که باعث افزایش بیشتر بازده، کم کردن هزینه و آگاهی بهتر نسبت به مسائل پیش روی سهام است - ژانگ و ژوو، . - 2004

مسئله انتخاب سهام یکی از مسائل مهم و پیچیده درزمینه مالی و تصمیمات سرمایهگذاری است. این شاخه از مسائل بهصورت اساسی به مسئله عملکرد مناسب سهام در آینده و ساختن پرتفوی بهینه از سهام مرتبط است. بر همین اساس، نیاز به بررسی وضعیت سهام و داشتن یک برآورد از چگونگی بازده آنها بدون شک جزء مهمترین خواستههای سرمایهگذاران بازار است. به دلیل شرایط پیچیده بازار بورس اوراق بهادار، تحلیل وضعیت شرکتها کار پیچیدهای است که سرمایهگذاران اندکی قادر به انجام آن خواهند شد؛ بنابراین در اینپژوهش هدف ایجاد یک پلت فرم ارزشمند برای مدلسازی نظری و تجزیهوتحلیل بازارهای سهام با استفاده از روشهای دادهکاوی است. بدین منظور در این پژوهش از روشهای خوشهبندی سلسله مراتبی2 که بهعنوان زیرمجموعهای از دادهکاوی محسوب میشوند جهت پاسخگویی به سؤال پژوهشی زیر استفادهشده است:

-1 توانایی روشهای خوشهبندی سلسله مراتبی در آشکارسازی ساختار همبستگی بین قیمتهای سهام قلمرو موردمطالعه چگونه است؟

در ادامه، مقاله به بررسی پیشینه پژوهش، روش شناسی پژوهش و یافتهها و نتایج آن میپردازد.

.2 مبانی نظری و پیشینه پژوهش

با توجه به دسترسی و فراوانی دادهها، امروزه دادهکاوی به یک حقیقت مهم و لازم تبدیلشده است. دادهکاوی اصطلاحی برای توصیف تغییر فرآیندها در پایگاه دادههای بزرگ است که برای جستجوی الگوهای جالب و ناشناخته قبلی به کار میرود. شاخه دادهکاوی تکنیک و ابزارهایی را در اختیار میگذارد که با استفاده از آنها میتوان کمیت عظیمی از دادهها را بهصورت خودکار تحلیل کرد. دادهکاوی بخشی از فرآیند سراسری شناخت اکتشافات پایگاه داده است - روکاچ و مایمون، . - 2013 دادهکاوی روشهای متنوع و وسیعی را شامل میشود که در راستای خودکار سازی، کاوش، تحلیل و مدلسازی منبع عظیمی از دادهها به کار میرود و هدف آن بهکارگیری الگوهای نوین، معتبر و قابلفهم است.

دادهکاوی شامل استنباط از الگوریتمهایی است که اطلاعات را مورد کاوش قرار میدهد تا مدلهایی را توسعه و ایجاد نماید که بتواند چارچوبی در جهت شناخت الگوهای ناشناخته قبلی تشکیل دهد - داهان، کوهن، روکاچ و مایمون، . - 2014 الگوریتمها و تکنیکهای متفاوتی جهت دادهکاوی وجود دارد، روشهای خوشهبندی3 زیرمجموعهای از آن روشها است که در این پژوهش به آن پرداخته میشود. دادهکاوی یک فعالیت اکتشافی است؛ بنابراین روشهای خوشهبندی برای دادهکاوی مناسب هستند. برخی از روشهای دادهکاوی که از خوشهبندی استفاده میکنند شامل تقسیمبندی پایگاه داده، مدلسازی پیشبینی و تجسمی از پایگاه دادههای بزرگ است.

در دادهکاوی از روشهای خوشهبندی جهت بخشبندی پایگاه داده به گروههای همگن استفاده میشود که این موضوع میتواند به اهداف فشردهسازی دادهها یا به شناسایی ویژگیهایی از زیرگروههای مورد هدف کمک کند - اولسن و دیلن، . - 2008 خوشهبندی یک شکل از دادهکاوی است که ازنظر یکچشم انداز تاریخی، ریشه در ریاضیات و آمار دارد. از دیدگاه یادگیری ماشینی، خوشهبندی یادگیری بدون نظارت از یک مفهوم داده پنهان است - برکین، . - 2006 خوشهبندی بهعنوان یک جزء ضروری از اصطلاح دادهکاوی است. در اصل یک فرآیند بررسی و تحلیل مقادیر زیادی از دادهها بهمنظور کشف اطلاعات مفید است.تجزیهوتحلیل خوشهای یک فعالیت مهم انسانی است. در اوایل دوران کودکی ما یاد میگیریم که چگونه بین حیوانات و گیاهان بهوسیله بهبود مداوم طرحهای خوشهبندی ناخودآگاه، تمایز قائل شویم و الگوهای کلی توزیع و ارتباط جالب میان دادهها را کشف کنیم.

تجزیهوتحلیل خوشهای بهطور گستردهای در برنامههای کاربردی متعددی نظیر تحقیقات بازار، تشخیص الگو، تجزیهوتحلیل دادهها و پردازش تصویر مورداستفاده بوده است. در کسبوکار، خوشهبندی میتواند به بازاریابان در کشف تمایز گروهها در پایگاههای مشتریان و توصیف گروههای مشتری بر اساس الگوهای خرید کمک کند. در زیستشناسی، میتوان آن را برای استخراج ردهبندیهای گیاهی و حیوانی، دستهبندی ژنها باقابلیتهای مشابه و کسب بینش درباره ساختار اصلی جمعیت مورداستفاده قرارداد. خوشهبندی ممکن است به شناسایی نواحی از زمینهای مشابه استفادهشده در یک پایگاه داده رصد کره زمین و یا شناسایی گروهی از خانهها در یک شهر با توجه به نوع خانه، ارزش و موقعیت جغرافیایی کمک کند. خوشهبندی همچنین میتواند برای کمک به طبقهبندی اسناد در وب، جهت کشف اطلاعات مورداستفاده قرار گیرد. خوشهبندی میتواند برای تشخیص دادههای دورافتاده - پرت - نیز مورداستفاده قرار گیرد که در آن نقاط دورافتاده - مقادیری که دور از هر خوشه

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید