بخشی از مقاله
چکیده -
در این مطالعه با استفاده از عوامل مختلف تأثیرگذار شامل شاخصهای سهام، اندیکاتورها و عواملی دیگر مانند طلا، نفت و دلار به پیشبینی روند قیمت سهام فولاد اصفهان در بازار بورس اوراق بهادار ایران پرداختهشده است.
این روش مجموعه داده را بر اساس نوع آنها به سه دسته شاخصها، اندیکاتورها و عوامل دیگر تقسیمبندی کرده است، هر بخش از این مجموعه داده در یک دسته از عوامل قرار میگیرند و عوامل وابسته به هم هستند، سپس بر اساس عامل تورم واریانس، تأثیرپذیرترین عوامل در هر بخش مشخص شده، درنهایت یک مدل مارکوف برای هر دسته داده طراحیشده است، زیرا در صورت استفاده از یک مدل برای تمام متغیرها، تعداد حالات مدل مارکوف افزایش مییابد و باعث پیچیدگی مدل و منجر به کاهش دقت پیشبینی به دلیل متفاوت بودن نوع دادهها و تأثیرپذیری آنها بر رویهم شود.
درنهایت با رأیگیری احتمالی از نتایج مدلهای مارکوف، روند قیمت سهام فولاد اصفهان پیشبینیشده است. روش پیشنهادی بر اساس معیارهای دقت، Precision، Recall و F-measure مورد ارزیابی قرار گرفت و با روش ترکیبی مدل مخفی مارکوف- شبکه بیزین و روش مدل مخفی مارکوف مقایسه شد. نتایج نشان داد بخشبندی دادهها بر اساس نوع آنها و طراحی مدل مارکوف مجزا برای هر دسته در افزایش دقت پیشبینی تأثیرگذار است. دقت بهدستآمده برای سهام فولاد اصفهان % 86,56 است.
-1 مقدمه
سرمایهگذاری در سهام باوجود ریسک بالا، یکی از محبوبترین سرمایهگذاریها است و میتواند منجر به سوددهی بالا شود، اما بازار سهام تحت تأثیر عواملی ازجمله اقتصاد کلان و بینالمللی، نوسانات بازار سهام و سیاست دولت است که پیشبینی قیمت را دشوار میسازد[1, 2]، همچنین بیشتر اطلاعات تأثیرگذار بر بازار سهام مانند تورم، سیاستهای دولت و غیره در دسترس نیستند، بنابراین بر پیچیدگی پیشبینی روند سهام میافزاید.
در سالهای اخیر تحقیقات گستردهای بهمنظور یافتن مدلهای مناسب برای پیشبینی رفتار بازار سهام صورت گرفته است. بیشتر این تحقیقات از تکنیکهای تحلیل سریهای زمانی آماری و مدلهای رگرسیون چندگانه بهره گرفتهاند. اخراًی سیستمهای پیشبینی مبتنی بر هوش مصنوعی در پیشبینی رفتار بازار سهام توسعه دادهشدهاند. ازجمله این روشها میتوان به شبکههای عصبی مصنوعی، منطق فازی[9]، ترکیب شبکههای عصبی فازی، مدل مخفی مارکوف[10] و غیره اشاره کرد.
با توجه به اینکه پیشبینی دقیق روند سهام در بازار بورس میتواند کمک شایانی به سرمایهگذاران کند تا تصمیمگیری دقیقتری داشته باشند و با اعتماد بیشتر سرمایهگذاری کنند، همچنین پیشبینی خوب به جذب سرمایه کمک میکند، پس ارائه مدلی جهت پیشبینی هوشمندانه بازار بسیار حائز اهمیت است.
در این مطالعه، یک مدل مارکوف گروهی برای مدلسازی رفتاری شاخص قیمت سهم در بازار بورس اوراق بهادار ایران پیشنهادشده است. همانطور که گفته شد، قیمت یک سهام در بازار بورس به عوامل مختلفی ازجمله قیمت طلا، نفت، دلار، تغییرات شاخص صنعت، شاخص کل و غیره بستگی دارد. همچنین رفتار روندی یک سهم را میتوان بر اساس رفتار اندیکاتورهای مختلف بررسی کرد. به این منظور از یک مدل مارکوف گروهی برای پیشبینی سهام بر اساس تأثیر عاملهای مختلف و اندیکاتورها استفادهشده است.
ساختار مقاله به این شرح است: در بخش 2، به بررسی کارهای گذشته، یخش 3، شامل تعریف مفاهیم پایه، بخش 4، تشریح الگوریتم پیشنهادی، بخش 5، ارزیابی الگوریتم پیشنهادی و در بخش 6، نتیجهگیری کلی از این مطالعه بیانشده است.
-2 کارهای گذشته
پیشبینی بازار سهام یک مشکل کلاسیک است که با استفاده از ابزار و تکنیکهای یادگیری ماشین تجزیهوتحلیل شده و بهتازگی از مدل مخفی مارکوف برای پیشبینی بازار سهام استفادهشده است. Aditya Gupta و همکارانش[10]، از یک رویکرد HMM برای پیشبینی ارزش سهام روز بعد با توجه به دادههای تاریخی استفاده کردهاند. درروش پیشنهادشده، از یک HMM پیوسته بر اساس برآوردگر MAP برای پیشبینی سهام استفادهشده و تصمیم MAP با تمام مقادیر ممکن از سهام و با استفاده از یک HMMپیوسته که قبلاً آموزش دادهشده، ساختهشده است. تکنیکهای سنتی فاقد پوشش نوسانات قیمت سهام است و روشهای جدید برای تجزیهوتحلیل از تغییرات قیمت سهام توسعهیافتهاند. در مقاله [12] از مدل مخفی مارکوف برای پیشبینی نوسانات بازار سهام استفادهشده است، زیرا مدل مخفی مارکوف در استخراج اطلاعات از دادهها کارآمدتر است.
HMM با استفاده از الگوریتم باوم ولش آموزش دادهشده و این مدل برای تست دادهها با استفاده از روش Maximum a posteriori توسعه دادهشده است. Kavitha و همکاران در سال 2013 از روش مبتنی بر مدل مخفی مارکوف برای پیشبینی روند بازار سهام استفاده کردهاند. در این روش ابتدا برای یک بازه زمانی مشخص، تفاوت قیمت بستهشده سهام در هرروز نسبت بهروز پیش محاسبه، سپس متناظر با آن ارزش توزیع احتمال حالات پایدار مشخصشده است. درنهایت بر اساس مقادیر احتمال بهدستآمده الگوی رفتار بازار سهام قابل پیشبینی است.
[13] Engel، با استفاده از مدل سوئیچینگ مارکوف به بررسی رفتار نرخ ارز شناور پرداخت و مشاهده کرد مدل در صورت وجود نوسانات زیاد در یکجهت، مداوم علاقه دارد در آن جهت رشد کند، همچنین دقت مدل سوئیچینگ مارکوف بهطورکلی کمتر از مدل پیادهروی تصادفی است، بنابراین مدل مارکوف سوئیچینگ پیشبینی خوبی از نرخ ارز فراهم نمیکند.
Md. Rafiul Hassan، از ترکیب جدیدی از مدل مخفی مارکوف و مدل فازی برای پیشبینی بازار سهام استفاده کردهاند. درروش پیشنهادشده از یک روش شبیه به شناسایی الگوهای داده با استفاده از HMM و سپس با استفاده از منطق فازی برای به دست آوردن مقدار پیشبینی، استفادهشده است.
در مقاله[15] یک فرمول بر اساس مارکوف برای پیشبینی بهمنظور کاهش سربار محاسباتی ارائهشده است. علاوه بر این، بهمنظور ایجاد ماهیت حدس و اتفاقی از پیشبینی واقعبینانهتر، از روش مونتکارلو برای برآورد نتیجه استفادهشده است.
Yan-Qing Zhang و همکارش [6]، نرخ ارز را با استفاده از یک شبکه عصبی گرانول جدید به نام شبکههای آماری فازی بافاصلههای عصبی - SFINN - پیشبینی کردهاند. در مقاله[17]، روش ترکیبی انتخاب ویژگی فراکتال و شبکه بیزین برای پیشبینی جهت شاخص قیمت سهام در روز استفادهشده است، زیرا بازار سهام یک سیستم پر هرجومرج غیرخطی است و تحقیقات مربوطه نشان داده که دارای بعد فراکتال آشکار است، ازاینجهت الگوریتم انتخاب ویژگی فراکتال برای تعیین شاخص فنی استفاده میشود. روش انتخاب ویژگی فراکتال برای حل مشکل غیرخطی مناسب است.
در مطالعه [18] یک مدل پیشبینی ترکیبی با استفاده از مدلهای خطی و شاخص فنی میانگین متحرک برای پیشبینی روند قیمت سهام ارائه پیشنهادشده است.
روش پیشنهادشده در چهار مرحله به پیشبینی پرداخته است:
- 1 میانگین متحرک آخرین دوره در سهام محاسبهشده است.
- 2 از خوشهبندی برای پارتیشنبندی مقادیر شاخص فنی به مقادیر زبانی بر اساس روشهای گسسته سازی داده استفاده گردیده است.
- 3 طراحی سیستم استنتاج فازی - FIS - برای ساخت قواعد زبانی از مجموعه داده شاخصهای فنی و بهینهسازی پارامترهای FIS توسط شبکه تطبیقی.
- 4 اصلاح مدل ارائهشده توسط مدل انتظار تطبیقی. بنابراین پیشبینی روند بازار بورس همچنان یکی از زمینههای موردنظر پژوهشگران است.
بامطالعه تحقیقات انجامشده درزمینه پیشبینی سهام، وجود مدلی که از عوامل تأثیرگذار بیشتری برای پیشبینی روند سهام استفاده کند، بهعنوان یک چالش مطرح است. در این تحقیق بامطالعه موردی بر روی سهام فولاد اصفهان در بازار بورس اوراق بهادار ایران به پیشبینی روند سهام بر اساس تأثیر عوامل مختلف شامل اندیکاتورها، شاخصها، قیمت طلا، نفت و دلار پرداختهشده است. همچنین برای کاهش پیچیدگی مدل طراحیشده برای هر دسته از مجموعه داده یک مدل مارکوف طراحیشده است.
-3 تعریف مفاهیم پایه
در روش پیشنهادی از مفاهیمی شامل اندیکاتور، عامل تورم واریانس، استفادهشده است. در این بخش به بیان تعاریف این مفاهیم پرداختهشده است.
-1-3 اندیکاتور
اندیکاتورها توابع ریاضی هستند که بر اساس فرمولهای خاص در جهت تحلیل بازار بهوسیله ابزارهای گرافیکی ترسیم و مورداستفاده قرار میگیرند. دادههای ورودی در شاخصها بر اساس تعدادی از بازههای قبلی تغییرات قیمت وارد میشود. در هر بازه زمانی اطلاعات قیمت آغاز - Open - ، پایان - Close - ، سقف - High - ، کف - LOW - و یا تعدادی از مجموع این اطلاعات مورداستفاده قرار میگیرد.[25]
-2-3 عامل تورم واریانس
عامل تورم واریانس در مدلهای رگرسیون خطی یکی از روشهای تخمین پارامترهای مدل است. یکی از مسائل و مشکلاتی که میتواند این روش را به چالش بکشد، وجود پدیدهای به نام هم خطی است. هم خطی وضعیتی است که نشان میدهد یک متغیر مستقل تابعی خطی از سایر متغیرهای مستقل استفاده شده است. اگر از هیچکدام از متغیرهای مستقل - X - در به دست آوردن رابطه استفاده نگردد، بنابراین برازش یک خط پیشنهادی مانند̅Y است و درنتیجه میزان خطا - انحرافات - از رابطهYi − ̅Y به دست میآید که آن را مجموع توان دوم کلSST=∑ - Yi − ̅ - 2 نامیده میشود است.
اگر هم خطی در یک معادله رگرسیون بالا باشد، بدین معنی است که بین متغیرهای مستقل همبستگی بالایی وجود دارد و ممکن است باوجود بالا بودن آن مدل دارای اعتبار بالایی نباشد. بهعبارتدیگر باوجودآنکه مدل خوب به نظر میرسد ولی دارای متغیرهای مستقل معنیداری نیست. یکی از شیوههای تشخیص وجود هم خطی که کاربرد زیادی دارد، استفاده از عامل تورم واریانس است. این عامل نشان میدهد واریانس ضرایب تخمینی تا چه حد نسبت به حالتی که متغیرهای تخمینی، همبستگی خطی ندارند، متورم شده است.
در آمار، عامل تورم واریانس شدت هم خطی چندگانه را در تحلیل رگرسیون ارزیابی میکند. درواقع یک شاخص معرفی میگردد و بیان میکند چه مقدار از تغییرات مربوط به ضرایب برآورد شده بابت هم خطی افزایشیافته است. شدت هم خطی چندگانه را با بررسی بزرگی مقدار VIF میتوان تحلیل نمود و بهعنوان یک قاعده تجربی مقدار VIF بزرگتر از 10 نشاندهنده هم خطی چندگانه بالا است.
برای محاسبه مقدار عامل تورم واریانس، مقدار VIF مطابق رابطه 1 محاسبه میگردد.
در رابطه فوق VIF نشاندهنده ضریب تعیین است و مفهوم این ضریب به این صورت است: از رگرسیون برای به دست آوردن رابطه میان یک یا چند متغیر مستقل و یک متغیر وابسته اگر از آگاهیمان نسبت به متغیرهای مستقل - X - استفاده کنیم خطی که برازش میشود ̂ است؛ بنابراین انحرافات از رابطهی − ̂ به دست میآید که در آن SSE=∑ - − ̂ - 2 را مجموع توان دوم خطا مینامیم. اگر تمام مشاهدات - Y - بر روی خط رگرسیونی ̂ برازش شده باشد درنتیجه − ̂ = 0 و مجموع توان دوم آنها نیز برابر صفر میشود
با توجه به اینکه SST برابر مجموع توان دوم خطاها زمانی است که از متغیرهای مستقل استفاده نمیکنیم و SSE مجموع توان دوم خطاها زمانی است که از متغیرهای مستقل استفاده میکنیم؛ بنابراینSSR را مجموع توان دوم رگرسیون مینامیم و بهصورت رابطه زیر محاسبهشده است.