بخشی از مقاله
چکیده:
این مقاله یک الگوریتم ترکیبی درازمدت و کوتاه مدت پیگیري روند تکاملی را پیشنهاد میکند که با سیستمهاي کلاسهبندي شبکه عصبی ترکیب میکند. براي ارزیابی روش پیشنهادي، آزمایشاتی با استفاده از جریان داده مبادله روزانه چندین شاخص بورس اوراق بهادار تهران اجرا شد. این شاخصها در دو گروه متغیرهاي فنی و متغیرهاي اقتصادي تقسیمبندي میشوند.
دادههاي مورد استفاده مربوط به پنج شرکت نفت پارس، ایران خودرو، موتوژن، غدیر و فولاد مبارکه که شامل متغیرهاي قیمت سهام طی دورهي زمانی 1389 تا 1394 به صورت روزانه بودند است. نتایج تجربی نشان دادند که سیگنالهاي خرید و فروش تولید شده در کوتاه مدت که توسط الگوریتم تولید شدند همبستگی بالایی - بیش از 95٫ - 0 با سیگنال خرید و فروش تولید شده در دراز مدت داشتند که بر اساس متغیرهاي آماري درازمدت شناسایی شدند. در نتیجهگیري این مقاله شواهد متقاعد کنندهاي ارائه میکند که مدل پیگیري روند ترکیبی پیشنهادي میتواند راهنمایی مبادله موثري براي سرمایهگذاران تولید کند.
.1 مقدمه
سرمایهگذاري کمی در حوزه مالی در حال تبدیل به یک موضوع داغ است، و محصولات سرمایهگذاري کمی بسیاري - مدلها، ابزارها، سیستمها - تولید شدهاند.
یکی از محبوبترین روشهاي طراحی محصولات جدید سرمایهگذاري کمی، یادگیري تکاملی است. این روش میتواند مسائل بهینهسازي داراي فضاي جستجوي عظیم را با کارآمدي و سرعت حل کند که آن را براي کاوش دانش از مجموعه دادههاي عظیم، پیچیده و غیرخطی مثل دادههاي بازار سهام مناسب میسازد.
تکنیکهاي یادگیري تکاملی ابتدا در کشف قانون مبادله در [1] به کار برده شد. به هر حال پژوهش آنها نشان داد که هیچ بازده بیشتري نسبت به 500 سهام برتر بازار بورس سهام نیویورك و نزدك پس از هزینه تراکنش وجود ندارد. مطالعات بسیاري در مورد کشف قانون مبادله پس از آن انجام شد.
براي مثال کائوسیک [2] بر مبناي فهرست 500 سهام برتر بازار بورس سهام نیویورك و نزدك از سال 2000 تا 2006، دریافت که مدل مبادله او میتواند بازده بیشتري در بازار گاوي بدست دهد ولی تنها میتواند به کاهش زیان در بازار خرسی منجر شود. این مطالعات دو محدودیت متمایز داشتند:
- 1 - نظریه سرمایهگذاري سهام در بهینهسازي اکتشافی در نظر گرفته نشده بود، و - 2 - الگوریتم تصمیمگیري/پیشبینی به کار رفته در آن براي کار با مسائل یک مرحلهاي طراحی شده بود نه مسائل چندمرحلهاي - این مشکل یقینا در زمینه تقویت پژوهش یادگیري مشخص شده است - و قابل استفاده خودکار در جهتگیريهاي بازار نبود.
پیگیري روند، یک استراتژي سرمایهگذاري مورد پذیرش عموم است. زیرا اصل سادهاي دارد و دشواري پیشبینی سهام دقیق را در نظر میگیرد. پیگیري روند براي این که تصمیم بگیریم کی یک سهام را بخریم و کی بفروشیم، از یک مکانیزم مبادله مبتنی بر قانون بر اساس روندهاي بازار - طولانی مدت و کوتاه مدت -
به جاي هر گونه پیشبینی قیمت یا گردآوري اطلاعات استفاده میکند.[3] فرض ضمنی پیگیري روند این است که کسی اطلاعات بازار را به ما داده است و ما میتوانیم آن را با گردآوري اطلاعات با هزینه خیلی کمتري دنبال کنیم.[4] صنعت سهام داراي محصولات سرمایهگذاري کمی مبتنی بر پیگیري روند موفق بسیاري است، براي مثال »مبادلهگر لاكپشتی
« چنان که در [6] نشان داده شد، پیگیري روند یک استراتژي مبادله معتبر در بازار نقدي است، که در آن شاخص میانگین حرکت ساده میتواند بازده بیشتري با نرخ اطلاعات کافی بدست دهد. با این حال زاکماري، شن و شارما [7] کارآیی استراتژيهاي مبادله پیگیري روند را در بازارهاي آتی کالا با استفاده از بررسی دیتاست ماهانه در طی 48 سال و در 28 بازار بررسی کردند.
روش آنها بازده میانگین مثبت بیشتري پس از کسر هزینههاي تراکنش در 22 بازار بدست داد. بر خلاف اهمیت و کارآیی پیگیري روند، کارهاي دانشگاهی کمی کاربرد روش یادگیري ماشینی - ML - را در بهبود استراتژي پیگیري روند بررسی کرده است. اولین تلاش بوسیله Fong و دیگران [5] صورت گرفت؛ او از منطق فازي براي ساخت یک مدل پویا براي مبادله روند درازمدت استفاده کرد. به هر حال شاخصهاي پیگیري روند انتخاب شده به سختی مواردي بهینه بودند زیرا هیچ انتخاب ویژگی یا مکانیزم معادلی - براي مثال یادگیري تکاملی - نداشتند.
براي حل مشکلاتی که در بالا اشاره شد، این مقاله یک الگوریتم پیگیري روند تکاملی ترکیبی درازمدت و کوتاه مدت پیشنهاد میکند. به طور خاص سیستمهاي کلاسهبندي شبکه عصبی و استراتژيهاي سرمایهگذاري پیگیري روند در راه حل پیشنهادي پیگیري روند ترکیبی به شکلی ترکیب شدهاند که روندهاي درازمدت و کوتاه مدت تشخیص داده شده براي پوشش دادن شبکه عصبی یکپارچهسازي شوند، و در نتیجه یک روش یادگیري محدود جدید را بدست دهند. الگوریتم پیگیري روند ترکیبی پیشنهادي به چند دلیل به این صورت طراحی شده است: - 1 - روند درازمدت میتواند نوسان را کاهش دهد در حالی که روند کوتاه مدت پاسخ سریع را ممکن میسازد، - 2 - شبکه عصبی آموزش داده شده مشابه با گروهی از سرمایهگذاران رباتی عمل میکند که به طور پیوسته و خودکار در محیط سهام فعلی به کار برده میشوند.
در نتیجه مدل پیگیري روند ترکیبی پیشنهادي داراي دو مزیت متمایز شده است. ابتدا ترکیبی از استراتژيهاي سرمایهگذاري سهام و یادگیري تکاملی میتواند به طور قابل توجهی به کاهش تلاش محاسباتی براي انتخاب ویژگی و بهبود عملیاتی شدن مدل منجر شود. دوم، که مهمتر نیز میباشد، راه حل پیشنهادي میتواند به طور خودکار به کار برده شود تا جهتگیريهاي بازار و قوانین مبادله کشف شده منطقی و قابل درك باشند، و تجزیه و تحلیل بیشتري بر آن میتواند مانع از مبادله غیرمنطقی توسط سرمایهگذاران متوسط گردد.
بدین منظور در این مقاله دو گروه شاخص مالی همچون متغیرهاي فنی شامل کمترین قیمت سهام، بالاترین قیمت سهام، قیمت اولیه سهام، حجم معاملات، ارزش معاملات، شاخص بازار اول تالار بورس، قیمت شاخص کل بازار براي گروه اول و متغیرهاي اقتصادي شامل نرخ ارز دلار، قیمت جهانی هر اونس طلا، قیمت جهانی نفت - برنت شمال - براي گروه شاخص دوم از شش شرکت فعال بورس اوراق بهاداجر تهران در بازه 1389 تا 1394 با استفاده از الگوریتم ترکیبی پیشنهادي مطالعه شدند. در این مطالعه با استفاده از شبکه عصبی نسبت به تشخیص سیگنالهاي خرید و فروش کوتاه مدت اقدام شد و نتایج با سیگنالهاي خرید و فروش بلند مدت که با روشهاي آماري شناسایی شده بودند مقایسه صورت گرفت..
.2 کارهاي مرتبط
بحثهاي متعددي در مورد اثربخشی تجزیه و تحلیل فنی در مبادله سهام ارائه شده است. برخی استدلال میکنند که قیمتهاي سهام قابل پیشبینی نیست زیرا کلیه اطلاعات در دسترس عموم قبلا در قیمتها منعکس شده است. به هر حال مطالعات اخیر منجمله کارهاي بروك، لاکونیشاك و لیبارون [8] و بلوم، ایسلی و اوهارا [9] شواهد تجربی مثبتی در مورد اثربخشی تجزیه و تحلیل فنی ارائه کردهاند
الگوریتمهاي مختلف ML براي تجزیه و تحلیل فنی به کار برده شده که در بین آنها محبوبترین موارد شبکه عصبی هوشمند [10] و ماشین بردار پشتیبانی - SVM - [11] هستند. به هر حال آنها هر دو مدلهاي جعبه سیاه هستند که به سختی هر گونه دیدگاهی در مورد ماهیت برهمکنشهاي بین شاخصهاي فنی و تلاطمات بازار سهام ارائه میکنند .[12] مایکل وي کاول یکی از مشهورترین مدیران سرمایه در ایالات متحده آمریکا است و تاکید کرده است که »جعبه سیاه من را در این مبادلات اذیت میکند، وضعیتی که من دارم ناتوانی در هضم الگوریتم است.[4] « این دیدگاه میرساند که یک مدل مبادله باید تنها وقتی به کار رود که بوسیله سرمایهگذاران قابل درك باشد [13] در غیر این صورت ریسک آن نامحدود است.
در نتیجه بسیاري از مطالعات براي کشف قوانین مبادله سهام قابل فهم انجام شدهاند. آلن و کارجالاینن [1] اولین کسانی بودند که به پیادهسازي تولید قوانین مبادله خودکار با استفاده از برنامهنویسی ژنتیک - GP - پرداختند. پس از آنها به زودي محققین بسیار دیگري اهمیت کشف قانون قابل فهم را تشخیص دادند.
الگوریتم ژنتیک - GA - و GP نیز به طور گسترده براي کشف قانون به کار رفتهاند که مواردي از آن عبارتند از. [1, 14-19] این روریکردها، فرآیند ساخت قانون بر مبناي یادگیري تکاملی است که هدف آن استفاده از قوانین بر محیط فعلی بوده و به دنبال قوانین بهینه جهانی در فضاي جستجوي عظیم است. دیگر روشهاي محبوب ML شامل درخت تصمیم [20]، منطق فازي [22 ,21]، مجموعه سخت [23] و جستجوي توري [24] هستند. به ویژه قوانین صریح را میتوان از مدل جعبه سیاه استخراج کرد. براي مثال لام [25]یک روش استخراج قانون جدید به نام GLARE براي آشکار کردن منطق پیشبینی و رویه جعبه سیاه شبکه عصبی هوش مصنوعی پیشنهاد کرد..
.3 مدل پیشنهادي
در این بخش نخست اشاره یی اجمالی به ساختار شبکه عصبی طراحی شده و سپس به بیان مفهوم پنجره لغزان پرداخته و در نهایت مدل پیگیري روند ترکیبی پیشنهادي در قالب یک شبه کد تشریح و تدوین میگردد.
.1,3 شبکه عصبی طراحی شده
شبکههاي عصبی در شناسایی و پیشبینی متغیرهاي مالی بورس در مطالعات بسیاري به کار رفتهاند. شبکههاي عصبی قادرند بر اساس سريهاي زمانی به شناسایی شرایط گذشته و پیشبینی شرایط پیش رو اقدام کنند. در این مقاله از یک شبکه عصبی سه لایه براي پیشبینی سیگنال خرید و فروش کوتاه مدت که به شرح ذیل بیان میشود، استفاده شده است.
شکل .1 شماي کلی شبکه عصبی طراحی شده
ورودي شبکه عصبی با استفاده از شاخصهاي یازده گانه تحقیق - گروه اول: متغیرهاي فنی شامل کمترین قیمت سهام - LowP - ، بالاترین قیمت سهام - - HighP، قیمت اولیه سهام - - FirstP، حجم معاملات - - VolT، ارزش معاملات - - VlaueT، شاخص بازار اول تالار بورس - - FIndex، قیمت شاخص کل بازار - PIndex - ؛ گروه دوم: متغیرهاي اقتصادي شامل نرخ ارز دلار - USD - ، قیمت جهانی هر اونس طلا - GoldP - ، قیمت جهانی نفت برنت شمال - - OilP - شکل داده شد.
بنابراین شبکه عصبی با 11 ورودي کدگذاري شده در لایه اول و 6 نورون مخفی لایه میانی و یک نورون لایه نهایی که پاسخ باینري - سیگنال خرید و سیگنال فروش - را تولید میکند ساخته شد. تعداد نورون لایه مخفی بر اساس سعی و خطا بدست آمد. این شبکه عصبی با استفاده از دادههاي واقعی شرکتهاي عضو بورس اوراق بهادار تهران آموزش داده شد و از آن در الگوریتم پیشنهادي استفاده شد. اما قبل از استفاده مستقیم از دادههاي خام آنها با پنجره لغزان که در بخش بعد تشریح شده کدگذاري شدند.
شبکه عصبی طراحی شده با استفاده از نرمافزار Matlab 2018a براي تکمیل الگوریتم پیگیري روند ترکیبی پیشنهادي براي هر یک از نمونه دادههاي موجود تا جایی آموزش داده شد تا به نتایج قابل قبولی دست یافت. در این شبکه گرههاي ورودي 12 عدد 11 - شاخص بهمراه خروجی مرحله قبل - ، گرههاي پنهان میانی 6 عدد و بازه تاخیر 20 روز در نظر گرفته شد. در هیچ یک از لایهها از بایاس استفاده نشد. تابع آموزش شبکه عصبی Bayesian Regularization تعیین گردید. در شبکههاي عصبی یکی از راههاي دستیابی موثر به پارامترهاي بهینه استفاده از این روش است که به طور اتوماتیک مقادیري مناسب براي پارامترهاي تابع قرار میدهد. روش تنظیم آن میتواند جهت بهبود توانایی شبکه عصبی و آموزش تابع هدف F که به صورت زیر نشان داده شده است، استفاده شود:
F=αEw+βED - 1 -
که در آن EW مجموع مربعات وزنهاي شبکه و ED مجموع مربعات باقیمانده بین پاسخ شبکه و تابع هدف میباشد. مقادیر آلفا و بتا نیز پارامترهاي تابع هدف هستند که هر یک از این پارامترها به آموزش شبکه در کاهش باقیمانده خروجیها یا حجم شبکه بستگی دارد. کارآیی بر اساس میانگین خطاي مربعی - MSE - اندازهگیري شد. براي محاسبات از تابع MEX استفاده شد. حداکثر تعداد تکرار آموزش 1000 بار تعیین شد که در صورت عدم بهبود نتیجه در 6 تکرار متوالی متوقف گردد. دادههاي ورودي به 70درصد داده آزمون، 15 درصد داده تایید و 15 درصد داده تست تقسیمبندي شدند که روش تقسیمبندي به صورت تصادفی Dividerand - - تنظیم شد.
.2,3 پنجره لغزان
در این تحقیق از یک پنجره لغزان استفاده شد که به تدریج همراه با گذر زمان، دادههاي جدیدتر روزانه بورس را به محاسبات وارد میکند و دادههاي قدیمی را رها میسازد. ساخت این پنجره لغزان بر اساس استفاده از دادههاي دوره کوتاه مدت 9 - روزه - و بلند مدت 20 - روزه - شکل داده شد. یعنی دادههاي خام در این بازهها به نحوي تغییر داده شدند که به جاي استفاده از داده واقعی از سیگنالهایی استفاده گردد که بیانگر روند رو به افزایش یا رو به کاهش مقادیر آن شاخص باشند. این تبدیل با استفاده از دادههاي کوتاه مدت قبلی 9 - روز اخیر - در قالب »رو به بالا« با کد 1 و »رو به پایین« با کد 2، کدگذاري شدند.