Abstract:
مقاله حاضر به بررسی سودمندی رگرسیون های تجمیعی و روش های انتخاب متغیرهای پیش بین بهینه
(شامل روش مبتنی بر همبستگی و ریلیف) برای پیش بینی بازده سهام شرکت های پذیرفته شده در بورس
اوراق بهادار تهران می پردازد. به منظور ارزیابی عملکرد رگرسیون تجمیعی، معیارهای ارزیابی (شامل میانگین
قدرمطلق درصد خطا، مجذور مربع میانگین خطا و ضریب تعیین) مربوط به پیش بینی این روش، با
رگرسیون خطی و شبکه های عصبی مصنوعی مقایسه شده است. همچنین به منظور ارزیابی عملکرد
روش های انتخاب متغیرهای بهینه پیش بین، معیارهای ارزیابی حاصل از پیش بینی با استفاده از متغیرهای
انتخاب شده توسط این روش ها با معیارهای حاصل از پیش بینی با استفاده از کلیه متغیرها مقایسه شده
است. یافته های تجربی مربوط به بررسی 101 شرکت پذیرفته شده در بورس اوراق بهادار تهران در سال های
1131 الی 1131 حاکی از عملکرد بهتر روش تجمیعی نسبت به رگرسیون خطی و شبکه های عصبی
مصنوعی است. افزون بر این، یافته ها حاکی از آن بود که پیش بینی با استفاده از متغیرهای انتخاب شده در
روش های مبتنی بر همبستگی و ریلیف، به طور معناداری عملکرد پیش بینی را نسبت به استفاده از کلیه
متغیرها افزایش می دهد.
Present study investigates the usefulness of ensemble regression and feature selection methods (including correlation-based feature selection and Relief) in predicting stock returns of companies listed on Tehran Stock Exchange. For performance evaluation of ensemble regression, evaluation criteria (including mean absolute percentage error, root mean squared error and coefficient of determination) of this method compared with linear regression and artificial neural networks. Also, for performance evaluation of feature selection methods, evaluation criteria of these methods compared with using all variables. The experimental results of investigating 101 companies listed in Tehran Stock Exchange in 2004-2013 indicate that ensemble regression outperforms the linear regression and artificial neural networks. Furthermore, the results show that selected variables with correlation-based feature selection and Relief result in better prediction in compare with using all variables.
Machine summary:
تاکنون پژوهشی که به بررسی انتخاب متغیرهای پیش بین و روش های آن و هم چنین پـیش بینـی بـازده سهام شرکت های پذیرفته شده در بورس اوراق بهادار تهـران بـا اسـتفاده از رگرسـیون غیرخطـی تجمیعـی پرداخته باشد، انجام نشده است .
٦- یافته های پژوهش جدول های ٤ الی ٦ معیارهای ارزیابی (شامل میانگین قدرمطلق درصد خطا، مجذور مربع میانگین خطـا و ضریب تعیین ) مربوط به پیش بینی بازده سهام را بر اساس روش های رگرسیون تجمیعی (ER)، شبکه هـای عصبی مصنوعی (ANN) و رگرسیون خطی (LR) در سه حالت ، با استفاده از ٥٢ متغیر پـیش بـین (All)، بـا متغیرهای انتخابی در روش های مبتنی بر همبستگی (Corr) و ریلیف (R) نشان می دهد.
افزون بر این ، در اغلب پژوهش های انجام شده در بورس اوراق بهادار تهران ، از روش های خطی و در پـژوهش هـای اندکی نیز از شبکه های عصبی مصنوعی برای پیش بینی بازده سهام استفاده شـده اسـت و علـیرغـم برتـری نظری و تجربی سایر روش های غیرخطی از قبیل رگرسیون تجمیعی ، تاکنون از این روش ها اسـتفاده نشـده است .
با توجه به نتایج حاصل از آزمون فرضیه های فرعی مربوط به فرضیه اصلی دوم ، مبنـی بـر ایـن کـه متغیرهـای انتخـابی روش ریلیـف بهتـر از متغیرهـای انتخـابی روش همبسـتگی و همچنـین ایـن متغیرهای انتخـابی بهتـر از کلیـه متغیرهـا (٥٢ متغیـر) بـازده سـهام را پـیش بینـی مـیکنـد، بـه سرمایه گذاران و سایر استفاده کنندگان پیشنهاد می شود که در پیش بینی بازده سهام ، مرحله انتخاب متغیرهای پیش بین را انجام دهند و صرفا بر اساس پـژوهش هـای گذشـته متغیرهـای پـیش بـین را انتخاب نکنند.