چکیده:
آربیتراژ آماری، استراتژی رایج سرمایهگذاری در بازارهای ناکاراست که نسبت به بازار خنثی بوده و بدون نیاز به سرمایه اولیه از هر دو جهت بازار کسب سود میکند. این تحقیق برآن است تا ضمن طراحی مدلهای مناسب برای آربیتراژ آماری سهام با استفاده از الگوریتم شبکههای عصبی عمیق، جنگلهای تصادفی، درخت با شیب تقویت شده و ترکیب ساده این مدلها، به تحلیل و بررسی بازده و ریسک مدلهای طراحی شده بپردازد. بدین منظور از اطلاعات همه شرکتهای عضو بورس اوراق بهادار تهران از 1385 تا 1396 برای ایجاد سیگنالهای معاملاتی استفاده شده است. طراحی مدلهای تحقیق و کدنویسیهای مربوطه و همچنین آزمون فرضیات تحقیق که با t-test مورد تحلیل قرار گرفته در نرمافزار R انجام شده است. یافتههای تحقیق نشاندهنده آن است که بیشترین مقدار بازده 24/4 درصد در هر روز برای k=5 است (بدون هزینه معاملات) که متعلق به مدل ترکیبی ساده (ENS) است. همچنین کمترین میزان ارزش در معرض ریسک (45/4%-) و کمترین مقدار ریزش مورد انتظار(57/5%-) برای k=20 متعلق به مدل شبکه عصبی عمیق(DNN) و بالاترین مقدار نسبت بازده به انحراف معیار 072/1 است که متعلق به مدل RAF به ازاءk=20 میباشد. علاوه برآن نتایج تحقیق نشان میدهند بازدههای اخیر سهم قدرت پیشبینیکنندگی بالاتری در مقایسه با بازدههای قبلتر دارند.
Statistical arbitrage is a common investing strategy in inefficient markets which is market neutral and profits from both sides of the market without the need for initial capital. This research aims at designing suitable models for stock statistical arbitrage using deep neural network, random forest, gradient-boosted trees and equal-weighted ensemble of these methods whilst analyzes the returns and risks of the designed models. For this purpose, the information of all listed companies in Tehran Stock Exchange from 1385 until 1396 has been used to generate trading signals. The design of the research models and required coding also the testing of the research hypotheses which is analyzed by t-test were performed in R software. The research findings show that the highest daily return is 4.24% for k = 5 (prior transaction costs) which is for the simple equal-weighted ensemble (ENS). Also deep neural network (DNN) has the lowest value at risk (- 4.45%) and the lowest expected shortfall (- 5.57%) for k = 20. The highest value of the return to standard deviation ratio is 1.072 which belongs to the RAF model for k = 20. Moreover, research results show that recent returns have higher predictive power than previous returns.
خلاصه ماشینی:
پژوهش هاي نوين در تصميم گيري دوره ٤، شماره ٣، پاييز ١٣٩٨ طراحي مدل براي آربيتراژ آماري سهام با استفاده از شبکه هاي عصبي عميق ، جنگل هاي تصادفي و درخت هاي با شيب تقويت شده فروزان کمري ١، عليرضا سارنج ٢*،رضا تهراني ٣، ميثم شهبازي ٢ ١-دانشجوي دکتري، گروه مديريت صنعتي و مالي ، دانشکده مديريت و حسابداري، پـرديس فارابي، دانشگاه تهران، قم ، ايران.
ايـن تحقيـق برآن است تا ضمن طراحي مـدلهـاي مناسـب بـراي آربيتـراژ آمـاري سـهام بـا اسـتفاده از الگوريتم شبکه هاي عصبي عميق ، جنگل هاي تصادفي، درخت با شيب تقويـت شـده و ترکيـب ساده اين مدلها،به تحليل و بررسي بازده و ريسک مدلهـاي طراحـي شـده بپـردازد.
ir پژوهش هاي نوين در تصميم گيري __________________________________دوره ٤، شماره ٣، پاييز١٣٩٨ مورد انتظار (٥/٥٧%-) براي ٢٠=k متعلق به مدل شبکه عصبي عميق (DNN)و بالاترين مقدار نسبت بازده به انحراف معيار ١/٠٧٢است که متعلق بـه مـدل RAF بـه ازاي ٢٠=k مـيباشـد.
Self-financing پژوهش هاي نوين در تصميم گيري __________________________________دوره ٤، شماره ٣، پاييز١٣٩٨ براي طراحي مدلها از اطلاعات همه سهام فهرسـت شـده در بـورس اوراق بهـادار تهران استفاده شده است .
نظر به آنکه در اين تحقيق ٤مدل و براي هـر مـدل پرتفـويهـاي تشـکيل شـده در دسته هاي ١٠سهمي ، ٢٠سهمي و ٤٠سهمي قرار گرفته اند بنابراين ميتوان براي هـر مدل يک فرضيه اصلي و ٣فرضيه فرعي به صورت زير تعريف نمود: -فرضيات مدل شبکه هاي عصبي عميق (DNN) فرضيه اصلي ١-بين بازده پرتفوي حاصل از مـدل الگـوريتم شـبکه هـاي عصـبي عميق و بازده شاخص تفاوت معناداري وجود دارد.
"Statistical Arbitrage test in Tehran stock exchange", Quarterly journal of Economic policies and researches, No. 70.