چکیده:
این مقاله با استفاده از یادگیری تقویتی عمیق مدلی ارائه میکند تا وظایف یک معاملهگر در بازار بورس ایران را با توجه به سهمهای نقد شونده مدلسازی کند. قیمت سهام به همراه اندیکاتورهای مبتنی بر آن بهعنوان ورودی به شبکه عصبی کانولوشن وارد میشوند. سپس، با استفاده از اندیکاتورهای محاسبه شده، دادههای قیمت بر اساس تاریخ تطبیق داده میشود. به منظور محاسبه میزان تطبیق خروجی محاسبه شده با خروجی مورد انتظار، از تابع هزینهی مجموع مربعات خظا استفاده میشود که در فرایند بهینهسازی کمینه میشود. همچنین با بهکارگیری مدلهای کانولوشن به جای جداول Q از بیش برارزش مدل به دلیل وجود دادههای کم برای آموزش مدل جلوگیری به عمل آمده است. از طرفی با استفاده از اطلاعات موجود در حجم معاملات، از این سیگنال به عنوان نقشی مکمل در پیشبینی روند آینده سهمها بهره گرفته شده است. و برای ارزیابی، برتری این مدل نسبت به استراتژی خرید و نگهداری مقایسه شده است.
Nowadays, the stock market plays an important role in the economy of different countries. The abundance of data in the stock market and the need for fast and correct data processing and making appropriate decisions have made the use of computers inevitable. In this article, using deep reinforcement learning, a model is designed to present the duties of a trader in the Iranian stock market with regard to liquidated shares. In the first step, the history of stock prices along with the indicators based on it are given as inputs to the convolutional neural network. In the next step, in order to calculate the matching rate of the convolution output with the expected output, the sum of squared error cost function is used, which, in turn, is minimized in the optimization process. Since the data in the Iranian stock market is limited, using the convolution model instead of the Q table in the deep reinforcement model prevents the over fitting of the model. In order to evaluate the model, the data of Tehran Stock Exchange was used in the period of 1390 to 1400. The performance of the proposed method was compared with the buy and hold strategy. The results show, in some cases, the profit from the proposed method in contrast with buy and hold strategy is 21% and -7%, respectively.
خلاصه ماشینی:
در اين مقاله با استفاده از يادگيري تقويتي عميق مدلي ارائه شده است تا وظايف يک معامله گر در بورس ايران را با توجه به سهم هاي نقد شونده مدل سازي کند.
پس هدف اين است که در بازاري مانند ايران که شرايطي کمابيش متفاوت با ساير کشورها دارد، با استفاده از يادگيري تقويتي عميق ، پيش بينيهاي لازم براي خريد و يا فروش از سهم هاي نقد شونده انجام پذيرد.
بر اين اساس در اين پژوهش ٢٩ سهام نقد شونده مورد بررسي قرار ميگيرد که با توجه به رابطه (١) محاسبه ميشود که در اين رابطه T تعداد روز، V ارزش کل معاملات براي هر نماد در روز t و ௧ݎ بازگشت سرمايه در روز t ميباشد[٢٤]: (به تصویر صفحه مراجعه شود) ٣-٢- آلفا و انديکاتورهاي مورد استفاده مهندسي ويژگي ها يکي از عناصر مهم براي پيش بيني موفقيت آميز روند تغييرات بازار بورس است .
ميانگين متحرک نمايي نيز در حجم استفاده 1 Average True Range (ATR) 3 Simple moving average (SMA) 2 Moving average 4 Exponential moving average شده و در سري قيمت ௧ܲ با پنجره اي به طول N، در زمان t، به صورت بازگشتي و ميانگين وزني قيمت کنوني و آخرين قيمت پيشين به گونه اي محاسبه ميشود که هر نقطه داده در پنجره به ميزان مساوي وزن دارد[٢٥]: (به تصویر صفحه مراجعه شود) ٣-٦- انديکاتور مکدي انديکاتور مکدي ١ «واگرايي» و «همگرايي» ميانگين متحرک قيمت را نمايش ميدهد که شامل دو ميانگين متحرک نمايي به نام هاي ” خط مکدي” و ”خط سيگنال ” ميباشد.