چکیده:
امروزه محققان با حجم وسیعی از داده مواجهاند که بخش زیادی از آنها ساختار پردازشپذیری ندارند. دو مورد از چالشهای اصلی در این زمینه بالا بودن ابعاد فضای ویژگی و حجیم بودن دادههای در دسترس است. بهمنظور رفع این چالشها، مقالۀ پیش رو یک روش انتخاب ویژگی مبتنی بر ویژگیهای هدف ارائه کرده است که در کاهش ابعاد فضای ویژگی تأثیر زیادی دارد و همچنین برای مقابله با حجم بسیار زیاد نمونههای آموزش، با استفاده از روشهای انتخاب نمونۀ اولیه، به ویرایش مجموعۀ آموزش میپردازد. روش پیشنهادی در این مقاله در سه فاز اجرا شده است که هر فاز بهبودیافتۀ فاز قبل است و علاوهبر دستیافتن به نتایج مناسب در هر فاز، در پایان فاز سوم روش پیشنهادی بیشترین کارایی را بهدست آورد. برای ارزیابی کارایی روش پیشنهادی، این روش با یکی از الگوریتمهای موفق در زمینۀ پیشبینی بازار مقایسه شد که با وجود کاهش نمونههای آموزش توسط الگوریتمهای انتخاب نمونۀ اولیه، به نتایج بسیار بهتری نسبت به آن الگوریتم دست یافت.
خلاصه ماشینی:
به منظور رفع اين چالش ها، مقالـة پـيش رو يـک روش انتخاب ويژگي مبتني بر ويژگي هاي هدف ارائه کرده است که در کاهش ابعـاد فضـاي ويژگـي تأثير زيادي دارد و همچنين براي مقابله با حجم بسيار زياد نمونه هـاي آمـوزش ، بـا اسـتفاده از روش هاي انتخاب نمونة اوليه ، به ويرايش مجموعة آموزش مي پردازد.
براي ارزيابي کارايي روش پيشـنهادي ، ايـن روش بـا يکـي از الگـوريتم هـاي موفـق در زمينـة پيش بيني بازار مقايسه شد که با وجود کاهش نمونه هاي آموزش توسط الگـوريتم هـاي انتخـاب نمونة اوليه ، به نتايج بسيار بهتري نسبت به آن الگوريتم دست يافت .
همان طور که مشاهده مي شود، در فاز دوم هدف اسـتفاده از الگـوريتم K- نزديک ترين همسايه به منظور طبقه بندي اسناد است ؛ اما اين طبقه بند با مشکلاتي از جمله ، ميزان حافظة مصرفي زياد و حساس بودن به داده هاي نويز مواجه اسـت (گارسـيا، دراک ، کـانو و هـررا، ٢٠١٢).
بنـابراين در ايـن پـژوهش بـا اعمـال روش انتخـاب ويژگـي مناسب بر اساس ويژگي هاي نمونه هاي هدف و ويرايش مجموعة آمـوزش از طريـق روش هـاي انتخاب نمونة اوليه ، راه حلي به منظور استفاده از تيترهاي خبري در پيش بيني روند بازار ارز فارکس (مطالعة موردي : ارز يورو) ارائه شده است .
Text opinion mining to analyze news for stock market prediction.
Text mining of news-headlines for FOREX market prediction: A Multi-layer Dimension Reduction Algorithm with semantics and sentiment.
Text mining approaches for stock market prediction.
Using Training Set Selection Methods to Improve Text Mining on Market Prediction via News Headlines.
Fundamentals of predictive text mining: Springer Science & Business Media.