چکیده:
اطلاعات متنی در دنیا به دو نوع اصلی حقایق او احساسات تقسیمبندی میشوند [ 1،2،3]. حقایق عبارات واقعی راجع به
موجودیتها، رخدادها و خصوصیات آنها هستند. درحالی که احساسات عبارات ذهنی هستند که نظرات احساسی افراد.
عقاید و اندیشههای آنها را راجع به یک موجودیت. رخداد با خصوصیتی از آنها ارائه میکنند. این پژوهش, ازنظر فنی» پر
چالش و درعینحال در عمل بسیار پرکاربرد میباشد. یافتن اطلاعات احساسی در وب دستهبندی کردن و نظم دادن به آنها
کار آسانی نیست. چراکه ممکن است منابع و صفحات زیادی از نظرات با حجم بالا در اینترنت موجود باشد و رسیدن به
نظرات دلخواه در این صفحات طولانی, بافتن جملات موردنظر و خلاصهسازی و جمعبندی آنها کار هر خوانندهای نباشد
[۵،۶]. بنابراین ابزار خودکاری برای کشف و خلاصه کردن نظرات لازم است. تجزیهوتحلیل احساسات با کاوش نظرات ۳،
مفهومی در علم دادهکاوی است که با توجه به این نیاز پدید آمده است. در این مقاله ما به صورت کلی جهت پیش بینی آینده
راهکاری را با استفاده از LSTM که یک کلاس از شبکه های عصبی است. پیشنهاد می دهیم و سپس نتایج به دست آمده را
با روش های دیگر را مورد ارزیابی قرار می دهیم. به صورت جزئی قصد داریم تا تحلیل احساسات در سطح جمله را در مورد
نظرات مشتریان هتل انجام دهیم.
خلاصه ماشینی:
فرض می کنیم که این اسناد شناخته شده است که باید نظر داده شود و حاوی نظرات در مورد یک موجود واحد باشد (مثلاً خاص تلفن).
به طور کلی روش های تحلیل احساسات، به شکل زیر دسته بندی می شوند [8] : Text retrieval Text summarization Text classification Text clustering Text Mining Natural Language Processing Sentiment Analysis Opinion Mining Document Level Sentence Level Aspect Level Subjective Classification Unsupervised Learning Supervised Learning Semi-Supervised Learning 1- رویکرد یادگیری ماشین 2-رویکرد واژگانی 1 3- رویکرد نوین همانطور که قبلا در توضیحات ذکر شد، رویکرد یادگیری ماشین، شامل سه روش یادگیری نظارت شده ، یادگیری بدون ناظر و یادگیری نیمه نظارت شده است.
در این تحقیق قصد داریم با ترکیب دو روش Bi-LSTM و Convolution Neural Network ، تشخیصقطبیت متن را در مورد یک دیتاست به زبان فارسی که شامل نظرات مشتریان هتل درباره سطح کیفی خدمات می باشد، با روش تحلیل احساسات در سطح جمله انجام داده و میزان دقت نتایج پیش بینی بدست آمده را محاسبه کرده و با مقایسه نتایج حاصل با الگوریتم های پایه یادگیری ماشین میزان بهبود نتایج بدست آمدهمقایسه نماییم.
در این تحقیق تقسیم بندی دیتاست بر اساس سه دسته انجام گرفته است: دسته اول: داده آموزش که 70 درصد از داده اصلی را شامل می شود.
4-1- ابتدا باید عملیات تعیین قطبیت و تحلیل احساسات بر روی داده های پاکسازی شده را بر اساس الگوریتم های پایه SVM و NAÏVE BASE انجام داده تا بتوانیم معیاری جهت مقایسه نتایج به دست آمده در این تحقیق با نتایج به دست آمده در روش های پایه یادگیری ماشین داشته باشیم.