چکیده:
«متنکاوی» به فرایند رایانشی تحلیل متون بدون ساختار و استخراج لایههای زبانی پنهان و مضامین موجود در آنها گفته میشود. این روش، اهمیت ویژهای در تحلیل محتوا یا مضمون پژوهشهای توصیفی و تفسیری دارد. در این فرایند، نخست متون ساده ساختارمند شده وسپس مفاهیم و انگارههای نهفتۀ آن خلاصهسازی، طبقهبندی، مدلسازی، ارزیابی و تفسیر میشوند. نظر به اینکه این روش بهویژه در مطالعات گفتمان بهمنزلۀ یک نوآوری میانرشتهای بهشمار میآید، سزاوار است استفاده از آن در مطالعات دانشگاهی کشور با جدیت بیشتری دنبال شود. معالوصف، بهرغم گستردگی کمی و کیفی پژوهشهای بینالمللی در این حوزه، جای خالی این پژوهشها در مقالات فارسی و انگلیسی داخل کشور بسیار احساس میشود. از اینرو، این مقاله در نظر دارد از رهگذر کنکاش نظری و عملی روشهای متنکاوی و ارزیابی ابزارها و روشهای اصلی آن در زبان فارسی و انگلیسی، بستری مناسب برای بهرهمندی از ظرفیتهای این روششناسی در مطالعات زبانی فراهم سازد.
‘Text mining’ refers to the computational process of unstructured text analytics for extracting latent linguistic layers and themes. It is especially significant as content or thematic analysis in descriptive and interpretive studies. This process begins with structuring simple texts and proceeds with summarizing, classifiing, modelling, evaluating and interpreting the inherent textual concepts and patterns. Given that this method counts as an interdisciplinary innovation especially in discoursal studies, it is to be pursued more intensively in national academic studies. Yet, despite the multitude of English studies in this area, there has been little interest to date in text mining amongst Iranian researchers as evidenced by the critically limited number of local Persian and English studies. Thus looking into the theory and practice of text mining and its major analytic tools and methods in Persian and English, this paper aims to prepare the ground for utilizing this methodology in language studies.