خوشه‌بندی مقالات علمی بر پایۀ الگوریتم k_means مطالعۀ موردی: پایگاه پژوهشگاه علوم و فناوری اطلاعات ایران(ایرانداک) مقالة

مؤلف: سلیمانی نژاد، عادل ؛ سلاجقه، مژده ؛ طیبی، الهام ؛

پردازش و مدیریت اطلاعات زمستان 1397 - شماره 95 التصنيف الف (Ministry of Science/ISC (‎26 صفحة - من 871 إلی 896 )

الکلمات المفتاحية: خوشه بندی متن کاوی الگوریتم k-means معیار تابع فاصله اقلیدسی پایگاه ایرانداک Euclidean Distance Function Criterion Clustering text mining K means algorithm IRANDOC Database

fa en

خلاصة:

با رشد روزافزون منابع و مقالات در سطح وب، به‌کارگیری روش‌هایی سریع و ارزان برای دسترسی به متون مورد نظر از میان مجموعه وسیع این مستندات، اهمیت بیشتری می‌یابد. برای رسیدن به این هدف، به‌کارگیری تکنیک‌های متن‌کاوی، گامی ‌ارزشمند در جهت کشف دانش از مستندات متنی به شمار می‌رود. هدف اصلی این پژوهش خوشه‌بندی پایگاه «پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)» بر اساس فنون متن‌کاوی است تا مقالات موجود به چند خوشه تقسیم شوند؛ به‌طوری که مقالات خوشه‌های مختلف حداکثر تفاوت ممکن و مقالات موجود در هر خوشه بیشترین شباهت را با هم داشته باشند. مقالات حوزه‌های مرتبط با فناوری اطلاعات انتخاب شدند. بدین‌منظور، ابتدا تمام کلیدواژه‌های حوزه‌های فناوری اطلاعات بر اساس دفعات بسامد آن‌ها در مقالات پایگاه انتخاب و سپس، مقالات هر کلیدواژه از پایگاه «ایرانداک» استخراج گردید. آنگاه، با استفاده از نرم‌افزار notepad++ مجموعه داده مورد نظر ایجاد گردید. در این پژوهش برای انجام خوشه‌بندی از الگوریتم k_means و از معیار تابع فاصله اقلیدسی برای اندازه‌گیری تشابه خوشه‌ها استفاده گردید. سپس، نتایج حاصل از خوشه‌بندی مورد تجزیه و تحلیل قرار گرفت تا میزان شباهت و الگوی مناسب میان مقالات کشف شد. الگوی مورد نظر نشان داد که بیشترین میزان مشابهت میان مقالات دو خوشه داده‌کاوی و شبکه عصبی با فاصله اقلیدسی 365/1 وجود دارد و کمترین میزان شباهت میان مقالات دو خوشه بهینه‌سازی و پردازش تصویر با فاصله 387/1 گزارش شده است. دانش حاصل از پژوهش عبارت است از: خوشه‌بندی مقالات مرتبط با بیشترین و کمترین میزان مشابهت با یکدیگر، یافتن الگوی جدید جهت دسترسی سریع و آسان به مقالات مشابه، و کشف ارتباط پنهان میان موضوعات مختلف. این دانش به پژوهشگران کمک می‌کند که بتوانند مقالات موضوعی مرتبط با تخصص خود و مشابه با موضوع مورد مطالعه را به نحوی مطلوب‌تر شناسایی کنند.

استلام ملف الإرجاع :
(پژوهیار, , , )

تحميل
تحميل HTML

صفحة:

دخول / الاشتراک

تحتاج الدخول لعرض محتوى المقالة. إذا لم تكن عضوًا ، فتابع من الجزء الاشتراک.

دخول

الاشتراک

تحتاج دخول لعرض محتوى المقالة. إذا لم تكن عضوًا ، فتابع من الجزء الاشتراک.
إن كنت لا تقدر علی شراء الاشتراك عبرPayPal أو بطاقة VISA، الرجاء ارسال رقم هاتفك المحمول إلی مدير الموقع عبر webmaster@noormags.com .

You need Sign in to view the content of the article. If you are not a member, proceed from part Sign up.
If you fail to purchase subscription via PayPal or VISA Card, please send your mobile number to the Website Administrator via webmaster@noormags.com .

رابط قصير: