چکیده:
هدف: روشهای مدلسازی موضوعات احتمالاتی متشکل از مجموعهای از الگوریتمهایی است که هدف اصلی آنها کشف ساختار پنهان موضوعی در حجم وسیعی از اسناد است. هدف از انجام این پژوهش مدلسازی موضوعی مقالات پژوهشگران ایرانی در حوزه غدد درونریز و متابولیسم در پایگاه استنادی وب علوم است.
روششناسی: پژوهش حاضر از نوع کاربردی است که با روش متنکاوی و تحلیل محتوا به انجام رسیده است. در این پژوهش کلیه دادههای مورد نیاز، از پایگاه استنادی وب علوم با استفاده از کلیدواژههای ثبتشده در سرعنوان موضوعی پزشکی بدون محدودیت زمانی تا 15 آبان 97 بازیابی شدند. سپس با استفاده از الگوریتم تخصیص پنهان دریکله مجموعه اسناد در محیط متلب تجزیه و تحلیل شدند.
یافتهها: دستههای موضوعی بهصورت دستههایی از 20 واژه و در 10 دسته موضوعی استخراج شدند. سپس توسط فوقتخصصان غدد دستههای موضوعی بر اساس ارتباط آنها به موضوعات مختلف حوزه غدد درونریز و متابولیسم نامگذاری شدند و به هر دسته عنوان موضوعی اختصاص یافت.
نتیجهگیری: نتایج بیانگر این است که اجرای مدل تخصیص پنهان دریکله عملکرد قابل قبولی در ارائه دستههای موضوعات حوزه غدد داشته است. دستههای موضوعی استخراجشده دارای تجانس و ارتباط موضوعی خوبی با یکدیگر هستند.
Purpose: Probabilistic topic modeling methods consist of a set of algorithms whose main purpose is to discover the hidden subject structure in a large volume of documents. The purpose of this study is to thematically model the articles of Iranian researchers in the field of endocrinology and metabolism in the citation database of Web of Science. Methodology: The present research is of applied type and has been done by text mining and content analysis method. In this study, all required data were retrieved from the Web of Science Citation Database using the keywords registered in the medical subject heading without a time limit until November 6, 2018. Then, using a hidden allocation algorithm, the whole set of documents in MATLAB was analyzed. Findings: Subject categories were extracted as groups of 20 words in 10 subject categories. Then, by endocrinologists, the subject categories were named based on their relationship to various topics in the field of endocrinology and metabolism, and each category was assigned a subject title. Conclustion: The results indicate that the implementation of the latent Dirichlet allocation model has an acceptable performance in presenting the categories of endocrinology and metabolism. The extracted subject categories have good homogeneity and thematic relevance with each other.
خلاصه ماشینی:
com چکيده هدف : روش هاي مدل سازي موضوعات احتمـالاتي متشـکل از مجموعـه اي از الگـوريتم هـايي است که هدف اصلي آنها کشف ساختار پنهان موضوعي در حجم وسيعي از اسناد اسـت .
هـدف از انجام اين پژوهش مدل سازي موضوعي مقالات پژوهشگران ايراني در حوزه غدد درون ريـز و متابوليسم در پايگاه استنادي وب علوم است .
نتيجه گيري: نتايج بيانگر اين است که اجراي مدل تخصيص پنهان دريکله عملکرد قابل قبولي در ارائه دسته هاي موضوعات حوزه غدد داشته است .
اين الگوريتم هـا بـر اساس روش هاي آماري اي هستند که کلمات موجود در متن را تحليل کرده ، بدون نياز به فرض اوليه از آنها و دخالت انساني موضوعات را استخراج مي کنند و سازمان دهي آرشيوهاي الکترونيکي را در ابعـاد بسـيار وسـيع کـه تخصـيص موضوع به صورت دستي در آنها امکان پذير نيست ممکن مي کنند (شکرچيان ، ١٣٩٥).
يکي از بهترين روش هاي بررسي توليدات علمي يک کشور تحليل و بررسي مقالات علمي است و با درنظرگرفتن هدف اصلي مدل سازي موضوعي که نمايش الگوهاي پنهان موجود در اسناد متني بدون دخالت انسـان اسـت در ايـن پژوهش بر آنيم تا به اين سؤال پاسخ دهيم "آيـا توزيـع موضـوعات حـوزه غـدد درون ريـز و متابوليسـم در مقـالات پژوهشگران ايراني متناسب با جايگاه اين رشته در کشور است ؟" سؤال هاي پژوهش ١.
با توجه بررسيهايي که توسط پژوهشگران اين مقاله انجام شد پژوهشي تاکنون به بررسي مقالات حوزه غدد درون ريز و متابوليسم نپرداخته است و از نرم افزار متلب با توجه بـه دقـت بـالا و همچنـين وجود بسته ابزاري مخصوص مدل سازي موضوعي استفاده نشده است .