چکیده:
پایگاه اطلاعاتی «گنج» پژوهشگاه علوم و فناوری اطلاعات با برخورداری از نزدیک به یک میلیون رکورد علمی امکان جستوجو در پایاننامهها، نشریات علمی داخلی، مقالات، همایشها، طرحهای پژوهشی وگزارشهای دولتی را فراهم میکند. روزانه تعداد زیادی از پژوهشگران نیازهای منابع علمی و پژوهشی خود را از پایگاه «گنج» تأمین میکنند. نیازها و رفتارهای کاربران مختلف این پایگاه متنوع بوده و شناخت دقیقتر آن موجب خواهد شد که مدیران این پایگاه بتوانند استراتژیهای متناسب با هر یک از گروههای کاربران را بهمنظور مدیریت بهتر پایگاه و ارائه خدمات کاراتر اتخاذ نمایند. یکی از راههای شناخت کاربران، خوشهبندی آنها و شناخت ویژگیهای هر خوشه است. هدف این پژوهش، خوشهبندی کاربران بر اساس تحلیل رفتار جستوجوی آنها با استفاده از مدل LRFM است. در این پژوهش، دادههای لاگ جستوجوی کاربران پایگاه «گنج» به مدت سه ماه جمعآوری و مورد استفاده قرار گرفت. با استفاده از دادههای لاگ رفتار جستوجوی کاربران، شاخصهای مدل LRFM محاسبه و سپس، الگوریتم K-means بر روی آنها اعمال و تعداد خوشه بهینه بر اساس معیارهای مختلف محاسبه شد. نتایج بهدستآمده از خوشهبندی بر اساس ماتریس ارزش مشتری، کاربران را در چهار گروه بهرهمند مشکوک، نامطمئن و متناوب قرار میدهد و بر اساس ماتریس وفاداری، کاربران در چهار گروه وفادار، بالقوه، نامطمئن و تازهوارد ارزیابی میشوند.
Iran scientific information database (Ganj) which includes almost one million scientific records provides the search opportunity in dissertations, domestic scientific journals, articles, conferences, research projects, and governmental reports. A large number of researchers meet the needs of their scientific and research resources from Ganj database daily. Users’ needs and behaviors are variant and understanding it helps system administrators to use different strategies to manage the better databases and provide efficient services to users. One way to understand users’ needs is to cluster them based on their behavior and identify the features of each cluster. This study aims to cluster the users based on the analysis of their search behavior using the LRFM model. In this study, the search log data of Ganj users were collected for three months, the LRFM attributes were calculated, and then the K-means algorithm was applied to them. The optimal number of clusters was calculated based on different criteria. Based on customer value matrix the results of customer clustering users in four groups are efficient, suspicious, unreliable, and intermittent and based on customer loyalty Marcus users are categorized in loyal, potential, insecure and newcomers.