خلاصة:
مقدمه: ویژگیهای خاصّ دستوری و نگارشی زبان و خط فارسی، دشواریهایی را در ذخیره و بازیابی اطلاعات در محیط رایانهای پدید آورده است. رسمالخط فارسی نیز از یکسو به علت اختلاف نظر پدیدآورندگان متون و از سوی دیگر پیچیدگیهای ذاتی خود، بههنگام ذخیره، جستجو و بازیابی چالشهای متعددی را برای طراحان و نمایهسازان پایگاهها، کاربران و پدیدآورندگان منابع بهوجود آورده است.روش بررسی: این پژوهش به روش تحلیل محتوا انجام شد.100 عنوان از پایاننامههای موجود رشته کتابداری و اطلاعرسانی به منزله نمونهای از متون فارسی در پایگاههای اطلاعاتی پژوهشگاههای علوم و فناوری اطلاعات ایران و مرکز منطقهای اطلاعرسانی علوم و فناوری و از هر پایگاه 50 عنوان بهصورت تصادفی انتخاب شد. با استفاده از دستور خط فارسی مصوب فرهنگستان زبان، کلماتی که درست یا نادرست نوشته شده بود، از یکدیگر تفکیک و در مرحله بعد، عنوانهای مورد نظر در هر دو پایگاه و با حالتهای متفاوت کلمات مرکب، جستجو گردید و در نهایت، نتایج بازیابی در پایگاهها، ارزیابی و مقایسه شد.یافتهها: نتایج این بررسی نشان داد 2/71% از کلمات عنوانها به صورت درست و 8/28% نادرست نگارش شدهاند. همچنین، مشخص شد 6/51% این کلمات، دو جزئی و 5/47% سه جزئی هستند و اغلب نویسندگان پایاننامهها، در مورد نحوة نگارش کلماتی که 2 جزئی و مشتق میباشند، دچار خطا شدهاند. در پایگاه اطلاعاتی مرکز منطقهای اطلاعرسانی علوم و فناوری، تنها حالت ثبت شده عنوانها به بازیابی عنوان مورد نظر انجامید و در پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران، تنها 58% عنوانها با تغییر رسمالخط همچنان بازیابی شدند.نتیجهگیری: این پژوهش نشان داد پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران نسبت به پایگاه اطلاعاتی مرکز منطقهای اطلاعرسانی علوم و فناوری، در بازیابی عنوان پایان نامهها در حالتهای مختلف پیوسته
Introduction: Persian language and script، due to the special features of grammar and writing، create difficulties in information storage and retrieval. Because of the different approaches to writing and because of its inherent complexity. Persain script has created enormous challenges for database designers، indexers، and end-users.
Methods: This study was conducted using content analysis technique. 100 dissertations were randomly selected as the samples of scholarly Persian texts in the field of LIS in the Iranian Research Institute for Information Science and Technology (IRANDOC) and the Regional Information Center for Science & Technology (RICeST) . Using the Style manual adopted by the Academy of Persian Language، words that had been separated were analyzed to identify if the separations were true or false. Next، the items in both databases with different formats were searched and finally، the results were evaluated and compared.
Results: The results showed that 70.20 percent of items are correctly written. Also، it was found that 51.6o percent of these words were two-part and 47.50 percent were three-part words and most writers were confused about writing words that are two-part and derivative. In the RICeST database، titles were retrieved only with the exact format entered and in the IRANDOC database، only 58 percent of items were retrieved by changing the format of writing.
Conclusions: This study revealed that the IRANDOC database did better in retrieving titles with different variations of writing than RICeST. Paper recommends that thesis writers also need to use a unified national rules with particular emphasis on writing two-part and derivative words.
ملخص الجهاز:
با استفاده از دستور خط فارسی مصوب فرهنگستان زبان، کلماتی که درست یا نادرست نوشته شده بود، از یکدیگر تفکیک و در مرحله بعد، عنوانهای مورد نظر در هر دو پایگاه و با حالتهای متفاوت کلمات مرکب، جستجو گردید و در نهایت، نتایج بازیابی در پایگاهها، ارزیابی و مقایسه شد.
در این جستار کوتاه سعی شده با نگاه به ویژگی پیوستهنویسی و جدانویسی واژگان فارسی در محدودة عنوانهای پایاننامههای کتابداری و اطلاعرسانی و بررسی این مشکل در دو پایگاه اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران و مرکز منطقهای اطلاعرسانی علوم و فناوری، وضعیت توجه نویسندگان و همچنین پایگاههای مورد نظر به این بخش از رسمالخط بررسی و راهکارهایی برای حل این مشکلات ارائه شود.
بیتوجهی کاربران (راثی، 1384)، پدیدآورندگان متون و منابع و نیز طراحان و نمایهسازان پایگاههای اطلاعاتی فارسی به ویژگیهای پیوستهنویسی و جدانویسی واژگان در کنار سایر مسائل رسمالخط فارسی، میتواند سبب بروز مشکلات زیادی در ذخیره و بازیابی اطلاعات شود.
پایگاههای اطلاعاتی پژوهشگاه علوم و فناوری اطلاعات ایران و مرکز منطقهای اطلاعرسانی علوم و فناوری با توجه به ویژگیهای پیوستهنویسی و جدانویسی واژگان در عنوانهای پایاننامهها چگونه عمل میکنند؟ طرح پژوهش در این پژوهش که به روش تحلیل محتوا انجام شده است، 100 عنوان از پایاننامههای موجود رشته کتابداری و اطلاعرسانی به منزلة نمونهای از متون فارسی در پایگاههای موردنظر و از هر پایگاه 50 عنوان بهصورت تصادفی انتخاب شد.