چکیده:
هستیشناسیها ابزار بیان رسمی مفاهیم و روابط موجود در قلمرویی خاص هستند. در سالهای اخیر تلاشهای زیادی برای طراحی روشهای یادگیری و خودکارسازی فرایند ساخت هستیشناسی انجام گرفته است. از آنجا که هستیشناسی را مجموعه مفاهیم و روابط آن میدانیم، استخراج مفاهیم و روابط معنایی میان این مفاهیم از اهمیت بسیاری برخوردار است. ساخت انواع هستیشناسی برای انواع قلمروها و کاربردهای گوناگون، فرایندی پرهزینه و زمانبر بوده و خودکارسازی این فرایند گام مهمی در رفع آن است. فقدان دانش پایه مانند اصطلاحنامهها یا پایگاههای دانش حوزهها، اکتساب دانش برای ساخت هستیشناسی آن حوزهها را مشکل خواهد کرد. در این پژوهش روشی نیمهخودکار برای اکتساب دانش در حوزه علمسنجی ایران ارائه شده که قادر است اطلاعات این حوزه را استخراج کرده و در فرایندی، دانش موجود را برای ساخت هستیشناسی آن پردازش کند. بدینمنظور، ابتدا اسناد مرتبط با حوزه مورد نظر گردآوری شده و به روش متنکاوی، نمایهسازی خودکار گردید. سپس، در مرحله بعدی با استفاده از روش C-value مفاهیم اصلی استخراج شد. آنگاه اسناد مربوطه با استفاده از روش خوشهبندی k-means، خوشهبندی شدند و برای هر خوشه با محاسبه وزن مفاهیم، بر اساس روش TF-IDF مفاهیم کلیدی مناسب استخراج گردید. در پایان، با استفاده از روش تحلیل همرخدادی واژگان، سلسلهمراتب مفاهیم حوزه استخراج شده و هستیشناسی مربوطه ساخته شد. نتایج بهدست آمده نشان میدهد که این روش در مقایسه با روشهای مشابه دقت بسیاری در یادگیری ساخت هستیشناسی داشته است.
Ontology is one of formal concepts and the relations in the specific regions.It have recently tried to design the learning, automatic methods of Ontology. Whereas Ontology containing concepts and the relations, exploiting concepts, the semantic relations among concept. The various Ontology of regions and different applications are expensive processes that are automatic.The lack of main knowledge such as terminology, the database of knowledge, gaining knowledge of Ontology will make problem in different fields.The present study tries to gain knowledge in the science-logy of Iran due to semi-automatic method that exploit the knowledge of Ontology, therefore, at first, the documents of Domain were collected by digging-text method, automaticfeature, then, it was in the next step that C-value method of main concepts were exploited, they were branched by documents of k-means method due to TF-IDF, key concepts were exploited.Finally due to co-occurrence method of words, the hierarchy of concepts were presented by comparing close, common methods in learning Ontology structure.
خلاصه ماشینی:
برگرفته از پايان نامۀ دکتري ؛ دانشگاه شهيد چمران اهواز185 چکيــده : اکتســاب دانــش در حــوزة علم ســنجي ايــران ارائــه شــده کــه قــادر اســت اطلاعــات ايــن حــوزه را اســتخراج کــرده و در فراينــدي ، دانــش موجــود را بــراي ســاخت هستي شناســي آن پــردازش کنــد.
بـا عنايـت بـه اين کـه لازمـۀ مديريـت هدفمنـد علـم و دانـش ، حصـول شـناخت و ارزيابـي مســتدلي از وضعيــت کنونــي يــک حــوزة علمــي اســت ، در پژوهــش حاضــر، مدلــي مفهومــي تحــت عنــوان «ســامانۀ نيمه خــودکار ســاخت هستي شناســي » ارائــه گرديــد تــا برون دادهــاي علمــي ايــن حــوزه به صــورت نيمه خــودکار اســتخراج و مــورد پــردازش قــرار گيــرد و از ايــن طريــق بــه درک صريحــي از جهــان آن بــا توصيــف و تشــريح مفاهيــم و روابــط ايــن حــوزه در ايــران پرداختــه و شــناخت بيشــتري حاصــل شــود.
بدين منظـور لازم اسـت هستي شناسـي آن در ايـن حـوزه طراحـي و ترسـيم شـود کـه دربرگيرنـدة مفاهيـم و ارتبـاط معنايـي ميـان آن هـا باشـد و در نهايـت ، به واسـطۀ آن ، درکـي از شـناخت حـوزة مــورد پژوهــش حاصــل شــود و به عنــوان يــک ســند راهبــردي در برنامه ريــزي ، سياســت گذاري ، آينده نگــري و آينده پژوهــي ايــن حــوزه از آن اســتفاده شــده و نيــز به عنــوان ابــزاري بــراي تحليـل و ترسـيم سـاختار دانـش سـاير حوزه هـا اسـتفاده شـود.
در ايــن مقالــه فراينــد جديــدي بــراي ســاخت هستي شناســي بــا اســتفاده از روش C-value، تحليــل هم رخــدادي واژگان ، روش وزن دهــي TF-IDF و خوشــه بندي اطلاعــات ارائــه شــده کــه قــادر اســت مفاهيــم مرتبــط در حــوزة دانــش مــورد نظــر را بــه کاربــران ارائــه دهــد.