چکیده:
امروزه، استفاده از هستیشناسی برای مقاصد گوناگونی در حال گسترش است. اما، در مواقعی به خاطر تفاوتهایی که در ساخت هستیشناسی در مراکز مختلف وجود دارد، امکان تبادل دانش بین دو هستیشناسی میسر نیست. برای حل این مشکل، روشهای مختلفی برای انطباق هستیشناسی ارائه شده است که برخی از آنها مبتنی بر فنون یادگیری ماشین است. انطباق هستیشناسی یا به عبارت دیگر تشخیص مفاهیم متناظر در هستیشناسیهای مختلف دارای کاربردهای متنوعی است. در این مقاله، یک روش جدید ارائه شده است که با بهره گیری از یادگیری ماشین و نیز پیکرههای متنی به عنوان منبع دانش از شباهتهای معنایی بین هستیشناسیها جهت انطباق استفاده میکند.
The aim of ontology matching is to find similarities or matches between concepts of different ontologies. There are many new applications which need a sort of ontology matching. Some examples comprises of semantic web applications, multi agent systems, applications mash up and so on. One may be interested in either finding lexical similarity or semantic similarity, but in the both cases, the result of such a matching process can be useful for relating distinct ontologies. Leveraging ontology matching system enables us to reuse existing ontologies in new applications and save costs by eliminating the need for developing new ontologies. Among current algorithms proposed for matching onologies applying machine learning techniques is a promising one. However, there are some problems regarding the results of these methods which are mainly due to poor features used in learning process.
In this paper we propose a new method in which a text corpus is used as the source of knowledge in conjunction with a machine learning method to find matching between two ontologies .The main objective in this new method is to find similarity of two concepts based on similarity of their instances. We show how contextual knowledge hidden in domain specific documents can help us to boost the machine learning methods by providing enough features. Also we show how taking benefit from this knowledge transcends the current approaches merely detect lexical similarity by either recognizing semantic similarity of concepts.
خلاصه ماشینی:
دراين مقاله ،يک روش جديـد ارائـه شده است که با بهره گيري ازيادگيري ماشين و نيزپيکره هـاي متنـي بـه عنـوان منبع دانش از شباهت هاي معنايي بـين هسـتي شناسـي هـا جهـت انطبـاق اسـتفاده ميکند.
در روش پيشنهادي سوو گولا،پيکـره متنـي بـه صـورت دسـتي سـاخته شـده اسـت ،در حالي که در مقاله حاضر اين پيکره با استفاده از موتور جستجوي بـرخـط ١و بـا کمتـرين دخالـت انساني ساخته شده است .
در هر دو روش از فرمول جاکارد براي محاسبه شباهت اسـتفاده شـده است ، اما در مقاله حاضر از يادگيري ماشين ، به منظور سنجش دقيق تر شـباهت دو مفهـوم اسـتفاده شده است که اين روش به ما کمک ميکند با در نظـر گـرفتن شـباهت مفهـومي موجـود بـين دو مفهوم فقط بر اساس شباهت ظاهري تصميم نگيريم .
همچنين ، فرض بر اين است که مقدار شباهت بـين دو مفهـوم A و B از دو هستيشناسي مختلف به ميزان اشتراک نمونه هاي دو مفهوم مـرتبط اسـت .
پياده سازي و نتايج در اين مقاله ، آزمايش ها بر روي دو هستيشناسي (هستي شناسـي هـاي شـماره ١٠١و٣٠٤) از منـابع ارائـه شـده در کنفـرانس سـالانه Ontology Alignment Initiative Evaluation( OAIE١)انجـام شـده اسـت .
819 (رجوع شود به تصویر صفحه) در اين مقاله ، ميزان شباهت حاصل از فرمول جاکـارد بـه عنـوان ميـزان دقـت رابطـه اسـتفاده شده است .
Hu et al)، (Xu, Wang, and Cheng 2010)،and Caci 2010(,Cruz, Stroe ) ،Noessner and Niepert 2010() (Jean-Mary, Shironoshita, and Kabuka 2010)،Shvaiko, Euzenat and Giunchiglia() ٢٠١٠، ،(٢٠١٠ and Reynaud,Hamdi, Safar ) ارائه شده است .