Abstract:
با پیشرفت فناوری و فنون اطلاعات و ارتباطات در قرن اخیر، اهمیت دسترسی به
اطلاعات صحیح و جامع روز به روز بیشتر میشود طبق آمارهای موجود، روزانه حدود 7
میلیون صفحه جدید به فضای شبکه جهانی اضافه میشود.باتوجه به حجم اطلاعات موجود در
اینترنت، و ناهمگن بودن اطلاعات، لزوم به کارگیری روشهای خودکار در نمایهسازی و
بارزیابی دقیق اطلاعات بیشتر احساس میشود. کاربران پرسشهای خود را به نظامهای
بازیابی اطلاعات(موتورهای کاوش) ارائه میدهند و جواب نظام، باید مرتبط با پرسش
کاربر باشد، ولی به دلیل حجم اطلاعات موجود در وب و نبود قالب مشخص که ساختار
معنایی مدارک را حفظ نماید، دقت موتورهای کاوش کم میشود.ساختار ایکس.ام.ال 1 قالب مناسبی برای حفظ ساختار معنایی مدارک در سطح وب
است.این قالب علاوه بر حفظ ساختار معنایی، دارای امکاناتی برای ساخت نمایش وبی
مدارک در مرور گرهاست.موتورهای کاوش دقت بیشتر و کارآیی بالاتری را در جستجوی مدارک در قالب
ایکس.ام.ال از خود نشان میدهند.جستجو گرهای مدارک ایکس.ام.ال به سه دسته تقسیم
میشوند:جستجو گرهایی براساس پایگاه دادهها، جستجو گرهایی مدارک ایکس.ام.ال.
Machine summary:
"کاربران پرسشهای خود را به نظامهای بازیابی اطلاعات(موتورهای کاوش) ارائه میدهند و جواب نظام، باید مرتبط با پرسش کاربر باشد، ولی به دلیل حجم اطلاعات موجود در وب و نبود قالب مشخص که ساختار معنایی مدارک را حفظ نماید، دقت موتورهای کاوش کم میشود.
همانطور که در مثال 1-2 مشاهده میشود، در این قالببندی علاوه بر مشخص شدن قالب نمایشی وبی مقاله(برای مثال عنوان مقاله بزرگتر از متن مقاله است و در وسط تراز میگردد)، نوع مدرک(مقاله بودن با بر چسب ELCITRA )و همچنی اجزای آن به تفکیک مشخص شده است.
ال این قابلیت وجود دارد که علاوه بر تعریف دادهها، ساختار آن را نیز بیان کنیم، به عبارت دیگر، یک سری قواعد معنایی 3 برای بر چسبها تعریف میشود، تا علاوه بر نمایش ظاهری ساختار، شکل صحیح به کارگیری آن را نیز مشخص کند.
در روش ترکیبی ابتدا مدارک با کمک روشهای بازیابی اطلاعات، نمایهسازی میشود، و در ذخیره اطلاعات و همچنین پرسشهایی که باید به نظام داده شود، از پایگاه دادهها استفاده میشود.
مزیت اینروش آن است که با سرعت بالا میتواند پایگاههایی را که باید جستجو شوند، مشخص میکند و بیان درخواست و پرسش کاربر با زبان استاندارد پایگاه دادهها، باعث کارآیی بهتر نظام بازیابی از نظر زمان و فضای دیسک میشود، برای مثال dniFZYX نظامیست که با دریافت مدارک ایکس.
روش سوم، ترکیب روش اول و دوم است، بنابر این علاوه بر حفظ ساختار معنایی دادهها، جامعیت دادهها و رابطه میان آنها، کارآیی نظام نیز در سطح قابل قبولی قرار دارد."