Abstract:
رشد سریع اطلاعات الکترونیکی در عصر حاضر، زمینهساز ایجاد انواع متعدد شبکههای کتابشناختی گردیده است. دستیابی به اطلاعات الکترونیکی مستلزم استفاده از روش موثر در نمایهسازی و تشخیص کلیدواژههای مهم بیانگر محتوای یک مدرک است. در همین راستا، (او.سی.ال.سی)1 که بزرگترین شبکه کتابشناختی جهان محسوب میشود به منظور فراهم آوردن تسهیلات لازم برای دستیابی سریع وموثر به اطلاعات، اقدام به ساخت سیستمنمایهسازی خودتحت عنوان وورد اسمیت نموده است. مبنای کار این سیستم، تشخیص خودکار مفاهیم، کلمات و عبارات کلیدی در متن ماشینخوان، براساس »پردازش زبان طبیعی« است. به این ترتیب شبکه (او.سی.ال.سی) با استفاده از تئوریهای زبانشناسی محاسباتی و معنائی-که مورد تأکید پردازش زبان طبیعی است-و نیز با بکارگیری تئوریهای اطلاعرسانی و مدلهای آماری، سعی در ساخت نمایهای داشته است که علاوه بر همخوانی با حجم عظیم دادههای این شبکه، از کارآئی و توانائی کافی و لازم در بازیابی سریع و موثر اطلاعات از محیط شبکه نیز برخوردار باشد.
The rapid growth of electronic information in the present age has resulted in creating various types of bibliographic networks. Accessing electronic information requires applying effective ways to identify and organic the important clues to the content of a document. Therefore OCLC as the best known and most huge bibliographic network in the world, has created an indexing system known as Wordsmith to provide facilities for rapid and effective access to information. This systems major activity is to distinguish concepts, words and key phrases in machine-readable text on the basis of natural language processing. In order to accomplish this activity, Wordsmith is taking advantage of computational and semantic linguistic .theories-that is emphasized in natural language processing. It also uses information science theories and statistical models to implement its mission.