خلاصة:
در این مقاله قد داریم به بررسی تحلیلگر صرفی نور که برنامه هوشمند پردازش صرفی زبان عربی است، بپردازیم. این سامانه، کلمات عربی را حتی الامکان با استفاده از قواعد معتبر زبان عربی تجزیه و تحلیل می کند و در صورت نیاز با حداقل استفاده از بانکهای اطلاعاتی تعبیه شده در داخل سامانه، نتایج حاصل را به عنوان حالات معتبر مختلف صرفی برای هر کلمه ارائه می نماید. ورودی این برنامه، یک فایل متنی زبان عربی و خروجی آن نیز یک فایل از نوع ایکس. ام. ال م یباشد. از جمله قابلی تهای مهم این سامانه، توانایی تحلیل متون، اعم از با اعراب یا بدون اعراب است. قابلیت مهم دیگر، تحلیل و تجزیه یک کلمه به حالات مختلف پیشوندی، میانوندی و پسوندی معتبر است که هر کدام از این حالت ها، شامل مقادیر ممکن به ازای فیلدهای صرفی مختلف مثل: وزن، ریشه و سرواژه م یباشد. به دلیل مبتنی بودن بر قواعد صرفی، برنامه م یتواند انواع مختلف متون عربی با موضوعات گوناگون قرآنی، فقهی، سیاسی یا اجتماعی را با دقت بالایی تحلیل کند. به طور دقیق تر، این سامانه زیربنای پرداز شهای مورد نیاز، اعم از: تحلیل نحوی، معنایی،
خلاصه سازی و ترجمه ماشینی روی متون عربی را فراهم می نماید.
ملخص الجهاز:
این سامانه، کلمات عربی را حتیالامکان با استفاده از قواعد معتبر زبان عربی تجزیه و تحلیل میکند و در صورت نیاز با حداقل استفاده از بانکهای اطلاعاتی تعبیهشده در داخل سامانه، نتایج حاصل را به عنوان حالات معتبر مختلف صرفی برای هر کلمه ارائه مینماید.
قابلیت مهم دیگر، تحلیل و تجزیه یک کلمه به حالات مختلف پیشوندی، میانوندی و پسوندی معتبر است که هر کدام از این حالتها، شامل مقادیر ممکن به ازای فیلدهای صرفی مختلف مثل: وزن، ریشه و سرواژه میباشد.
طیف گستردهای از کلمات هستند که فرآیند شکلگیری ساختار و تولید آنها، به طور کامل از قواعد موجود در زبان پیروی میکند که اصطلاحاً به آنها «قیاسی» گفته میشود و به جهت وجود این ویژگی، عملیات شناسایی آنها کاملاً مقدور میباشد؛ اما بعضی دیگر از کلمات برای ساختهشدن از هیچ قاعده مشخصی تبعیت نمیکنند که بهاصطلاح به آنها «سماعی» گفته میشود.
در حوزه صامت میتوان به موارد زیر اشاره نمود: (رجوع شود به تصویر صفحه) تحلیلگر صرفی نور ورودی برنامه، یک فایل متنی (Txt) زبان عربی با مشخصه میباشدArabic Windows Encoding (cp1256) و خروجی نیز یک فایل Xml حاوی مشخصات صرفی هر کلمه است.
برای آشنایی بیشتر با ساختار خروجی، نمونهای از پاسخ «تحلیلگر صرفی نور» برای کلمه «فَسَأَلْتُمُونِيهَا» در زیر ارائه شده است: (رجوع شود به تصویر صفحه) مراحل مختلف برنامه هدف از قراردادن هر مرحله، مدیریت چالشی از چالشهای موجود بر سر راه تحلیل کلمات در زبان عربی است.
دلیل این امر نیز وجود رسمالخطهای مختلف همزه در زبان عربی است؛ زیرا ممکن است برای یک کلمه چندین رسمالخط معتبر و پذیرفتهشده وجود داشته باشد.