خلاصة:
امروزه دستخط به عنوان یک زیستسنج رفتاری شناخته شده و مورد قبول است. همراه با گسترش این مقبولیت سوء استفاده ازآن نیز گسترش یافته است. در این مقاله روشی برای تشخیص برونخط جعل دستخط فارسی در حالت غیر وابسته به متن ارائه شده است. این روش مبتنی بر استخراج دو بافت متراکم از حروف پایه و جزییات نوشته میباشد. پس از دودویی کردن و استخراج اسکلت نوشته و اعمال متوالی فیلتر گابور و تدریج فاز محلی بردار ویژگی نمونهها استخراج و در نهایت با استفاده از دستهبندی یک کلاسه و تنها با وجود نمونههای مثبت دادهها دستهبندی شده وجعلی بودن یا نبودن آنها بررسی میشود. استفاده از ترکیب این دو توصیفگر برای دادگان فارسی برای اولین بار در این مقاله به کار گرفته شده است. از آنجا که هیچ مجموعه داده مناسبی در زبان فارسی برای این منظور وجود نداشت، یک مجموعه داده از 62 نویسنده با دو نمونه نوشته جمعآوری شد. در نمونه اول از نویسندگان درخواست شد که متنی را بازنویسی کنند و در نمونه دوم از آنها خواسته شد درباره یک تصویر مطلبی بنویسند. برای تولید نمونههای جعلی از هنرجویان ممتاز خط خواسته شد که نمونه دوم را تقلید کنند تا برای هر نویسنده سه مورد نمونه جعل تولید شود. نتایج آزمایشها رضایتبخش بوده و با دقت بیش از 84 درصد کیفیت روش پیشنهادی را نشان میدهد.
Nowadays handwriting is known and accepted as a behavioral biometric. Handwriting-based authentication has become a hot topic of research as a result of increasing handwriting forgery. In this research an offline text-independent method for detection of forgeries in Persian handwritten documents is presented. The proposed approach is based on extracting two dense textures of basic alphabet and some text details. A one class classification (OCC) with only positive (original) samples is used in classification together with Binarization and Skeletonization in the preprocessing phase. Also, a combination of Gabor filter and LPQ descriptor is used to complete the feature vector. Both descriptors have been used for writer identification and verification in English and Persian but this is the first time that the combination of these two is used on a Persian handwriting. We also introduce a new dataset from 62 individuals with 2 pages per each. In the first instance the writers were instructed to copy a preset text and in the second one they were asked to write at least 6 lines about a picture. These instances were to be used as training and testing samples respectively. In order to generate counterfeit samples, we asked 5 qualified calligraphers to duplicate the second sample of each writer. Three forgeries per writer were generated in this way. Tests results are satisfactory and present more than 84% accuracy, demonstrating the quality of the proposed method.
ملخص الجهاز:
در این مقاله روشی برای تشخیص برونخط جعل دستخط فارسی در حالت غیر وابسته به متن ارائه شده است.
پس از دودویی کردن و استخراج اسکلت نوشته و اعمال متوالی فیلتر گابور و تدریج فاز محلی بردار ویژگی نمونهها استخراج و در نهایت با استفاده از دستهبندی یک کلاسه و تنها با وجود نمونههای مثبت دادهها دستهبندی شده وجعلی بودن یا نبودن آنها بررسی میشود.
در [8-7] از فیلتر گابور به منظور استخراج بردار ویژگی دستخط، پس از کمی کاهش فاصله خطوط از توصیفگر گابور و چند ویژگی استخراجی از آن مانند گشتاورهای گابور برای تشخیص و تأیید نویسنده بهصورت غیر وابسته به متن استفاده شده است.
(رجوع شود به تصوير صفحه)الف) خروجی روش افکنش بر روی متن با وجود شیب (رجوع شود به تصوير صفحه)شکل (2): خروجی روشهای متفاوت استخراج خطوط نوشته در این پژوهش برای استخراج خط روشی بیان میشود که با الهام از [14] اجرا شده است و بدون نیاز به حد آستانه با دقت بسیار بالایی خطوط نوشته را از متون استخراج میکند.
(رجوع شود به تصوير صفحه) شکل (13): منحنی مشخصه عملکرد سیستم برای بافت پایه استخراج شده از مجموعه داده جعل دستخط فارسی (رجوع شود به تصوير صفحه)به شکل مشابه در شکل (14) مشاهده میشود: - نتیجه اعمال فیلتر گابور به تنهایی بر روی بافت اجزا مساحت بیشتری از بافت پایه کلمات را نشان میدهد اما همچنان کمترین مقدار را در بین دیگر منحنیها دارد.
جدول (7): تاثیر آستانه پذیرش بر روی دقت تشخیص در مجموعه داده جعل دستخط فارسی (رجوع شود به تصوير صفحه) 5- نتیجهگیری روش ترکیبی این مقاله نیز برای اولین بار برای دادگان فارسی به کار رفته است.