Abstract:
افزایش روزبهروز بدافزارها یکی از مهمترین چالشهای امنیت و شبکههای ارتباطی است. نرمافزارهای مخرب از لحاظ مالی و جانی به افراد و سازمانها خسارت وارد میکنند. یکی از انواع برنامههای مخرب کرمها هستند که از طریق ایمیل، پیام، شبکه نظیر به نظیر و اینترنت بهصورت خودکار گسترش مییابند. لذا رفتارهای انتشاری موجود در کرمها ما را در تشخیص کرمها یاری خواهند کرد. در این راستا باید برنامههای سالم و مخرب در جعبه شنی اجرا گردند تا فراخوانیهای سیستمی که تعامل برنامه با سیستمعامل هستند، مورد نظارت قرار گیرد. با مشاهده دنباله فراخوانیهای سیستمی و استخراج فراخوانیهای مربوط به انتشار میتوان رفتار و ویژگیهای انتشاری را بهدست آورد. یک مجموعه از توابع سیستمی که بهعنوان رفتار انتشاری تعیین میگردد را میتوان بهعنوان ویژگیهای انتشاری تعریف کرد. لذا از این ویژگیها در تعیین خانوادههای کرمها استفاده شده است. دقت مطلوب 100% در تشخیص نشاندهنده این امر خواهد بود که رفتارهای انتشاری بهدرستی انتخابشدهاند. همچنین، جهت مقایسه، از الگوریتم آپریوری برای استخراج ویژگی استفاده شده است که توانسته خانوادههای کرمها را با دقت66/96% از هم متمایز کند.
Machine summary:
) جدول (7): دقت طبقهبندی دادهها و معیارها مطرحشده روش پیشنهادی بر اساس بانک اطلاعاتی بهدستآمده از ویژگیهای انتشاری استخراجشده بدون در نظر گرفتن برنامههای سالم (به تصویر صفحه مراجعه شود.
)دقت طبقهبندی دادهها و معیارها مطرحشده روش پیشنهادی بر اساس بانک اطلاعاتی بهدستآمده از تلفیق دودسته ویژگی انتشاری و آپریوری با در نظر گرفتن برنامههای سالم با استفاده از چهار الگوریتم Random Forest، J48، Naïve Bayes، IB1 در جدول (10) ارائهشده است.
دقت الگوریتمهای Random Forest، J48، Naïve Bayes، IB1 در تشخیص و آزمون کرمها، با در نظر گرفتن برنامههای سالم و بر اساس بانک اطلاعاتی بهدستآمده از تلفیق دودسته ویژگی انتشاری و آپریوری به ترتیب 100، 33/93، 33/83، 33/93 است.
دقت طبقهبندی دادهها و معیارها مطرحشده روش پیشنهادی بر اساس بانک اطلاعاتی بهدستآمده از تلفیق دودسته ویژگی انتشاری و آپریوری با استفاده از چهار الگوریتم Random Forest، J48، Naïve Bayes، IB1 بدون در نظر گرفتن برنامههای سالم در جدول (11) ارائه شده است.
دقت الگوریتمهای Random Forest، J48، Naïve Bayes، IB1 در تشخیص و آزمون کرمها بدون در نظر گرفتن برنامههای سالم و بر اساس بانک اطلاعاتی بهدستآمده از تلفیق دودسته ویژگی انتشاری و آپریوری به ترتیب 66/66، 66/66، 60/73 است.
جدول (10): دقت طبقهبندی دادهها و معیارها مطرحشده روش پیشنهادی بر اساس بانک اطلاعاتی بهدستآمده از تلفیق دودسته ویژگی انتشاری و آپریوری با در نظر گرفتن فایل سالم (به تصویر صفحه مراجعه شود.
)جدول (11): دقت طبقهبندی دادهها و معیارها مطرحشده روش پیشنهادی بر اساس بانک اطلاعاتی بهدستآمده از تلفیق دودسته ویژگی انتشاری و آپریوری بدون در نظر گرفتن فایل سالم (به تصویر صفحه مراجعه شود.