چکیده:
هر شبکه بات گروهی از میزبان هایی است که با کد بدخواه یکسانی آلوده شده و از طریق یک یا چند سرویس دهنده فرمان و کنترل توسط مهاجم یا مدیر بات هدایت می شوند. در شبکه های بات نسل جدید فهرست نام های دامنه سرویس دهنده های فرمان و کنترل به صورت پویا ایجاد می شود. این فهرست پویا که توسط یک الگوریتم تولید دامنه ایجاد می شود به مهاجم کمک می کند تا مکان سرویس دهنده های فرمان و کنترل خود را به صورت دوره ای تغییر داده و از قرار گرفتن آدرس های آن ها در فهرست های سیاه جلوگیری کند. هر میزبان آلوده با استفاده از یک الگوریتم از پیش تعریف شده، تعداد زیادی نام دامنه تولید کرده و با ارسال پرس وجوهای سرویس دهنده دامنه تلاش می کند آن ها را به آدرس های متناظرشان نگاشت کند. در این مقاله، از الگوریتم شبکه عصبی خود رمزگذار عمیق برای شناسایی دامنه هایی که هیچ گونه آگاهی از الگوریتم تولید آن ها وجود نداشته است، استفاده شده و عملکرد روش پیشنهادی با عملکرد الگوریتم های یادگیری ماشین مقایسه شده است. ابتدا مجموعه داده جدیدی از ترکیب یک مجموعه داده با دامنه های سالم و دو مجموعه داده حاوی دامنه های بدخواه و ناسالم ایجادشده و از دو سناریوی دستی و خودکار برای استخراج ویژگی های مجموعه داده جدید استفاده شده است. شبکه عصبی خود رمزگذار عمیق بر روی مجموعه داده جدید و پیش پردازش شده اعمال شده و نتایج در مقایسه با الگوریتم های یادگیری ماشین بررسی شده است. با توجه به نتایج به دست آمده، می توان با استفاده از شبکه عصبی خود رمزگذار عمیق، دامنه های بدخواه تولیدشده توسط الگوریتم های تولید دامنه را با سرعت بیشتر و نرخ صحت بیشتر از ۹۸.۶۱% شناسایی کرد.
Botnet is a group of hosts infected with the same malicious code and managed by an attacker or Botmaster through
one or more command and control (C&C) servers. The new generation of Botnets generates C&C domain name
server’s list dynamically. This dynamic list created by a domain generation algorithm helps an attacker to periodically
change its C&C servers and prevent their addresses from being blacklisted. Each infected host generates a large
number of domain names using a predefined algorithm and attempts to map them to their corresponding addresses by
sending queries to the domain server. In this paper, the deep autoencoder neural network is used to identify domains
without any knowledge of their generating algorithm, and the performance of the proposed method is compared with
the performance of machine learning algorithms. Initially, a new dataset is created by combining a data set with
normal domains and two datasets containing malicious and abnormal domains and both manual and automated
methods are used to extract the features of the new dataset. Deep autoencoder neural network is applied to new and
pre-processed datasets and the results are compared with machine learning algorithms. Based on the obtained results,
it is possible to identify the malicious domains generated by domain generating algorithms using the deep autoencoder
neural network with a higher speed and an accuracy rate larger than 98.61%.