چکیده:
امروزه بهدلیل هزینههای بالا، انجام آزمون جامع و کامل بر روی تمامی بخشهای نرمافزاری امکانپذیر نیست. اما اگر بخشهای مستعدخطا قبل از انجام آزمون شناسایی شوند، میتوان تمرکز اصلی آزمون را بر روی این بخشها قرار داد که منجر به صرفهجویی در هزینهها میشود. شناسایی بخشهای مستعدخطا، هدف اصلی پیشبینی خطا در نرمافزار است. یک مدل پیشبینیکننده، بخشهای نرمافزاری به همراه ویژگیهای آنها را به عنوان ورودی دریافت کرده و پیشبینی میکند که کدام یک از آنها مستعدخطا هستند. معمولا برای ساخت این مدلها از فنون یادگیری ماشین استفاده میشود که عملکرد این فنون، بسیار وابسته به مجموعه داده آموزشی است. مجمعه داده آموزشی معمولا دارای ویژگیهای نرمافزاری زیادی است که برخی از آنها نامرتبط و یا افزونه بوده و حذف این ویژگیها با استفاده از روشهای انتخاب ویژگی انجام میگردد. در این تحقیق، روش جدیدی برای انتخاب ویژگی مبتنی بر پوشش ارائه شده که از الگوریتم ممتیک، تکنیک جنگل تصادفی و معیار جدید مبتنی بر سیستم استنتاج فازی استفاده میکند. نتایج بررسی نشان میدهد که معیار ارزیابی فازی ارائه شده، عملکرد بهتری را نسبت به معیارهای موجود داشته و باعث بهبود کارایی انتخاب ویژگی میشود. هدف نهایی این تحقیق، رسیدن به یک مدل قدرتمند پیشبینیکننده خطاهای نرمافزاری با کارایی بالا بودهو نتایج مقایسه نشان میدهد که مدل ارائه شده، دارای عملکرد و کارایی بالاتری نسبت به دیگر مدلها است.
Today, due to high costs, it is not possible to perform a comprehensive and complete test on all parts of thesoftware. But if the fault-prone parts are identified before the test, the main focus of the test can be placedon these parts, which leads to cost savings. Identifying fault-prone components is the main purpose ofsoftware fault prediction. A predictive model receives software modules along with their features as inputand predicts which ones are prone to fault. Machine learning techniques are commonly used to constructthese models, the performance of which is highly dependent on the training dataset. Training datasetsusually have many software features, some of which are irrelevant or redundant, and the removal of thesefeatures is done using feature selection methods. In this research, a new method for wrapper-based featureselection is proposed that uses memetic algorithm, random forest technique and a new criterion based onfuzzy inference system. The results show that the proposed fuzzy evaluation criterion has a betterperformance than the existing criteria and improves the performance of feature selection. The final purposeof this research is to achieve a robust model for predicting high performance software faults and thecomparison results show that the proposed model has higher performance than other models.