Yıl: 2023 Cilt: 16 Sayı: 2 Sayfa Aralığı: 147 - 160 Metin Dili: Türkçe DOI: 10.54525/tbbmd.1235547 İndeks Tarihi: 06-12-2023

Yazılım Hata Tahmininde Farklı Alt Örnekleme ve Üst Örnekleme Yöntemlerinin Kıyaslanması

Öz:
Bilgisayarları ve makineleri çalıştırmak üzere belirli fonksiyonların işletilebilmesi için kullanılan komutlar bütünü yazılım olarak adlandırılmaktadır. Günümüzde birçok alanda yapılan faaliyetler ve kullanılan uygulamalar, içerisinde farklı algoritmalarla tasarlanmış yazılımlar barındırır. Bu yazılımların kusursuz ve ihtiyaçları karşılayacak şekilde olması büyük önem teşkil etmektedir. Yazılımın kalitesi, yazılımın içerisinde hata barındırmaması hem yazılımı geliştiren kişilerin hem de yazılımı kullanan son kullanıcıların önem verdiği konulardır. Yazılım hata tahmini doğası gereği dengesiz sınıf problemi içerir. Bu çalışmada, öncelikle dengesiz sınıf problemi çözülmeye çalışılmıştır. Bu doğrultuda, farklı alt örnekleme ve üst örnekleme yöntemleri, literatürde araştırmacıların kullanımına açık NASA’nın PROMISE veri deposundan alınan CM1, KC1, KC2, JM1 ve PC1 veri kümelerinin üzerinde uygulanmıştır. Yazılım hata tahmini aşamasında ise farklı sınıflandırma algoritmaları karşılaştırılarak her bir veri kümesi için en uygun algoritma belirlenmiştir. Deney sonuçlarında on farklı örnekleme yöntemi ile veri kümelerindeki dengesiz sınıf problemi giderilmiş; on üç farklı sınıflandırma algoritması ile sınıflandırma işlemi yapılmıştır. 0,92 oranında AUC ölçütü ile en iyi sınıflandırma sonucu PC1 veri kümesinde elde edilmiştir. Bu çalışma ile yazılım hata tahmininde örnekleme yöntemleri ve uygun sınıflandırıcılar ile hata tahmininin başarımının daha iyi olabileceği gösterilmiştir. Elde edilen sonuçlar, literatürde yapılan çalışmalar ile karşılaştırılarak önerilen yöntemin üstünlüğü ve etkinliği kanıtlanmıştır.
Anahtar Kelime: Yazılım hata tahmini Sınıf dengesizliği problemi Alt örnekleme yöntemleri Üst örnekleme yöntemleri Sınıflandırma

Comparison of Different Oversampling and Undersampling Methods in Software Defect Prediction

Öz:
The set of commands used to operate certain functions to operate computers and machines is called software. Today, activities and applications used in many fields contain software designed with different algorithms. It is of great importance that these softwares are perfect and in a way that meets the needs. The quality of the software and the absence of errors in the software are issues that both the developers of the software and the end users of the software attach importance to. Software defect prediction inherently involves an imbalanced class problem. In this study, first of all, the imbalanced class problem was tried to be solved. In this direction, different undersampling and oversampling methods were applied on the CM1, KC1, KC2, JM1 and PC1 datasets taken from NASA's PROMISE data repository, which is open to researchers in the literature. In the software defect prediction phase, different classification algorithms were compared and the most suitable algorithm was determined for each data set. In the experimental results, the imbalanced class problem in the datasets was resolved with ten different sampling methods; classification was done with thirteen different classification algorithms. With an AUC of 0.92, the best classification result was obtained in the PC1 dataset. With this study, it has been shown that the performance of defect prediction can be better with sampling methods and appropriate classifiers in software defect prediction. The results obtained were compared with the studies in the literature and the superiority and effectiveness of the proposed method were proven.
Anahtar Kelime: Software defect prediction Class imblance problem Oversampling methods Undersampling methods Classification

Belge Türü: Makale Makale Türü: Araştırma Makalesi Erişim Türü: Erişime Açık
APA ŞEN KAYA Ö, Bozkurt Keser S (2023). Yazılım Hata Tahmininde Farklı Alt Örnekleme ve Üst Örnekleme Yöntemlerinin Kıyaslanması. , 147 - 160. 10.54525/tbbmd.1235547
Chicago ŞEN KAYA Özge,Bozkurt Keser Sinem Yazılım Hata Tahmininde Farklı Alt Örnekleme ve Üst Örnekleme Yöntemlerinin Kıyaslanması. (2023): 147 - 160. 10.54525/tbbmd.1235547
MLA ŞEN KAYA Özge,Bozkurt Keser Sinem Yazılım Hata Tahmininde Farklı Alt Örnekleme ve Üst Örnekleme Yöntemlerinin Kıyaslanması. , 2023, ss.147 - 160. 10.54525/tbbmd.1235547
AMA ŞEN KAYA Ö,Bozkurt Keser S Yazılım Hata Tahmininde Farklı Alt Örnekleme ve Üst Örnekleme Yöntemlerinin Kıyaslanması. . 2023; 147 - 160. 10.54525/tbbmd.1235547
Vancouver ŞEN KAYA Ö,Bozkurt Keser S Yazılım Hata Tahmininde Farklı Alt Örnekleme ve Üst Örnekleme Yöntemlerinin Kıyaslanması. . 2023; 147 - 160. 10.54525/tbbmd.1235547
IEEE ŞEN KAYA Ö,Bozkurt Keser S "Yazılım Hata Tahmininde Farklı Alt Örnekleme ve Üst Örnekleme Yöntemlerinin Kıyaslanması." , ss.147 - 160, 2023. 10.54525/tbbmd.1235547
ISNAD ŞEN KAYA, Özge - Bozkurt Keser, Sinem. "Yazılım Hata Tahmininde Farklı Alt Örnekleme ve Üst Örnekleme Yöntemlerinin Kıyaslanması". (2023), 147-160. https://doi.org/10.54525/tbbmd.1235547
APA ŞEN KAYA Ö, Bozkurt Keser S (2023). Yazılım Hata Tahmininde Farklı Alt Örnekleme ve Üst Örnekleme Yöntemlerinin Kıyaslanması. TBV Bilgisayar Bilimleri ve Mühendisliği Dergisi, 16(2), 147 - 160. 10.54525/tbbmd.1235547
Chicago ŞEN KAYA Özge,Bozkurt Keser Sinem Yazılım Hata Tahmininde Farklı Alt Örnekleme ve Üst Örnekleme Yöntemlerinin Kıyaslanması. TBV Bilgisayar Bilimleri ve Mühendisliği Dergisi 16, no.2 (2023): 147 - 160. 10.54525/tbbmd.1235547
MLA ŞEN KAYA Özge,Bozkurt Keser Sinem Yazılım Hata Tahmininde Farklı Alt Örnekleme ve Üst Örnekleme Yöntemlerinin Kıyaslanması. TBV Bilgisayar Bilimleri ve Mühendisliği Dergisi, vol.16, no.2, 2023, ss.147 - 160. 10.54525/tbbmd.1235547
AMA ŞEN KAYA Ö,Bozkurt Keser S Yazılım Hata Tahmininde Farklı Alt Örnekleme ve Üst Örnekleme Yöntemlerinin Kıyaslanması. TBV Bilgisayar Bilimleri ve Mühendisliği Dergisi. 2023; 16(2): 147 - 160. 10.54525/tbbmd.1235547
Vancouver ŞEN KAYA Ö,Bozkurt Keser S Yazılım Hata Tahmininde Farklı Alt Örnekleme ve Üst Örnekleme Yöntemlerinin Kıyaslanması. TBV Bilgisayar Bilimleri ve Mühendisliği Dergisi. 2023; 16(2): 147 - 160. 10.54525/tbbmd.1235547
IEEE ŞEN KAYA Ö,Bozkurt Keser S "Yazılım Hata Tahmininde Farklı Alt Örnekleme ve Üst Örnekleme Yöntemlerinin Kıyaslanması." TBV Bilgisayar Bilimleri ve Mühendisliği Dergisi, 16, ss.147 - 160, 2023. 10.54525/tbbmd.1235547
ISNAD ŞEN KAYA, Özge - Bozkurt Keser, Sinem. "Yazılım Hata Tahmininde Farklı Alt Örnekleme ve Üst Örnekleme Yöntemlerinin Kıyaslanması". TBV Bilgisayar Bilimleri ve Mühendisliği Dergisi 16/2 (2023), 147-160. https://doi.org/10.54525/tbbmd.1235547