Yıl: 2023 Cilt: 38 Sayı: 3 Sayfa Aralığı: 1781 - 1792 Metin Dili: Türkçe DOI: 10.17341/gazimmfd.994289 İndeks Tarihi: 23-03-2023

Görüntü tabanlı özelliklerden ve makine öğrenmesi yöntemlerinden faydalanılarak kötücül yazılım tespiti

Öz:
Android cihazların hayatın içinde daha çok yer alması kötü amaçlı yazılımların da hedefi haline gelmesine sebep olmuştur. Kötü amaçlı yazılımların tespit edilmesi ve bu yazılımlardan doğacak kayıpların ve zararların önlenmesi önem arz etmektedir. Bu amaçla kötü amaçlı yazılım tespitine yönelik çeşitli çalışmalar yapılmaktadır. Son zamanlarda görüntüye dayalı yöntemler ve makine öğrenmesi çal ışmaları ön plana çıkmaktadır. Bu çalışmalarda statik ve dinamik analizde kullanılan ikili dosyalar görüntü dosyalarına çevrilmektedir. Görüntülerden çıkarılan global ve yerel özellikler çeşitli makine öğrenmesi metotları ile sınıflandırılmaktadır. Bu çalışmada malimg veri seti üzerinde global özellikler çıkarılarak (2000, 532) boyunda bir özellik matrisi elde edilmiştir. Elde edilen bu özellikler makine öğrenme yöntemleri (LR, LDA, K-NN, CART, RF, NB, SVM) kullanılarak s ınıflandırılmıştır. Sonuçlar K-kat çaprazlama doğrulama yöntemi değerlendirilerek K-NN ile %96,72 RF ile en yüksek %97,44 doğruluk oranı elde edilmiştir. Bu çalışma aynı veri seti üzerinde yapılan diğer çalışmalarla kıyaslandığında daha yüksek bir doğruluk değerine ulaşarak literatüre katkı sağlamaktadır.
Anahtar Kelime: Kötü amaçlı yazılım görüntü işleme özellik çıkarılması makine öğrenmesi

Malware Detection Using Image-Based Features and Machine Learning Methods

Öz:
As Android devices occupy more of people's lives, they have also become a target of malicious software. It is important to detect malicious software and to prevent the losses and damages that may arise from this software. For this purpose, various studies are being carried out about malware detection. Recently, image- based methods and machine learning studies have come to the fore. In these studies, binary files used in static and dynamic analysis are converted into image files. Global and local fe atures extracted from the images are classified by various machine learning methods. In this study, global features were extracted on the malimg dataset and a feature matrix (2000, 532) long was obtained. The obtained features were classified using machine learning methods (LR, LDA, K-NN, CART, RF, NB, SVM). The results were evaluated using the K-fold crossover validation method, and a highest accuracy rate of 96.72% was obtained with K-NN and 97.44% with RF. This study contributes to the literature by reaching a higher accuracy value compared to other studies on the same data set.
Anahtar Kelime: Malware image processing feature extraction machine learning

Belge Türü: Makale Makale Türü: Araştırma Makalesi Erişim Türü: Erişime Açık
  • 1. Sağıroğlu Ş., Bulut H., An Analysıs of Informatıon and Telecommunication Security in Mobile Environments, Journal of the Faculty of Engineering and Architecture of Gazi University, 24 (3),499- 507, 2009.
  • 2. Cook S., Malware statistics and facts for 2021, Comparitech, https://www.comparitech.com/antivirus/malware-statistics- facts/,Güncelleme Tarihi Şubat 12. 2021, Erişim Tarihi Nisan 20.2021.
  • 3. Mitsuhashi R., Shinagawa T., High-Accuracy Malware Classification with a Malware-Optimized Deep Learning Model, https://arxiv.org/pdf/2004.05258.pdf, Erişim Tarihi Kasım 15.2021.
  • 4. Aygör D., Aktan E., The limitations of signature-based and dynamic analysis methods in detecting malwares: A case study, Journal of the Faculty of Engineering and Architecture of Gazi University, 37 (1), 305-315, 2022.
  • 5. Makandar A., Patrot A., Malware class recognition using image processing techniques. In 2017 International Conference on Data Management, Analytics and Innovation (ICDMAI), 76-80, 2017.
  • 6. Yue S., Imbalanced malware images classification: a cnn based approach, 2017. https://arxiv.org/abs/1708.08042, Erişim Tarihi Eylül 10.2021
  • 7. Yajamanam S., Selvin V. R. S., Troia F. D. and Stamp M., Deep Learning versus Gist Descriptors for Image-based Malware Classification, In Proceedings of the 4th International Conference on Information Systems Security and Privacy (ICISSP 2018), Funchal- Madeira-Portuga, 553-561, 22-24 Ocak, 2018.
  • 8. Cui Z., Xue F., Cai X., Cao Y., Wang G., Chen J., Detection of malicious code variants based on deep learning, IEEE Trans. Ind. Informatics, 14 (7), 3187-3196, Jul 2018.
  • 9. Bhodia N., Prajapati P., Troia F. D. and Stamp M., Transfer Learning for Image-Based Malware Classification, https://arxiv.org/abs/1903.11551,Yayınlanma Tarihi Ocak 21. 2019, Erişim Tarihi Nisan 22.2021.
  • 10. Ünver H. M., Bakour K., Android malware detection based on image based features and machine learning techniques, SN Applied Sciences (2020) 2, 1299.2020, https://doi.org/10.1007/s42452-020- 3132-2
  • 11. Bakour K., Ünver., H. M., VisDroid: Android malware classification based on local and global image features, bag of visual words and machine learning techniques, Neural Computing and Applications (2021) 33, 3133–3153, 2021.
  • 12. Bakour K., Ünver H.M., DeepVisDroid: android malware detection by hybridizing image-based features with deep learning techniques, Neural Computing and Applications,2021.
  • 13. Venkatraman S., Alazab M., Vinayakumar R., A hybrid deep learning image-based analysis for effective malware detection, Journal of Information Security and Applications 47 (2019) 377–389, 2019.
  • 14. Yuan B., Wang J., Liu D., Guo W., Wu P., Bao X., Byte-level malware classification based on markov images and deep learning, Computers & Security 92 (101740), 2020.
  • 15. Iadarola G., Martinelli F., Mercaldo F. and Santone A., Image-based Malware Family Detection: An Assessment between Feature Extraction and Classification Techniques, In Proceedings of the 5th International Conference on Internet of Things, Big Data and Security (IoTBDS 2020), Online Streaming, 499-506, 2020.
  • 16. Naeem H., Ullah F., Naeem M., Khalid S. vd., Malware detection in industrial internet of things based on hybrid image visualization and deep learning model, Ad Hoc Networks 105 (102154), 2020.
  • 17. Angelo G. D., Ficco M., Palmieri F., Malware detection in mobile environments based on Autoencoders and API-images, Journal of Parallel and Distributed Computing 137, 26–33, 2020.
  • 18. Kabakuş A. T., Doğru İ. A., Çetin A., APK Denetçisi: İzin Tabanlı Android Kötü Amaçlı Yazılım Algılama Sistemi, Digital Investigation 13, 1-14, 2015.
  • 19. Arslan R. S., AndroAnalyzer: android malicious software detection based on deep learning, Peerj Computer Scıence, 2021
  • 20. Anonim, Makine Öğrenmesi Nedir?, Microsoft.,https://azure.microsoft.com/tr-tr/overview/what-is-machine- learning-platform/, Erişim Tarihi Temmuz 05. 2021.
  • 21. SamuelA. L., Some Studies in Machine Learning Using the Game of Checkers. IBM Journal of Research and Development, 3 (3), 210-229, 1959. CiteSeerX 10.1.1.368.2254 $2. doi:10.1147/rd.33.0210, Erişim Tarihi Temmuz 03.2021.
  • 22. Nilsson N., Learning Machines, McGraw Hill, 1965.
  • 23. Duda R. and Hart P., Pattern Recognition and Scene Analysis, Wiley Interscience, 1973.
  • 24. Bozinovski S., Teaching space: A representation concept for adaptive pattern classification, University of Massachusetts at Amherst, Computer and Information Science Department. MA., COINS Technical Report No. 81-28.1981, https://web.cs.umass.edu/publication/docs/1981/UM-CS-1981-028.pdf
  • 25. Alpaydın E., Introduction to Machine Learning, Londra: The MIT Press. s. 8. ISBN 978-0-262-01243-0, 2010.
  • 26. Kutlugün M.A., Gözetimli makine öğrenmesi yoluyla türe göre metinden ses sentezleme İstanbul Sabahattin Zaim Üniversitesi, Fen Bilimleri Enstitüsü, YL, 2017.
  • 27. Çalışkan E., Makine Öğrenmesinde Gözetimli ve Gözetimsiz Öğrenme, Databulls, Erişim tarihi Temmuz 04. 2021.
  • 28. Koptur M., Gözetimsiz Öğrenme (K-Merkezli Öbekleme), Makine Öğrenimi, Yayınlanma tarihi 2017, Erişim tarihi Temmuz, 2021.
  • 29. Malık Z. M. M., Al-Shehabı S., Dökeroğlu T., Gözetimsiz Makine Öğrenme Teknikleri ile Miktara Dayalı Negatif Birliktelik Kural Madenciliği, Düzce Üniversitesi Bilim ve Teknoloji Dergisi, 6 (2018) 1119-1138, 2018.
  • 30. Bektaş O., Uçuş Aşamalarının Bölümlendirilmesi: Havacılık Verilerinde Gözetimsiz Öğrenme Uygulaması, AKU J. Sci. Eng, 20 (6),1178-1186, 2020.
  • 31. Bölük N., Uçar Ö., İnner A. B., Mobil Robotlarda Navigasyon Problemi için Pekiştirmeli Öğrenme, Türkiye Robotbilim Konferansı 2019, İstanbul,40-44, 26- 29 Haziran 2019.
  • 32. Başarır G., Çok Değişkenli Verilerde Ayrımsama Sorunu ve Lojistik Regresyon Analizi, Hacettepe Üniversitesi, Uygulamalı istatistik doktora tezi, 1-36, Ankara, 1990.
  • 33. Mohaisen A., Alrawi O., Mohaisen M., AMAL: high-fidelity. behavior- based automated malware analysis and classification, Comput, Secur, 52, 251-256, 2015.
  • 34. Taşcı E., Onan A., K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi, https://ab.org.tr/ab16/bildiri/102.pdf, Erişim Tarihi Temuz 14.2021.
  • 35. Mitchell T., Machine Learning, McGraw Hill, New York, 1997.
  • 36. Han J. and Kamber M., Data mining: concepts and techniques, Morgan Kaufmann Publishers, Burlington, 2006.
  • 37. Nagano Y., Static analysis with paragraph vector for malware detection, IMCOM '17: Proceedings of the 11th International Conference on Ubiquitous Information Management and Communication January, Japan-Beppu, 80, 1–7, 2017.
  • 38. Huda S., Miah S., Hassan M.M., Islam R., Yearwood J., Alrubaian M., Almogren A., Defending unknown attacks on cyber-physical systems by semisupervised approach and available unlabeled data, Inform, Sci, 379, 211–228, 2017.
  • 39. Sahs J. And Khan L., A machine learning approach to android malware detection, In: 2012 European intelligence and security informatics conference (EISIC), Denmark-Odense, 141–7, 22-24 Ağustos, 2012.
  • 40. Milosevic N., Dehghantanha A., Choo K.K. R., Machine learning aided Android malware classification, Computers and Electrical Engineering,61 (2017), 266–274, 2017.
  • 41. Mira F., Brown A., Huang W., Novel malware detection methods by using LCS and LCSS, in: 2016 22nd International Conference on Automation and Computing, ICAC 2016: Tackling the New Challenges in Automation and Computing,U.K-Colchester, 554–559, 07-08 Semtember, 2016.
  • 42. Damodaran A., Troia F.D., Visaggio C.A., Austin T.H., Stamp M., A comparison of static, dynamic and hybrid analysis for malware detection, J. Comput, Virol, Hacking Tech, 13 (1), 1–24, 2017.
  • 43. Markel Z., Bilzor M., Building a machine learning classifier for malware detection, in: 2014 Second Workshop on Anti-malware Testing Research (WATeR), 1-4, 2014.
  • 44. Utku A., Doğru İ.A., Permission based detection system for android malware, Journal of the Faculty of Engineering and Architecture of Gazi University, 32 (4), 1015-1024, 2017.
APA GÜNGÖR A, Dogru I, BARIŞÇI N, TOKLU S (2023). Görüntü tabanlı özelliklerden ve makine öğrenmesi yöntemlerinden faydalanılarak kötücül yazılım tespiti. , 1781 - 1792. 10.17341/gazimmfd.994289
Chicago GÜNGÖR Aslıhan,Dogru Ibrahım Alper,BARIŞÇI Necaattin,TOKLU Sinan Görüntü tabanlı özelliklerden ve makine öğrenmesi yöntemlerinden faydalanılarak kötücül yazılım tespiti. (2023): 1781 - 1792. 10.17341/gazimmfd.994289
MLA GÜNGÖR Aslıhan,Dogru Ibrahım Alper,BARIŞÇI Necaattin,TOKLU Sinan Görüntü tabanlı özelliklerden ve makine öğrenmesi yöntemlerinden faydalanılarak kötücül yazılım tespiti. , 2023, ss.1781 - 1792. 10.17341/gazimmfd.994289
AMA GÜNGÖR A,Dogru I,BARIŞÇI N,TOKLU S Görüntü tabanlı özelliklerden ve makine öğrenmesi yöntemlerinden faydalanılarak kötücül yazılım tespiti. . 2023; 1781 - 1792. 10.17341/gazimmfd.994289
Vancouver GÜNGÖR A,Dogru I,BARIŞÇI N,TOKLU S Görüntü tabanlı özelliklerden ve makine öğrenmesi yöntemlerinden faydalanılarak kötücül yazılım tespiti. . 2023; 1781 - 1792. 10.17341/gazimmfd.994289
IEEE GÜNGÖR A,Dogru I,BARIŞÇI N,TOKLU S "Görüntü tabanlı özelliklerden ve makine öğrenmesi yöntemlerinden faydalanılarak kötücül yazılım tespiti." , ss.1781 - 1792, 2023. 10.17341/gazimmfd.994289
ISNAD GÜNGÖR, Aslıhan vd. "Görüntü tabanlı özelliklerden ve makine öğrenmesi yöntemlerinden faydalanılarak kötücül yazılım tespiti". (2023), 1781-1792. https://doi.org/10.17341/gazimmfd.994289
APA GÜNGÖR A, Dogru I, BARIŞÇI N, TOKLU S (2023). Görüntü tabanlı özelliklerden ve makine öğrenmesi yöntemlerinden faydalanılarak kötücül yazılım tespiti. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 38(3), 1781 - 1792. 10.17341/gazimmfd.994289
Chicago GÜNGÖR Aslıhan,Dogru Ibrahım Alper,BARIŞÇI Necaattin,TOKLU Sinan Görüntü tabanlı özelliklerden ve makine öğrenmesi yöntemlerinden faydalanılarak kötücül yazılım tespiti. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 38, no.3 (2023): 1781 - 1792. 10.17341/gazimmfd.994289
MLA GÜNGÖR Aslıhan,Dogru Ibrahım Alper,BARIŞÇI Necaattin,TOKLU Sinan Görüntü tabanlı özelliklerden ve makine öğrenmesi yöntemlerinden faydalanılarak kötücül yazılım tespiti. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, vol.38, no.3, 2023, ss.1781 - 1792. 10.17341/gazimmfd.994289
AMA GÜNGÖR A,Dogru I,BARIŞÇI N,TOKLU S Görüntü tabanlı özelliklerden ve makine öğrenmesi yöntemlerinden faydalanılarak kötücül yazılım tespiti. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi. 2023; 38(3): 1781 - 1792. 10.17341/gazimmfd.994289
Vancouver GÜNGÖR A,Dogru I,BARIŞÇI N,TOKLU S Görüntü tabanlı özelliklerden ve makine öğrenmesi yöntemlerinden faydalanılarak kötücül yazılım tespiti. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi. 2023; 38(3): 1781 - 1792. 10.17341/gazimmfd.994289
IEEE GÜNGÖR A,Dogru I,BARIŞÇI N,TOKLU S "Görüntü tabanlı özelliklerden ve makine öğrenmesi yöntemlerinden faydalanılarak kötücül yazılım tespiti." Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 38, ss.1781 - 1792, 2023. 10.17341/gazimmfd.994289
ISNAD GÜNGÖR, Aslıhan vd. "Görüntü tabanlı özelliklerden ve makine öğrenmesi yöntemlerinden faydalanılarak kötücül yazılım tespiti". Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 38/3 (2023), 1781-1792. https://doi.org/10.17341/gazimmfd.994289