Yıl: 2023 Cilt: 38 Sayı: 1 Sayfa Aralığı: 451 - 460 Metin Dili: Türkçe DOI: 10.17341/gazimmfd.977127 İndeks Tarihi: 23-03-2023

Optimum parametreler yardımıyla performansı artırılmış KNN algoritması tabanlı kalp hastalığı tahmini

Öz:
Kalp hastalıkları ölüm oranı yüksek hastalıklar grubundadır. Hastalığın teşhisinde bugüne kadar klinik yöntemler ve makine öğrenmesi yöntemleri sıklıkla kullanılmıştır. Bu çalışmada teşhis için KNN algoritması kullanılmıştır. Algoritmanın performansını artırmak için parametre ayarlama yapılmış ve bu kapsamda; Manhattan, Euclidean ve Chebyshev uzaklık ölçümleri, Uniform ve Distance ağırlıklandırma yöntemleri ve 1...15 arasındaki komşu sayıları UCI Statlog ve Cleveland veri kümeleri üzerinde denenmiştir. Statlog veri kümesi için en yüksek sınıflandırma doğruluğu %67,90 olup bu değer komşu sayısı 5, uzaklık yöntemi Euclidian ve ağırlıklandırma Distance ile elde edilmiştir. Aynı veri seti üzerinde genetik algoritmalar da çalıştırılmış ve komşu sayısı 5, uzaklık yöntemi Euclidean ve ağırlıklandırma Distance için %88,88 doğruluk elde edilmiştir. Cleveland veri kümesi için elde edilen maksimum sınıflandırma doğruluğu optimizasyon öncesi %71,42 iken optimizasyon sonrası %90,11 olarak ölçülmüştür. Cleveland veri kümesi için en yüksek sınıflandırma doğruluğu veren parametreler ise; komşu sayısı 3, uzaklık yöntemi Manhattan ve ağırlıklandırma Uniform olmuştur.
Anahtar Kelime: Kalp hastalık teşhisi makine öğrenmesi K en yakın komşu sınıflayıcısı

Performance-enhanced KNN algorithm-based heart disease prediction with the help of optimum parameters

Öz:
Heart diseases are diseases with a high mortality rate. Clinical methods and machine learning methods have been used frequently in the diagnosis of the disease. In this study, the KNN algorithm was used for diagnosis. In order to increase the performance of the algorithm, parameter adjustment has been made and in this context; Manhattan, Euclidean and Chebyshev distance measurements, Uniform and Distance weighting methods and neighbor numbers between 1...15 have been tested on UCI Statlog and Cleveland datasets. The highest classification accuracy for the Statlog dataset is 67.90%, which is obtained with the number of neighbors = 5, the distance method = Euclidian, and the weighting = Distance. Genetic algorithms were also run on the same data set and 88.88% accuracy was obtained for the number of neighbors = 5, distance method = Euclidean and weighting = Distance. While the maximum classification accuracy obtained for the Cleveland dataset was 71.42% before optimization, it was measured as 90.11% after optimization. The parameters that give the highest classification accuracy for the Cleveland dataset are; number of neighbors = 3, distance method = Manhattan and weighting = Uniform.
Anahtar Kelime: Heart disease diagnosis machine learning K nearest neighbor classifier

Belge Türü: Makale Makale Türü: Araştırma Makalesi Erişim Türü: Erişime Açık
  • 1. İnternet: Heart Disease Facts, https://www.cdc.gov/heartdisease/facts.htm, 2019.
  • 2. Tripoliti E. E., Papadopoulos T. G., Karanasiou G. S., Naka K. K., Fotiadis D. I., Heart Failure: Diagnosis, Severity Estimation and Prediction of Adverse Events Through Machine Learning Techniques, Computational and Structural Biotechnology Journal, 15, 26-47, 2017.
  • 3. Solanki Y., A Survey on Risk Assessments of Heart Attack Using Data Mining Approaches, International Journal of Information Engineering and Electronic Business, 11 (4), 2019.
  • 4. Rajesh N., Manesha T, Hafeez S., Krishna H., Prediction of Heart Disease Using Machine Learning Algorithms, International Journal of Engineering & Technology, 7 (2.32), 363, 2018.
  • 5. Nashif S., Raihan M. R., Islam M. R., & Imam M. H., Heart Disease Detection by Using Machine Learning Algorithms and a Real-Time Cardiovascular Health Monitoring System, World Journal of Engineering and Technology, 6 (4), 2018.
  • 6. Karayilan T., Kilic O., Prediction of heart disease using neural network, International Conference on Computer Science and Engineering (UBMK), Antalya, 5-8 Ekim 2017.
  • 7. Atkov O. Y., Gorokhova S. G., Sboev A. G., Generozov E. V., Muraseyeva E. V., Moroshkina S. Y., Cherniy N. N., Coronary heart disease diagnosis by artificial neural networks including genetic polymorphisms and clinical parameters, Journal of Cardiology, 59 (2), 2012.
  • 8. Chitra R., Seenivasagam V., Knowledge Discovery from Heart Disease Dataset Using Optimized Neural Network, In: Prasath R., Kathirvalavakumar T. (eds) Mining Intelligence and Knowledge Exploration, Lecture Notes in Computer Science, 8284, Springer, Cham, 2013.
  • 9. Yazid M.A., Haikal S., Shukor T., Novi A., Artificial neural network parameter tuning framework for heart disease classification, Proc Electric Eng Comput Sci Inform, 5 (5), 674–679, 2018.
  • 10. Karakoyun M., Hacibeyoğlu M., Biyomedikal Veri Kümeleri İle Makine Öğrenmesi Sınıflandırma Algoritmalarının İstatistiksel Olarak Karşılaştırılması, Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi, 16 (48), 30-42, 2014.
  • 11. Mohan S., Chandrasegar T., Gautam S., Effective heart disease prediction using hybrid machine learning techniques, IEEE Access, 7, 81542–81554, 2019.
  • 12. Pawlovsky A. P., An ensemble based on distances for a kNN method for heart disease diagnosis, In: 2018 International conference on electronics, information, and communication (ICEIC), IEEE, 1–4, 2018.
  • 13. Shouman M., Turner T., Stocker R., Using data mining techniques in heart disease diagnosis and treatment, Japan-Egypt Conference on Electronics, Communications and Computers, 2012.
  • 14. Abushariah M. A. M., Alqudah A. A. M., Adwan O. Y., Yousef R. M. M., Automatic Heart Disease Diagnosis System Based on Artificial Neural Network (ANN) and Adaptive Neuro-Fuzzy Inference Systems (ANFIS) Approaches, Journal of Software Engineering and Applications, 7 (12), 1055–1064, 2014.
  • 15. Malav A., Kadam K., & Kamat P., Prediction of heart disease using k- means and artificial neural network as hybrid approach to improve accuracy, International Journal of Engineering and Technology, 9 (4), 3081–3085, 2017.
  • 16. Alzahani S. M., Althopity A., Alghamdi A., Alshehri B., Aljuaid S., An Overview of Data Mining Techniques Applied for Heart Disease Diagnosis and Prediction, Lecture Notes on Information Theory, 2 (4), 2015.
  • 17. Dolatabadi A. D., Khadem S. E. Z., Asl B. M., Automated diagnosis of coronary artery disease (CAD) patients using optimized SVM, Computer Methods and Programs in Biomedicine, 138, 117–126, 2017.
  • 18. Miao K. H., Miao H., J., Coronary Heart Disease Diagnosis using Deep Neural Networks, International Journal of Advanced Computer Science and Applications, 9 (10), 2018.
  • 19. Amarbayasgalan T., Park K. H., Lee J. Y., Ryu K. H., Reconstruction error based deep neural networks for coronary heart disease risk prediction, Plos One, 14 (2), 2019.
  • 20. Wiharto W., Kusnanto H., Herianto H., Intelligence System for Diagnosis Level of Coronary Heart Disease with K-Star Algorithm, Healthcare Informatics Research, 22 (1), 30, 2016.
  • 21. Bramer M. A., Principles of data mining, Springer, London, 2017.
  • 22. Tan P.-N., Steinbach M., & Kumar V., Introduction to Data Mining, Pearson Education, San Francisco, 2006.
  • 23. Doad P. K. and Bartere M. M., A Review : Study of Various Clustering Techniques, International Journal of Engineering Research & Technology, 2 (11), 3141-3145, 2013.
  • 24. Cruz-Bernal A., Meta-Heuristic Optimization Techniques and Its Applications in Robotics, Recent Advances on Meta-Heuristics and Their Application to Real Scenarios, https://doi.org/10.5772/54460, 2013.
  • 25. Akay B., Karaboga D., Parameter tuning for the artificial bee colony algorithm, in: N. T. Nguyen, R. Kowalczyk, S.-M. Chen (Eds.), Computational Collective Intelligence. Semantic Web, Social Networks and Multiagent Systems, Springer Berlin Heidelberg, Berlin, Heidelberg, 608-619, 2009.
  • 26. Weise T., Global Optimization Algorithms-Theory and Application- Second edition e-book. https://pdf-drive.com/global-optimization- algorithms-theory-and-application-free-ebook-2ed/, 2007.
  • 27. Peterson M. R., Doom T. E., Raymer M. L., GA-Facilitated KNN Classifier Optimization with Varying Similarity Measures. Proceedings of the 2005 IEEE Congress on Evolutionary Computation, 3, 2514- 2521, 2005.
  • 28. Kirkpatrick, S., Gelatt, C.D. and Vecchi, M.P., Optimization by Simulated Annealing, Science, New Series, 220, 671–680, 1983.
  • 29. İnternet: UCI Machine Learning Repository, http://archive.ics.uci.edu/ml, 2019.
  • 30. Suganya S. and Tamil Selvi P., A Proficient Heart Disease Prediction Method using Fuzzy-Cart Algorithm, International Journal of Scientific Engineering and Applied Science, 2 (1), 1-6, 2016.
  • 31. Dangare S., C., Apte S., Improved Study of Heart Disease Prediction System using Data Mining Classification Techniques, International Journal of Computer Applications, 47 (10), 44–48. https://doi.org/10.5120/7228-0076. 2012.
  • 32. Abdar M., R. Niakan Kalhori S., Sutikno T., Much Ibnu Subroto I. & Arji G., Comparing Performance of Data Mining Algorithms in Prediction Heart Diseases, International Journal of Electrical and Computer Engineering (IJECE), 5 (6), 1569. https://doi.org/10.11591/ijece.v5i6.pp1569-1576. 2015.
  • 33. Takci H., Improvement of heart attack prediction by the feature selection methods, Turkish Journal Of Electrical Engineering & Computer Sciences, 26, 1–10, 2018.
  • 34. Dwivedi A. K., Performance evaluation of different machine learning techniques for prediction of heart disease, Neural Computing and Applications, 29 (10), 2016.
  • 35. Raza K., Improving the prediction accuracy of heart disease with ensemble learning and majority voting rule, in Healthcare Monitoring Systems, 179–196, Elsevier, 2019.
  • 36. Bhuvaneeswari R., Sudhakar P., Narmadha R. P., Intelligent Heart Disease Diagnosis System Using Distance Based Outlier Detection With Gradient Tree Boosting Algorithm, International Journal of Scientific & Technology Research, 8 (11), 2019.
  • 37. Africa A. D. M., A rough set-based expert system for diagnosing information system communication networks, International Journal of Information and Communication Technology, 11 (4), 496, 2017.
  • 38. Jabbar M. A., Prediction of heart disease using k-nearest neighbor and particle swarm optimization, Biomedical Research, 28 (9), 4154-4158, 2017.
  • 39. Noor K., Improving The Accuracy Of KNN Classifier For Heart Attack Using Genetic Algorithm, Journal of University of Kerbala, 2016.
APA Takcı H (2023). Optimum parametreler yardımıyla performansı artırılmış KNN algoritması tabanlı kalp hastalığı tahmini. , 451 - 460. 10.17341/gazimmfd.977127
Chicago Takcı Hidayet Optimum parametreler yardımıyla performansı artırılmış KNN algoritması tabanlı kalp hastalığı tahmini. (2023): 451 - 460. 10.17341/gazimmfd.977127
MLA Takcı Hidayet Optimum parametreler yardımıyla performansı artırılmış KNN algoritması tabanlı kalp hastalığı tahmini. , 2023, ss.451 - 460. 10.17341/gazimmfd.977127
AMA Takcı H Optimum parametreler yardımıyla performansı artırılmış KNN algoritması tabanlı kalp hastalığı tahmini. . 2023; 451 - 460. 10.17341/gazimmfd.977127
Vancouver Takcı H Optimum parametreler yardımıyla performansı artırılmış KNN algoritması tabanlı kalp hastalığı tahmini. . 2023; 451 - 460. 10.17341/gazimmfd.977127
IEEE Takcı H "Optimum parametreler yardımıyla performansı artırılmış KNN algoritması tabanlı kalp hastalığı tahmini." , ss.451 - 460, 2023. 10.17341/gazimmfd.977127
ISNAD Takcı, Hidayet. "Optimum parametreler yardımıyla performansı artırılmış KNN algoritması tabanlı kalp hastalığı tahmini". (2023), 451-460. https://doi.org/10.17341/gazimmfd.977127
APA Takcı H (2023). Optimum parametreler yardımıyla performansı artırılmış KNN algoritması tabanlı kalp hastalığı tahmini. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 38(1), 451 - 460. 10.17341/gazimmfd.977127
Chicago Takcı Hidayet Optimum parametreler yardımıyla performansı artırılmış KNN algoritması tabanlı kalp hastalığı tahmini. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 38, no.1 (2023): 451 - 460. 10.17341/gazimmfd.977127
MLA Takcı Hidayet Optimum parametreler yardımıyla performansı artırılmış KNN algoritması tabanlı kalp hastalığı tahmini. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, vol.38, no.1, 2023, ss.451 - 460. 10.17341/gazimmfd.977127
AMA Takcı H Optimum parametreler yardımıyla performansı artırılmış KNN algoritması tabanlı kalp hastalığı tahmini. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi. 2023; 38(1): 451 - 460. 10.17341/gazimmfd.977127
Vancouver Takcı H Optimum parametreler yardımıyla performansı artırılmış KNN algoritması tabanlı kalp hastalığı tahmini. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi. 2023; 38(1): 451 - 460. 10.17341/gazimmfd.977127
IEEE Takcı H "Optimum parametreler yardımıyla performansı artırılmış KNN algoritması tabanlı kalp hastalığı tahmini." Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 38, ss.451 - 460, 2023. 10.17341/gazimmfd.977127
ISNAD Takcı, Hidayet. "Optimum parametreler yardımıyla performansı artırılmış KNN algoritması tabanlı kalp hastalığı tahmini". Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 38/1 (2023), 451-460. https://doi.org/10.17341/gazimmfd.977127