Yıl: 2022 Cilt: 37 Sayı: 3 Sayfa Aralığı: 1355 - 1372 Metin Dili: Türkçe DOI: 10.17341/gazimmfd.900987 İndeks Tarihi: 29-07-2022

DNA genom dizilimi üzerinde dijital sinyal işleme teknikleri kullanılarak elde edilen ekson ve intron bölgelerinin EfficientNetB7 mimarisi ile sınıflandırılması

Öz:
Organizmayı inşa etmek ve canlılığını sürdürmek için devasa bilgi barındıran DNA, önemli bir biyobelirteçtir. A,T,G ve C harflerinden oluşan sembolik bir dizilime sahip olan DNA genom parçası, protein üreten(ekson) ve protein üretmeyen(intron) kısımlardan meydana gelmektedir.Bu bölgelerin tanımlanması; kanserin gelişme durumunun incelenmesi, ilgili gen bölgelerinde mutasyonun gerçekleşip gerçekleşmediğinin izlenmesi ya da organizmanın büyüme ve gelişme durumlarının düzenlenmesi gibi farklı konuların aydınlatılmasında önemli bir role sahiptir. Bu kapsamda bilgisayar destekli sistemler ile ekson ve intron bölgelerinin doğru bir şekilde ayırt edilmesi hedeflenmiştir. Çalışmanın ilk aşamasında, farklı sayısal haritalama teknikleri ile sayısallaştırılan sembolik DNA dizilimleri üzerinde en başarılı sayısal haritalama tekniğine performans ölçütleri vasıtasıyla karar verilmiştir. Ardından ilk kısımda seçilen haritalama tekniği kullanılarak sayısallaştırılan DNA dizilimlerinin spektogram olarak ifade edilmesi sağlanmıştır. Zamanla değişen bir sinyalin frekans spektrumunun görsel bir temsili olan spektogramlar exon ve intron bölgeleri olarak etiketlendikten sonra öğrenme aktarımı olan EfficientNetB7 mimarisi ile sınıflandırılmıştır. Sınıflandırma sürecinin sonunda başarı oranı ve AUC değeri %100 olarak elde edilmiştir.
Anahtar Kelime: Sayısal haritalama teknikleri Öğrenme aktarımı Nükleotit dizilimleri Dijital sinyal işleme metotları EfficientNetB7 Mimarisi

Classification of exon and intron regions obtained using digital signal processing techniques on the DNA genome sequencing with EfficientNetB7 architecture

Öz:
DNA is an important biomarker, containing enormous information for building the organism and maintaining its viability. DNA genome fragment with a symbolic sequence consisting of the letters A, T, G and C consists of protein-coding (exon) and non-coding (intron) parts. Identification of these regions plays an important role in different enlightening issues such as examining the development status of cancer, monitoring whether mutations occur in the relevant gene regions or regulating the growth and development of the organism. In this scope, it is aimed to distinguish the exon and intron regions correctly by computer-aided systems. In the first stage of the study, the most successful digital mapping technique on symbolic DNA sequences digitized with different numerical mapping techniques was decided by performance criteria. Then, the digitized DNA sequences using the mapping technique selected in the first part were expressed as spectrograms. Spectrograms, which are a visual representation of the frequency spectrum of a signal that changes over time, were labelled as exon and intron regions then were classified using the EfficientNetB7 model, a transfer learning architecture. At the end of the classification process, the success rate was obtained as %100.
Anahtar Kelime:

Belge Türü: Makale Makale Türü: Araştırma Makalesi Erişim Türü: Erişime Açık
  • 1. Barman S., Saha S., Mandal A., Roy M., Prediction of protein coding regions of a DNA sequence through spectral analysis, 2012 International Conference on Informatics, Electronics and Vision, 12–16, 2012.
  • 2. Yu N., Li Z., Yu Z., Survey on encoding schemes for genomic data representation and feature learning-from signal processing to machine learning, Big Data Mining and Analytics, 1 (3), 191–210, 2018.
  • 3. Hota M.K., Srivastava V.K., Performance analysis of different DNA to numerical mapping techniques for identification of protein coding regions using tapered window based short-time discrete Fourier transform, ICPCES 2010 - International Conference on Power, Control and Embedded Systems, 0–3, 2010.
  • 4. Das B., Türkoglu I., Classification of DNA sequences using numerical mapping techniques and Fourier transformation, Journal of the Faculty of Engineering and Architecture of Gazi University, 31 (4), 921–932, 2016.
  • 5. Das L., Das J.K. Nanda S., Detection of exon location in eukaryotic DNA using a fuzzy adaptive Gabor wavelet transform, Genomics, 112 (6), 4406–4416, 2020.
  • 6. Das L., Nanda S., Das J. K., An integrated approach for identification of exon locations using recursive Gauss Newton tuned adaptive Kaiser window, Genomics, 111 (3), 284–296, 2019.
  • 7. Meyer C., Scalzitti N, Jeannin-Girardon A., Collet P., Poch O., Thompson J.D., Understanding the causes of errors in eukaryotic protein-coding gene prediction: a case study of primate proteomes, BMC Bioinformatics, 21 (1), 1–16, 2020.
  • 8. Khodaei A., Feizi-Derakhshi M.R., MozaffariTazehkand B., A pattern recognition model to distinguish cancerous DNA sequences via signal processing methods, Soft Computing, 24 (21), 16315– 16334, 2020.
  • 9. Chakraborty S., Gupta V., DWT based cancer identification using EIIP, Proceedings - 2016 2nd International Conference on Computational Intelligence and Communication Technology, 718–723, 2016.
  • 10. Tiwari S., Ramachandran S., Bhattacharya A., Bhattacharya S., Ramaswamy R., Prediction of probable genes by fourier analysis of genomic sequences, Bioinformatics, 13 (3), 263–270, 1997.
  • 11. Raidi G. R., Gottlieb J., Lecture Notes in Computer Science: Preface, 3448, 2005.
  • 12. Duran K., Yüksek Lisans Tezi, İTÜ, Fen Bilimleri Enstitüsü, İstanbul, 2013.
  • 13. Anastassiou D., IEEE Signal Processing Magazine., 8– 20, 2001.
  • 14. Liu D., Jia R., Wang C., Arunkumar N., Narasimhan K., Udayakumar M., Elamaran V., Automated detection of cancerous genomic sequences using genomic signal processing and machine learning, Future Generation Computer Systems, 98, 233–237, 2019.
  • 15. Roy M., Barman S., Spectral analysis of coding and noncoding regions of a DNA sequence by Parametric method, Proceeding of the 2010 Annual IEEE India Conference: Green Energy, Computing and Communication, 7–10, 2010.
  • 16. Hsieh, S.J., Lin, C.Y., Chung, Y.S., Tang, C.Y., Comparative exon prediction based on heuristic coding region alignment, Proc. Int. Symp. Parallel Archit. Algorithms Networks,14–19, 2005.
  • 17. Abo-Zahhai M., Ahmed S.M., Abd-Elrahman S.A., A new numerical mapping technique for recognition of exons and introns in DNA sequences, National Radio Science Conference NRSC, Proceedings, 573–580, 2013.
  • 18. Das B., Turkoglu I., A novel numerical mapping method based on entropy for digitizing DNA sequences, Neural Computing and Applications, 29 (8), 207–215, 2018.
  • 19. Gupta R., Mittal A., Singh K., Bajpai P., Prakash S., A Time Series Approach for Identification of Exons and Introns, 91–93, 2008.
  • 20. Marhon S.A., Kremer S.C., Protein coding region prediction based on the adaptive representation method, Canadian Conference on Electrical and Computer Engineering, 000415–000418, 2011.
  • 21. Li J., Zhang L., Li H., Ping Y., Xu Q., Wang R., Tan R., Wang Z., Liu B., Wang Y., Integrated entropy-based approach for analyzing exons and introns in DNA sequences, BMC Bioinformatics, 20, 11–13, 2019.
  • 22. Dessouky A.M., Taha T.E., Dessouky M.M., Eltholth A.A., Hassan E., Abd El-Samie F., Non-parametric spectral estimation techniques for DNA sequence analysis and exon region prediction, Computer and Electrical Engineering, 73, 334–348, 2019.
  • 23. Singh A.K., Srivastava V.K., The three base periodicity of protein coding sequences and its application in exon prediction, 2020 7th International. Conference Signal Processing and Integrated Networks, 64, 1089–1094, 2020.
  • 24. Abo-Zahhad M., Ahmed S.M. Abd-Elrahman S.A., Genomic Analysis and Classification of Exon and Intron Sequences Using DNA Numerical Mapping Techniques, International Journal of Information Technology and Computer Science, 4 (8), 22–36, 2012.
  • 25. Das B., Doktora Tezi, Fırat Üniversitesi, Fen Bilimleri Enstitüsü, Elazığ, 2018.
  • 26. Toraman S., Türkoğlu İ., A new method for classifying colon cancer patients and healthy people from FTIR signals using wavelet transform and machine learning techniques, Journal of the Faculty of Engineering and Architecture of Gazi University, 35 (2), 933–942, 2020.
  • 27. Aygün O., Yüksek Lisans Tezi, Selçuk Üniversitesi, Fen Bilimleri Enstitüsü, Konya, 2006.
  • 28. Avci K., Coskun O., Spectral performance analysis of cosh window based new two parameter hybrid windows, 26th IEEE Signal Processing and Communications Applications Conference SIU, 1–4, 2018.
  • 29. Hashimoto D.A., Ward T.M., Meireles O.R., The Role of Artificial Intelligence in Surgery, Advances in Surgery, 54, 89–101, 2020.
  • 30. Narin A., İşler Y., Detection of new coronavirus disease from chest x-ray images using pre-trained convolutional neural networks, Journal of the Faculty of Engineering and Architecture of Gazi University, 36 (4), 2095–2107, 2021.
  • 31. Gürkahraman K., Karakiş R., Brain tumors classification with deep learning using data augmentation, Journal of the Faculty of Engineering and Architecture of Gazi University, 36 (2), 997–1011, 2021.
  • 32. Atila Ü., Uçar M., Akyol K., Uçar E., Plant leaf disease classification using EfficientNet deep learning model, Ecological Informatics, 61, 2021.
  • 33. Elmas B., Identifying species of trees through bark images by convolutional neural networks with transfer learning method, Journal of the Faculty of Engineering and Architecture of Gazi University, 36 (3),1253–1269, 2021.
  • 34. Sreng S., Maneerat N., Hamamoto K., Win K.Y., Deep learning for optic disc segmentation and glaucoma diagnosis on retinal images, Applied Sciences (Switzerland)., 10 (14), 2020.
  • 35. Muftuoglu, Z., Kizrak, M. A., Yıldırım, T., Differential Privacy Practice on Diagnosis of COVID-19 Radiology Imaging Using EfficientNet, International Conference on Innovations in Intelligent Systems and Application Proceedings, 2020.
  • 36. Kumar M.R., Vaegae N.K, Walsh code based numerical mapping method for the identification of protein coding regions in eukaryotes, Biomedical Signal Processing and Control, 58, 2020.
  • 37. Daş B., Toraman S., Türkoǧlu I., A novel genome analysis method with the entropy-based numerical technique using pretrained convolutional neural networks, Turkish Journal of Electrical Engineering and Computer Sciences, 28 (4), 1932–1948, 2020.
  • 38. Sahu S.S., Panda G., Identification of protein-coding regions in DNA sequences using a time-frequency filtering approach, Genomics, Proteomics Bioinformatics, 9, 45–55, 2011.
APA Akalın F, Yumusak N (2022). DNA genom dizilimi üzerinde dijital sinyal işleme teknikleri kullanılarak elde edilen ekson ve intron bölgelerinin EfficientNetB7 mimarisi ile sınıflandırılması. , 1355 - 1372. 10.17341/gazimmfd.900987
Chicago Akalın Fatma,Yumusak Nejat DNA genom dizilimi üzerinde dijital sinyal işleme teknikleri kullanılarak elde edilen ekson ve intron bölgelerinin EfficientNetB7 mimarisi ile sınıflandırılması. (2022): 1355 - 1372. 10.17341/gazimmfd.900987
MLA Akalın Fatma,Yumusak Nejat DNA genom dizilimi üzerinde dijital sinyal işleme teknikleri kullanılarak elde edilen ekson ve intron bölgelerinin EfficientNetB7 mimarisi ile sınıflandırılması. , 2022, ss.1355 - 1372. 10.17341/gazimmfd.900987
AMA Akalın F,Yumusak N DNA genom dizilimi üzerinde dijital sinyal işleme teknikleri kullanılarak elde edilen ekson ve intron bölgelerinin EfficientNetB7 mimarisi ile sınıflandırılması. . 2022; 1355 - 1372. 10.17341/gazimmfd.900987
Vancouver Akalın F,Yumusak N DNA genom dizilimi üzerinde dijital sinyal işleme teknikleri kullanılarak elde edilen ekson ve intron bölgelerinin EfficientNetB7 mimarisi ile sınıflandırılması. . 2022; 1355 - 1372. 10.17341/gazimmfd.900987
IEEE Akalın F,Yumusak N "DNA genom dizilimi üzerinde dijital sinyal işleme teknikleri kullanılarak elde edilen ekson ve intron bölgelerinin EfficientNetB7 mimarisi ile sınıflandırılması." , ss.1355 - 1372, 2022. 10.17341/gazimmfd.900987
ISNAD Akalın, Fatma - Yumusak, Nejat. "DNA genom dizilimi üzerinde dijital sinyal işleme teknikleri kullanılarak elde edilen ekson ve intron bölgelerinin EfficientNetB7 mimarisi ile sınıflandırılması". (2022), 1355-1372. https://doi.org/10.17341/gazimmfd.900987
APA Akalın F, Yumusak N (2022). DNA genom dizilimi üzerinde dijital sinyal işleme teknikleri kullanılarak elde edilen ekson ve intron bölgelerinin EfficientNetB7 mimarisi ile sınıflandırılması. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 37(3), 1355 - 1372. 10.17341/gazimmfd.900987
Chicago Akalın Fatma,Yumusak Nejat DNA genom dizilimi üzerinde dijital sinyal işleme teknikleri kullanılarak elde edilen ekson ve intron bölgelerinin EfficientNetB7 mimarisi ile sınıflandırılması. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 37, no.3 (2022): 1355 - 1372. 10.17341/gazimmfd.900987
MLA Akalın Fatma,Yumusak Nejat DNA genom dizilimi üzerinde dijital sinyal işleme teknikleri kullanılarak elde edilen ekson ve intron bölgelerinin EfficientNetB7 mimarisi ile sınıflandırılması. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, vol.37, no.3, 2022, ss.1355 - 1372. 10.17341/gazimmfd.900987
AMA Akalın F,Yumusak N DNA genom dizilimi üzerinde dijital sinyal işleme teknikleri kullanılarak elde edilen ekson ve intron bölgelerinin EfficientNetB7 mimarisi ile sınıflandırılması. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi. 2022; 37(3): 1355 - 1372. 10.17341/gazimmfd.900987
Vancouver Akalın F,Yumusak N DNA genom dizilimi üzerinde dijital sinyal işleme teknikleri kullanılarak elde edilen ekson ve intron bölgelerinin EfficientNetB7 mimarisi ile sınıflandırılması. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi. 2022; 37(3): 1355 - 1372. 10.17341/gazimmfd.900987
IEEE Akalın F,Yumusak N "DNA genom dizilimi üzerinde dijital sinyal işleme teknikleri kullanılarak elde edilen ekson ve intron bölgelerinin EfficientNetB7 mimarisi ile sınıflandırılması." Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 37, ss.1355 - 1372, 2022. 10.17341/gazimmfd.900987
ISNAD Akalın, Fatma - Yumusak, Nejat. "DNA genom dizilimi üzerinde dijital sinyal işleme teknikleri kullanılarak elde edilen ekson ve intron bölgelerinin EfficientNetB7 mimarisi ile sınıflandırılması". Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 37/3 (2022), 1355-1372. https://doi.org/10.17341/gazimmfd.900987