Yıl: 2020 Cilt: 8 Sayı: 2 Sayfa Aralığı: 372 - 382 Metin Dili: Türkçe DOI: 10.29109/gujsc.686177 İndeks Tarihi: 23-10-2020

NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması

Öz:
Bu çalışmada, Doğal Dil İşleme kullanılarak elektronik ortamlardaki haberlerin yaş gruplarınagöre etiketlenmesi amaçlanmıştır. Haber sitelerinden toplanan haber veri setinin eğitim amaçlıseçilmiş olanları, NLP Zemberek Kütüphanesi kullanılarak Python dili ile işlenmiş,Havighurst’ün “Gelişim Kuramı” nın güncel duruma adapte edilmiş Çocukluk, Ergenlik veYetişkinlik yaş gruplarını temsil edebilecek kelime sözlüğü oluşturulmuştur (her kelimeninhangi yaş grubuna uygun olduğu). Daha sonra, bu sözlük kullanılarak haber veri setinin testamaçlı seçilmiş olanlarının sınıflarını belirlemek üzere bir sınıflandırıcı önerilmiştir. Testlersonucunda, geliştirilen sözlüğün 0.70 oranında doğru sınıfı tespit edebildiği görülmüştür.
Anahtar Kelime:

Classification of News according to Age Groups Using NLP

Öz:
In this study, it is aimed to label the news in electronic media according to age groups by using Natural Language Processing. The selected ones for training in the news dataset collected from the news sites were processed in Python language using the NLP Zemberek Library, and a vocabulary dictionary that could represent Childhood, Adolescence and Adult age groups of Havighurst's Development Theory adapted to the current situation was created (which age group of each word as appropriate). A classifier was then proposed to determine the classes of the news dataset selected for testing using this dictionary. As a result of the tests, it was seen that the developed dictionary can detect the correct class with a success rate of 0.70.
Anahtar Kelime:

Belge Türü: Makale Makale Türü: Araştırma Makalesi Erişim Türü: Erişime Açık
  • [1] Akın A.A., Akın M. D. Zemberek, an open source NLP framework for Turkic Languages, (2007).
  • [2] Hürriyet, 21 Eylül 2019, Erişim adresi: www.hurriyet.com
  • [3] Yumurtalı Ekmek, 21 Eylül 2019, Erişim adresi: www.yumurtaliekmek.com[4] Çok F. Gelişim psikolojisi, kuramlar, yöntemler ve yaşamın ilk yılları (kısaltarak çeviri), Ankara Üniversitesi Eğitim Bilimleri Fakültesi Dergisi, 2 (26), s. 641-670, DOI: 10.1501/Egifak_0000000479, (1993).
  • [4] Çok F. Gelişim psikolojisi, kuramlar, yöntemler ve yaşamın ilk yılları (kısaltarak çeviri), Ankara Üniversitesi Eğitim Bilimleri Fakültesi Dergisi, 2 (26), s. 641-670, DOI: 10.1501/Egifak_0000000479, (1993).
  • [5] Fırat F. Çocuk odak‘sız’ habercilik: internet gazetelerinde çocuk içerikli haberlerin sunumu ve etik ihlaller, Gümüşhane Üniversitesi İletişim Fakültesi Elektronik Dergisi, 2(4), (2016).
  • [6] Oflazer K. Türkçe ve Doğal Dil İşleme (Turkish Natural Language Processing), Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 2(5), (2012).
  • [7] Silverman K., Anderson V., Bellegarda J., Lenzo K. and Naik D. Design and Collection of a Corpus of Polyphones And Prosodic Contexts for Speech Synthesis Research and Development, (1999).
  • [8] Riloff E. Automatically Generating Extraction Patterns From Untagged Text, AAAI'96: Proceedings of the thirteenth national conference on Artificial intelligence, Vol. 2, s. 1044–1049, (1996).
  • [9] Këpuska V. Z., Rojanasthien P. Speech Corpus Generation from DVDs of Movies and TV Series, Journal of International Technology and Information Management: Vol. 20: Iss. 1, Article 4. (2011).
  • [10] Tsalidis Ch., Vagelatos A. and Orphanos G. An electronic dictionary as a basis for NLP tools: TheGreek case, ArXiv cs.CL/0408061 (2004).
  • [11] Aktaş Y., Yılmaz İnce E., Çakır A. Doğal Dil İşleme Kullanarak Bilgisayar Ağ Terimlerinin Wordnet Ontolojisinde Uyarlanması, SDÜ Teknik Bilimler Dergisi, (2017).
  • [12] Şeker S. E. Doğal Dil İşleme(Natural Language Processing), Yönetim Bilişim Sistemleri Ansiklopedisi, 4(2), (2015).
  • [13] Khurana D., Koli A., Khatter K., Singh S. Natural Language Processing: State of The Art, Current Trends and Challenges, ArXiv abs/1708.05148 (2017). [14] Adalı E. Doğal Dil İşleme, Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 2(5), (2012).
  • [15] Dev, 14 Nisan 2020, Erişim adresi: https://dev.to/overrideveloper/understanding-the-confusionmatrix-264i
  • [16] Binici K. Kütüphane ve Bilgi Biliminde Tema ve Yönelim, Hiper yayın, s. 41-84, İstanbul, (2018).
  • [17] İlhan U. Application Of K-NN and FPTC Based Text Categorization Algorithms to Turkish News Reports, (2001).
  • [18] GitHup, 20 Eylül 2019, Erişim adresi: https://github.com/ahmetaa/zemberek-nlp
  • [19] WordNet, 03 Şubat 2020, Erişim adresi: https://wordnet.princeton.edu/
  • [20] Uludoğan G., Özçelik R., Parlar S., Ercan G., Yıldız O. T. User Interfaces for Turkish Natural Language Processing, (2019).
  • [21] Eryiğit G. ITU Turkish NLP Web Service, s. 1-4, DOI: 10.3115/v1/E14-2001, (2014).
APA KONTUK R, turan m (2020). NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması. , 372 - 382. 10.29109/gujsc.686177
Chicago KONTUK Rabia,turan metin NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması. (2020): 372 - 382. 10.29109/gujsc.686177
MLA KONTUK Rabia,turan metin NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması. , 2020, ss.372 - 382. 10.29109/gujsc.686177
AMA KONTUK R,turan m NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması. . 2020; 372 - 382. 10.29109/gujsc.686177
Vancouver KONTUK R,turan m NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması. . 2020; 372 - 382. 10.29109/gujsc.686177
IEEE KONTUK R,turan m "NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması." , ss.372 - 382, 2020. 10.29109/gujsc.686177
ISNAD KONTUK, Rabia - turan, metin. "NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması". (2020), 372-382. https://doi.org/10.29109/gujsc.686177
APA KONTUK R, turan m (2020). NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması. Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım ve Teknoloji, 8(2), 372 - 382. 10.29109/gujsc.686177
Chicago KONTUK Rabia,turan metin NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması. Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım ve Teknoloji 8, no.2 (2020): 372 - 382. 10.29109/gujsc.686177
MLA KONTUK Rabia,turan metin NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması. Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım ve Teknoloji, vol.8, no.2, 2020, ss.372 - 382. 10.29109/gujsc.686177
AMA KONTUK R,turan m NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması. Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım ve Teknoloji. 2020; 8(2): 372 - 382. 10.29109/gujsc.686177
Vancouver KONTUK R,turan m NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması. Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım ve Teknoloji. 2020; 8(2): 372 - 382. 10.29109/gujsc.686177
IEEE KONTUK R,turan m "NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması." Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım ve Teknoloji, 8, ss.372 - 382, 2020. 10.29109/gujsc.686177
ISNAD KONTUK, Rabia - turan, metin. "NLP Kullanılarak Haberlerin Yaş Gruplarına Göre Sınıflandırılması". Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım ve Teknoloji 8/2 (2020), 372-382. https://doi.org/10.29109/gujsc.686177