Yıl: 2018 Cilt: 6 Sayı: 4 Sayfa Aralığı: 754 - 764 Metin Dili: Türkçe İndeks Tarihi: 05-02-2020

İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli

Öz:
Bu makalede dokümanlarda tema ve alt kavram tespiti konusunda bir model önerilmiş ve deneysel bulgulardeğerlendirilmiştir. Dokümanlarda tema ve alt kavramların tespiti için kullanılabilecek anlamlı sözcüklerinbelirlenmesi amacıyla Helmholtz prensibi temelli Gestalt teorisi kullanılmıştır. Bu sözcüklerin girdi olduğu birYapay Sinir Ağı (YSA) modeli oluşturulmuş, eğitim dokümanları (140 adet) ile bu ağ eğitilmiştir. Eğitim vesınama doküman veri seti spor ve eğitim temalarında olup, toplam 14 alt kavram seçilmiştir. YSA’nın çıktısıtema ve alt-kavram bilgilerini vermektedir. 70 adet sınama dokümanı ile farklı sayıda (5, 10, 20) anlamlı kelimeseçilerek deneyler yapılmış, başarı oranının konularda yaklaşık olarak %95, alt kavramlarda ise %80 olduğugözlemlenmiştir
Anahtar Kelime:

Topic and Sub-Topic Detection Model in English Documents

Öz:
In this article, a model of topic and sub topic detection is proposed in the documents and experimental findings are evaluated. The Gestalt theory based on the Helmholtz principle was used in the documents to determine the meaningful words that could be used to determine concepts and sub topic. An Artificial Neural Network (ANN) model was established in which these words were entered, and this network was trained with number of 140 training documents. The training and testing document dataset is about the sports and training topics and 14 subtopics have been selected. The output of ANN gives the topic and sub topic information. Experiments were executed with 70 test documents with different numbers of (5, 10, 20) words. It was observed that the success rate was approximately 95% in the topic and 80% in the sub topic.
Anahtar Kelime:

Belge Türü: Makale Makale Türü: Araştırma Makalesi Erişim Türü: Erişime Açık
  • Y. H. Li ve A. K. Jain, “Classification of Text Documents,” The Computer Journal, c. 41, s. 8, ss. 537–546, 1998.
  • E. S. Yu, ve E. D. Liddy, “Feature Selection in Text Categorization Using The Baldwin Effect,” International Joint Conference on Neural Networks, Washington, ABD, 1999.
  • R. Bekkerman, R. El-Yaniv, N. Tsihby ve Y. Winter, “Distributional Word Clusters vs. Words for Text Categorization, ” Journal of Machine Learning Research, ss. 1-48, 2002.
  • F. Song, S. Liu ve J. Yang, “A Comparative Study on Text Representation Schemes in Text Categorization,” Pattern Analysis and Applications, c.8, s.1-2, ss.199-209, 2005.
  • M. F. Amasyalı ve B. Diri, “Automatic Turkish Text Categorization in Terms of Author, Genre and Gender,” 11th International Conference on Applications of Natural Language to Information Systems-NLDB 2006, ss. 221-226, 2006.
  • F. Türkoğlu, B. Diri ve M. F. Amasyalı, “Author Attribution of Turkish Texts by Feature Mining,” International Conference on Intelligent Computing, Qingdao, Çin, ss. 1086-1093, 2007.
  • A. Çiltik ve T. Güngör, “Time-Efficient Spam E-mail Filtering Using N-gram Models,” Pattern Recognition Letters, c. 29, s. 1, ss. 19-33, 2008.
  • H. Balinsky, A. Balinsky ve S. Simske, “Document Sentences As a Small World,” 2011 IEEE International Conference on Systems, Man, and Cybernetics (SMC), Anchorage, ABD, 2011.
  • M. Ghiassi, J. Skinner ve D. Zimbra, “Twitter Brand Sentiment Analysis: A Hybrid System Using N-gram Analysis and Dynamic Artificial Neural Network,” Expert System Applications, c. 40, s. 16, ss. 6266-6282, 2013. [ D. Tanasa ve B. Trousse, "Advanced Data Preprocessing for Intersites Web Usage Mining,” IEEE Intelligent Systems, c.19, s. 2, 2004.
  • V. Chitraa ve Dr. A. S. Davamani, “A Survey on Preprocessing Methods for Web Usage Data,” International Journal of Computer Science and Information Security, c.7, s.3, 2010.
  • H. Balinsky, A. Balinsky ve S. Simske, “On the Helmholtz Principle for Data Mining,” Third International Conference on Emerging Security Technologies (EST), Lisbon, Portekiz, 2012.
  • H. Balinsky, A. Balinsky ve S. Simske, “On Helmholtz’s Principle for Documents Processing,” Proceedings of the 10th ACM Symposium on Document Engineering, Manchester, İngiltere, ss. 283-286, 2010.
  • M. Tutkan, M. C. Ganiz ve S. Akyokuş, ”Metin Sınıflandırma için Eğitimsiz Bir Anlamsal Özellik Seçimi Yöntemi,” Bilgisayar ve Biyomedikal Mühendisliği Sempozyumu, Bursa, Türkiye, 2014.
  • M. Turan ve C. Sönmez, ”Automatize Document Topic and Subtopic Detection with Support of a Corpus,” Procedia - Social and Behavioral Sciences, c. 177, ss. 169-177, 2015.
APA ÖGTELİK S, turan m (2018). İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli. , 754 - 764.
Chicago ÖGTELİK Sena,turan metin İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli. (2018): 754 - 764.
MLA ÖGTELİK Sena,turan metin İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli. , 2018, ss.754 - 764.
AMA ÖGTELİK S,turan m İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli. . 2018; 754 - 764.
Vancouver ÖGTELİK S,turan m İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli. . 2018; 754 - 764.
IEEE ÖGTELİK S,turan m "İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli." , ss.754 - 764, 2018.
ISNAD ÖGTELİK, Sena - turan, metin. "İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli". (2018), 754-764.
APA ÖGTELİK S, turan m (2018). İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli. Düzce Üniversitesi Bilim ve Teknoloji Dergisi, 6(4), 754 - 764.
Chicago ÖGTELİK Sena,turan metin İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli. Düzce Üniversitesi Bilim ve Teknoloji Dergisi 6, no.4 (2018): 754 - 764.
MLA ÖGTELİK Sena,turan metin İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli. Düzce Üniversitesi Bilim ve Teknoloji Dergisi, vol.6, no.4, 2018, ss.754 - 764.
AMA ÖGTELİK S,turan m İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli. Düzce Üniversitesi Bilim ve Teknoloji Dergisi. 2018; 6(4): 754 - 764.
Vancouver ÖGTELİK S,turan m İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli. Düzce Üniversitesi Bilim ve Teknoloji Dergisi. 2018; 6(4): 754 - 764.
IEEE ÖGTELİK S,turan m "İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli." Düzce Üniversitesi Bilim ve Teknoloji Dergisi, 6, ss.754 - 764, 2018.
ISNAD ÖGTELİK, Sena - turan, metin. "İngilizce Dokümanlarda Tema ve Alt Kavramlar Tespit Modeli". Düzce Üniversitesi Bilim ve Teknoloji Dergisi 6/4 (2018), 754-764.