Türkçe WordNet Oluşturulması ve Makine Çevirisinde Kullanılması

Proje Grubu: TÜBİTAK EEEAG Proje Sayfa Sayısı: 28 Proje No: 116E104 Proje Bitiş Tarihi: 01.11.2019 Metin Dili: Türkçe

Türkçe WordNet Oluşturulması ve Makine Çevirisinde Kullanılması

Öz:
Princeton kelime agının üretilmesinden beri, diger dillerde birçok kelime agı üretilmistir. Türkçe için en kapsamlı kelime agı olan KeNet su anda 80,000 synset içermektedir. Bu synsetler birbirleriyle anlamsal ve diller arası iliskilerle baglıdırlar. KeNet ayrıca Türkçe üzerinde Türkçe PropBank, alana özgü kelime agları ve anlamsal isaretleme gibi birden çok Dogal Dil Isleme çalısmasında kullanılmıstır. Türkçe kelime agı KeNet iki platform ile kullanıcılara sunulmustur. KeNet?in sunuldugu ilk platform, ?http://haydut.isikun.edu.tr/wordnet.ui-1.0/? web sayfasıdır. Bu platform ile, kelime veya sözcük öbekleri araması yapılabilir. Arama sonuçlarına göre, bulunan kelimelerin hiyerarsileri ile anlamsal iliskileri görülebilir. Ayrıca Türkçe kelime agı KeNet?i github sitesi üzerinden de erisime açtık. Bu platform sayesinde, KeNet?in tüm dosyaları indirilebilir, Java, C++ ve Python gibi üç programlama dilinde KeNet kullanılabilir. KeNet?in github web sitesindeki web sayfaları Java, C++ ve Python programlama dilleri için sırasıyla ?https://github.com/olcaytaner/TurkishWordNet?, ?https://github.com/olcaytaner/TurkishWordNet-CPP?, ?https://github.com/olcaytaner/TurkishWordNet-Py??dır. Bu proje raporunda, KeNet?i meydana getirirken kullandıgımız yöntemleri, bu yöntemlere ait basamaklara da referans vererek anlatacagız.
Anahtar Kelime: makine çevirisi kelime agı

Erişim Türü: Erişime Açık
  • 1. AK, K., Yıldız, O. T., Esgel, V., and Toprak, C. (2019). Construction of a Turkish proposition bank. Turkish Journal of Electrical Engineering and Computer Science , 26:570 – 581.
  • 1- A tree-based approach for English-to-Turkish translation (Makale - Diger Hakemli Makale),
  • 2. AKÇAKAYA, S. and Yildiz, O. T. (2018). An all-words sense annotated Turkish corpus. In Proceedings of the International Conference on Natural Language and Speech Processing .
  • 2- A Multilayer Annotated Corpus for Turkish (Bildiri - Uluslararası Bildiri - Sözlü Sunum),
  • 3. ARICAN, B. N., Bakay, O., Avar, B., Yildiz, O. T., and Ergelen, O. (2019). English-turkish parallel semantic annotation of penn-treebank. In Proceedings of the Global WordNet Conference .
  • 3- An All-Words Sense Annotated Turkish Corpus (Bildiri - Uluslararası Bildiri - Sözlü Sunum),
  • 4. BAKAY, O., Ergelen, O., and Yildiz, O. T. (2019a). Integrating Turkish wordnet kenet to princeton wordnet: The case of one-to-many correspondances. In ASYU .
  • 4- Comparison of Turkish Proposition Banks by Frame Matching (Bildiri - Uluslararası Bildiri - Sözlü Sunum),
  • 5. BAKAY, O., Ergelen, O., and Yildiz, O. T. (2019b). Problems caused by semantic drift in wordnet synset construction. In UBMK .
  • 5- AnlamVer: Semantic Model Evaluation Dataset for Turkish - Word Similarity and Relatedness (Bildiri - Uluslararası Bildiri - Sözlü Sunum),
  • 6. BAKAY, O., Avar, B., and Yildiz, O. T. (2019c). A tree-based approach for English-to-Turkish translation. Turkish Journal of Electrical Engineering & Computer Sciences, 27:1, 427-452.
  • 7. BİLGİN, O., Cetinoglu, O., and Oflazer, K. (2004). Building a wordnet for Turkish. Romanian Journal of Information Science , 7:163–172.
  • 8. BLACK, W., Elkateb, S., Rodriguez, H., Alkhalifa, M., Vossen, P., Pease, A., and Fellbaum, C. (2006). Introducing the Arabic wordnet project. In International Wordnet Conference , pages 295–300. Masaryck University, Brno, Czeck Republic.
  • 9. EHSANİ, R., Solak, E., and Yildiz, O. (2018). Constructing a wordnet for Turkish using manual and automatic annotation. ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP) , 17(3).
  • 10. MILLER, G. (1995). Wordnet: a lexical database for english. ACM Communications , 38:39–41.
  • 11. ÖZÇELİK, R., Parlar, S., Bakay, O., Ergelen, O., and Yildiz, O. T. (2019). User interface for Turkish word network KeNet. In Signal Processing and Communication Applications Conference .
  • 12. PARLAR, S., Arican, B. N., Erkek, M., Cayirli, K., and Yildiz, O. T. (2019). Emlak alanına Özgü kelime ağ̆ı. In Proceedings of the Signal Processing and Communication Applications Conference .
  • 13. PEIK, V. (1997). Eurowordnet: a multilingual database for information retrieval. In DELOS workshop on Cross- language Information Retrieval . Vrije Universiteit, Amsterdam, Czech Republic.
  • 14. SAGOT, B. (2008). Building a free French wordnet from multilingual resources. page 24. ACM.
  • 15. TUFIS, D., Cristea, D., and Stamou, S. (2004). Balka-net: Aims, methods, results and perspectives. a general overview. Romanian Journal of Information Sci- ence , 7:9–43.
  • 16. VOSSEN, P. (2007). Eurowordnet: A multilingual database for information retrieval. In DELOS workshop on Cross- Language Information Retrieval .
APA YILMAZ O (2019). Türkçe WordNet Oluşturulması ve Makine Çevirisinde Kullanılması. , 1 - 28. 116E104
Chicago YILMAZ Olcay Taner Türkçe WordNet Oluşturulması ve Makine Çevirisinde Kullanılması. (2019): 1 - 28. 116E104
MLA YILMAZ Olcay Taner Türkçe WordNet Oluşturulması ve Makine Çevirisinde Kullanılması. , 2019, ss.1 - 28. 116E104
AMA YILMAZ O Türkçe WordNet Oluşturulması ve Makine Çevirisinde Kullanılması. . 2019; 1 - 28. 116E104
Vancouver YILMAZ O Türkçe WordNet Oluşturulması ve Makine Çevirisinde Kullanılması. . 2019; 1 - 28. 116E104
IEEE YILMAZ O "Türkçe WordNet Oluşturulması ve Makine Çevirisinde Kullanılması." , ss.1 - 28, 2019. 116E104
ISNAD YILMAZ, Olcay Taner. "Türkçe WordNet Oluşturulması ve Makine Çevirisinde Kullanılması". (2019), 1-28. https://doi.org/116E104
  • 1- A tree-based approach for English-to-Turkish translation (Makale - Diger Hakemli Makale),
  • 2- A Multilayer Annotated Corpus for Turkish (Bildiri - Uluslararası Bildiri - Sözlü Sunum),
  • 3- An All-Words Sense Annotated Turkish Corpus (Bildiri - Uluslararası Bildiri - Sözlü Sunum),
  • 4- Comparison of Turkish Proposition Banks by Frame Matching (Bildiri - Uluslararası Bildiri - Sözlü Sunum),
  • 5- AnlamVer: Semantic Model Evaluation Dataset for Turkish - Word Similarity and Relatedness (Bildiri - Uluslararası Bildiri - Sözlü Sunum),