Yıl: 2021 Cilt: 7 Sayı: 3 Sayfa Aralığı: 243 - 252 Metin Dili: Türkçe DOI: 10.30855/gmbd.2021.03.07 İndeks Tarihi: 06-09-2022

İşin Olsun Platformu İlanlarında İçerik Kontrolü

Öz:
Bu makalede mavi yakalı iş arama ve bulma platformu olan İşin Olsun sitesindeki ilanların içerik yönetimi ve otomatik içerik kontrolü hakkında geliştirilen yaklaşımlar açıklanacaktır. Bu amaçla denetimli makine öğrenmesi modelleri ve Bert transformer mimarisi yöntemleri ile deneyler gerçekleştirilerek sonuçları gözlemlenmiştir. Çalışma sonunda, dizi sınıflandırma için Bert (Bert for sequence classification) kullanılarak ilan içeriklerinin otomatik olarak sınıflandırıldığı bir sistem geliştirilmiş ve bu sistem iş arama platformuna entegre edilmiştir. İşin Olsun ilan metinlerinin kontrolör görevindeki kişiler tarafından uygun veya uygun olmayan içerik şeklinde iki farklı sınıfta etiketlenmesinden başlayarak, veri kümesinin hazırlanma aşamalarından, sınıflandırma modelinin sisteme entegrasyonuna kadar olan çalışmalar bu makalede özetlenmektedir.
Anahtar Kelime: dil modelleri bert transformers doğal dil işleme yapay zekâ derin öğrenme

Content Control in İşin Olsun Platform Job Texts

Öz:
In this paper, the approaches developed for the content management and automatic content control of the postings on the İşin Olsun website, which is a blue-collar job search and finding platform, will be explained. For this purpose, experiments were carried out with supervised machine learning models and Bert transformer architecture methods and the results were observed. At the end of the study, a system was developed in which the contents of the job texts are automatically classified using Bert for sequence classification, which was determined as the most successful method, and this system was integrated into the job search platform. Starting from labeling the job texts in two different classes as appropriate or unsuitable content by the controllers, from the preparation stages of the dataset to the integration of the classification model into the system, the studies are summarized in this paper.
Anahtar Kelime:

Belge Türü: Makale Makale Türü: Araştırma Makalesi Erişim Türü: Erişime Açık
  • [1] [Online]. Available: https://isinolsun.com. [Accessed: Haz. 23, 2021].
  • [2] A. C. Tantuğ, “Metin sınıflandırma (text classification)” Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, vol. 5, no. 2, pp. 1- 3, Haziran 2012.
  • [3] A. Köksal and A. Özgür, “Twitter dataset and evaluation of transformers for turkish sentiment analysis” in 2021 29th Signal Processing and Communications Applications Conference (SIU), Haziran 9-11, 2021, İstanbul, Türkiye. IEEE, 2021, pp. 1–4. doi: 10.1109/SIU53274.2021.9477814
  • [4] U. U. Acikalin, B. Bardak, and M. Kutlu, “Turkish sentiment analysis using bert” in 2020 28th Signal Processing and Communications Applications Conference (SIU), 2020, Gaziantep, Türkiye. 2020, pp. 1–4. doi: 10.1109/SIU49456.2020.9302492
  • [5] J. Devlin, M.-W. Chang, K. Lee, and K. Toutanova, “Bert: Pre-training of deep bidirectional transformers for language understanding,” Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, June 2019, Minneapolis, Minnesota, USA, 2019, Association for Computational Linguistics, 2019. pp. 1-9. doi:10.18653/v1/N19-1423
  • [6] Y. Zhang, R. Jin, and Z.-H. Zhou, “Understanding bag-of-words model: A statistical framework” International Journal of Machine Learning and Cybernetics, vol. 1, pp. 43–52, Aralık 2010. doi: 10.1007/s13042-010-0001-0
  • [7] [Online]. Available: https://huggingface.co/transformers/model_doc/bert. [Accessed: May. 20, 2021].
  • [8] S. Schweter, “Berturk - Bert Models for Turkish” Nisan 2020. [Online]. Available: https://doi.org/10.5281/zenodo.3770924. [Accessed: May. 20, 2021].
  • [9] [Online]. Available: https://huggingface.co/dbmdz/bert-base-turkish- cased. [Accessed: May. 20, 2021].
  • [10] [Online]. Available: https://www.perspectiveapi.com. [Accessed: May. 21, 2021].
  • [11] K. Dilek, et al. “Named entity recognition experiments on Turkish texts” in International Conference on Flexible Query Answering Systems. 2009, Roskilde, Denmark, October 26-28, 2009. Springer, Berlin, Heidelberg, 2009. pp. 524-535. doi:10.1007/978-3-642-04957-6_45
  • [12] [Online]. Available: https://en.wikipedia.org/wiki/Scunthorpe_problem. [Accessed: Haz. 17, 2021].
  • [13] A. Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, L. Jones, A. N. Gomez, L. Kaiser, and I. Polosukhin, “Attention is all you need,” arxiv.org , 2017. [Online]. Available: https://arxiv.org/pdf/1706.03762.pdf. [Accessed: May. 23, 2021].
  • [14] C. Sun, X. Qiu, Y. Xu, and X. Huang, “How to fine-tune bert for text classification?”, Chinese Computational Linguistics, pp. 194-206, 2019. doi: 10.1007/978-3-030-32381-3_16
  • [15] C. Y. Peng, K. L. Lee, and G. Ingersoll, “An introduction to logisticr egression analysis and reporting” The Journal of Educational Research, vol. 96, pp. 14 – 3, 2002. doi: 10.1080/00220670209598786
  • [16] C. Cortes and V. Vapnik, “Support-vector networks,” Machine Learning, vol. 20, pp. 273–297, 2004. doi: 10.1007/BF00994018
  • [17] G. Dogan, N. Alotaibi, E. Sahin, S. S. Ertas, I. Cay, R. Keskin, M. J. H. Heijnen, and K. Ricanek, “Using artificial intelligence to predict fall-risk during adaptive locomotion in humans” in 2020 International Conference on Artificial Intelligence Modern Assistive Technology (ICAIMAT), Riyadh, Saudi Arabia, Nov. 24-26, 2020. IEEE 2020. pp. 1-7. doi: 10.1109/ICAIMAT51101.2020.9308007
  • [18] L. Breiman, “Random forests,” Machine Learning, vol. 45, pp. 5–32, 2004. doi: 10.1023/A:1010933404324
  • [19] T. Chen and C. Guestrin, “Xgboost: A Scalable Tree Boosting System” in KDD '16: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Ağustos 13- 17, 2016, San Francisco, CA, USA. 2016. pp. 785- 794. doi: 10.1145/2939672.2939785
  • [20] P. Soucy and G. Mineau, “A simple knn algorithm for text categorization” in Proceedings 2001 IEEE International Conference on Data Mining, 29 Nov-2 Dec. 2001, San Jose, CA, USA, IEEE, 2002. pp. 647–648. doi: 10.1109/ICDM.2001.989592
  • [21] G. M. Demirci, R. Keskin, and G. Doğan, “Sentiment analysis in turkish with deep learning” in 2019 IEEE International Conference on Big Data (Big Data), 9-12 Dec. 2019, Los Angeles, CA, USA. IEEE, 2019. pp. 2215–2221. doi: 10.1109/BigData47090.2019.9006066
  • [22] V. Sanh, L. Debut, J. Chaumond, and T. Wolf, “Distilbert, a distilled version of bert: smaller, faster, cheaper and lighter”, Ekim 2019. doi: arxiv- 1910.01108.
  • [23] K. Clark, M.-T. Luong, Q. V. Le, and C. D. Manning, “Electra: Pre-training text encoders as discriminators rather than generators”, Arxiv 2020. doi: arxiv-2003.10555.
  • [24] [Online]. Available: https://huggingface.co/docs/transformers/model_doc/ electra. [Accessed: May. 27, 2021].
  • [25] [Online]. Available: https://huggingface.co/docs/transformers/model_doc/ distilbert. [Accessed: May. 27, 2021].
APA Tuncer I, KESKİN Ş, APAYDIN M (2021). İşin Olsun Platformu İlanlarında İçerik Kontrolü. , 243 - 252. 10.30855/gmbd.2021.03.07
Chicago Tuncer Işılay,KESKİN Şeref,APAYDIN MEHMET SERKAN İşin Olsun Platformu İlanlarında İçerik Kontrolü. (2021): 243 - 252. 10.30855/gmbd.2021.03.07
MLA Tuncer Işılay,KESKİN Şeref,APAYDIN MEHMET SERKAN İşin Olsun Platformu İlanlarında İçerik Kontrolü. , 2021, ss.243 - 252. 10.30855/gmbd.2021.03.07
AMA Tuncer I,KESKİN Ş,APAYDIN M İşin Olsun Platformu İlanlarında İçerik Kontrolü. . 2021; 243 - 252. 10.30855/gmbd.2021.03.07
Vancouver Tuncer I,KESKİN Ş,APAYDIN M İşin Olsun Platformu İlanlarında İçerik Kontrolü. . 2021; 243 - 252. 10.30855/gmbd.2021.03.07
IEEE Tuncer I,KESKİN Ş,APAYDIN M "İşin Olsun Platformu İlanlarında İçerik Kontrolü." , ss.243 - 252, 2021. 10.30855/gmbd.2021.03.07
ISNAD Tuncer, Işılay vd. "İşin Olsun Platformu İlanlarında İçerik Kontrolü". (2021), 243-252. https://doi.org/10.30855/gmbd.2021.03.07
APA Tuncer I, KESKİN Ş, APAYDIN M (2021). İşin Olsun Platformu İlanlarında İçerik Kontrolü. Gazi Mühendislik Bilimleri Dergisi, 7(3), 243 - 252. 10.30855/gmbd.2021.03.07
Chicago Tuncer Işılay,KESKİN Şeref,APAYDIN MEHMET SERKAN İşin Olsun Platformu İlanlarında İçerik Kontrolü. Gazi Mühendislik Bilimleri Dergisi 7, no.3 (2021): 243 - 252. 10.30855/gmbd.2021.03.07
MLA Tuncer Işılay,KESKİN Şeref,APAYDIN MEHMET SERKAN İşin Olsun Platformu İlanlarında İçerik Kontrolü. Gazi Mühendislik Bilimleri Dergisi, vol.7, no.3, 2021, ss.243 - 252. 10.30855/gmbd.2021.03.07
AMA Tuncer I,KESKİN Ş,APAYDIN M İşin Olsun Platformu İlanlarında İçerik Kontrolü. Gazi Mühendislik Bilimleri Dergisi. 2021; 7(3): 243 - 252. 10.30855/gmbd.2021.03.07
Vancouver Tuncer I,KESKİN Ş,APAYDIN M İşin Olsun Platformu İlanlarında İçerik Kontrolü. Gazi Mühendislik Bilimleri Dergisi. 2021; 7(3): 243 - 252. 10.30855/gmbd.2021.03.07
IEEE Tuncer I,KESKİN Ş,APAYDIN M "İşin Olsun Platformu İlanlarında İçerik Kontrolü." Gazi Mühendislik Bilimleri Dergisi, 7, ss.243 - 252, 2021. 10.30855/gmbd.2021.03.07
ISNAD Tuncer, Işılay vd. "İşin Olsun Platformu İlanlarında İçerik Kontrolü". Gazi Mühendislik Bilimleri Dergisi 7/3 (2021), 243-252. https://doi.org/10.30855/gmbd.2021.03.07