Yıl: 2018 Cilt: 17 Sayı: 2 Sayfa Aralığı: 1096 - 1115 Metin Dili: Türkçe İndeks Tarihi: 14-02-2020

Uluslararası Öğrenci Değerlendirme Programı (PISA-2012) Okuryazarlık Testlerinin Ölçme Değişmezliğinin İncelenmesi

Öz:
Bu araştırma ile PISA-2012 matematik ve fen okuryazarlığı ile okuma becerileri alt testlerinin dildeğişkenine göre ölçme değişmezliğinin incelenmesi amaçlanmıştır. Araştırma tarama modelinde betimselbir araştırma olması ile birlikte PISA 2012 uygulamasına katılan Avustralya, Fransa, Şangay-Çin ve Türkiyeörneklemlerinde 3 no’lu kitapçığı (yayınlanan maddelerin en fazla sayıda ve üç alandan da maddelerinbulunduğu tek kitapçık) alan 2149 öğrenciden elde edilen veriler üzerinden yürütülmüştür. Testlerin farklıdil formlarına ilişkin, faktör yapılarının değişmezliği Çok Gruplu Doğrulayıcı Faktör Analizi (ÇGDFA) ilemaddelerin değişen madde fonksiyonu gösterme durumları ise Genelleştirilmiş Aşamalı DoğrusalModelleme (GADM), Simultaneous Item Bias Test (SIBTEST) ve Madde Tepki Kuramı'na dayalı OlabilirlikOran (MTK-OO) teknikleri ile incelenmiştir. İstatistiksel yöntemlerin yanı sıra olası yanlılık kaynaklarıuzman görüşleri doğrultusunda belirlenmiştir. Her üç alt test için yapılan ÇGDFA sonuçlarına göre, testlerindil değişkenine göre yapısal değişmezlik gösterdiği ancak metrik değişmezlik göstermediği belirlenmiştir.Değişen madde fonksyonu (DMF) analiz sonuçları değerlendirilirken her üç DMF belirleme tekniğine göreve en az B düzeyinde DMF gösteren maddeler DMF'li kabul edilmiştir. Buna göre matematik ve fenokuryazarlığı ile okuma becerileri testlerinde dil değişkenine göre, DMF’li olarak kabul edilen maddelersırasıyla testlerin ortalama %35’i, %34’ü ve %22’sini oluştururken, ölçme değişmezliği gösteren maddelersırasıyla testlerin %24’ü, %7’si ve %36’sını oluşturmaktadır. Her üç alanda da en fazla DMF’li madde,İngilizce ve Çince formu alan gruplar arasında belirlenmiştir. Yanlılık çalışması sonuçlarına göre olasıyanlılık kaynakları; maddede yer alan sözcük ya da ifadelerin farklı anlamda kullanımı, madde içeriğine birdil grubunun aşina olması ve çeviriye bağlı olarak maddelerin farklılaşması olarak belirlenmiştir.
Anahtar Kelime:

Konular: Biyoloji Eğitim, Eğitim Araştırmaları

Investigation of Measurement Invariance Of Literacy Tests In The Programme For International Student Assessment (PISA-2012)

Öz:
. In this study, it was aimed at examining the measurement invariance of mathematical and science literacy tests and subtests of reading skills of PISA – 2012 in terms of the language variable. The research was designed as a descriptive study. The study was conducted on the data obtained from the test booklet-3 of PISA 2012 (it is the only booklet that had the highest number of items published and also had items from all of the three parts) which was responded by 2149 students from Australia, France, Shanghai – China and Turkey. The invariance of factor structures was examined by Multi-Group Confirmatory Factor Analysis (MGCFA) while the differential item functioning (DIF) was examined by Hierarchical Generalized Linear Modeling (HGLM), Simultaneous Item Bias Test (SIBTEST) and Likelihood Ratio (LR) based on Item Response Theory (IRT) in relation to language forms of the tests. In addition to this, experts’ opinions were asked in order to determine the possible bias sources. According to MGCFA results, PISA – 2012 mathematical and science literacy and subtests of reading skills demonstrated structural invariance while there was no metric invariance. The items which demonstrated at least B level DIF according to all three DIF technique results were accepted as showing DIF. According to DIF analyses, the DIF items comprised of 35%, 34% and 22% of mathematical and science literacy tests and subtests of reading skills respectively while the items showing measurement invariance comprised of 24%, 7% and 36% of the tests in terms of language variable. The highest number of DIF items in all three parts was determined between the groups that took English and Chinese forms. As a result of bias analysis, some possible bias sources were as follows; using the words or phrases in different meanings in the items, being familiar to the item content in favor of a language group and the differentiation of the items depending on the translation.
Anahtar Kelime:

Konular: Biyoloji Eğitim, Eğitim Araştırmaları
Belge Türü: Makale Makale Türü: Araştırma Makalesi Erişim Türü: Erişime Açık
  • Abbott, M.L. (2007). A confirmatory approach to differential item functioning on an esl reading assessment. Language Testing, 24(1), 7–36 http://ltj.sagepub.com/content/24/1/7 adresinden alınmıştır.
  • Acar, T. (2008). Maddenin farklı fonksiyonlaşmasını belirlemede kullanılan genelleştirilmiş aşamalı doğrusal modelleme, lojistik regresyon ve olabilirlik oranı tekniklerinin karşılaştırılması (Yayımlanmamış doktora tezi). Hacettepe Üniversitesi, Ankara.
  • American Educational Research Association, American Psychological Association, National Council on Measurement in Education [AERA/APA/NCME]. (1999). Standards for educational and psychological testing. Washington, DC: American Psychological Association.
  • Anderson, J., A. (2005). Accountability in Education. Education Policy series Vol. 1. Unesco International Academy of Education, International Institute for Educational Planing. http://unesdoc.unesco.org/images/0014/001409/140986e.pdf adresinden alınmıştır
  • Atalay, K., Gök, B., Kelecioğlu, H. ve Arsan, N. (2012). Değişen madde fonksiyonunun belirlemesinde kullanılan farklı yöntemlerin karşılaştırılması bir simülasyon çalışması. Hacettepe Üniversitesi Eğitim Fakültesi Dergisi, 43: 270-281
  • Brown, T. A. (2006). Confirmatory factor analysis for applied research. New York: The Guilford Press.
  • Breakspear, S. (2012), The policy impact of PISA: An exploration of the normative effects of international benchmarking in school system performance. OECD Education Working Papers, 71, OECD Publishing. http://dx.doi.org/10.1787/5k9fdfqffr28-en adresinden
  • Bakan Kalaycıoğlu, D. ve Berberoğlu, G. (2010). Differential item functioning analysis of the science and mathematics items in the university entrance examinations in Turkey. Journal of Psychoeducational Assessment, 20, 1-12.
  • Baş, H. (2005). Hesap verme sorumluluğu ve kamu yönetimi ve kontrol kanunu, 20. Türkiye Maliye Sempozyumu Türkiye’de Yeniden Mali Yapılanma (23-27 Mayıs). Pamukkale Üniversitesi, İktisadi Ticari Bilimlşer Fakültesi’nde sunulan bildiri.
  • Camilli, G. and Shepard, L. A. (1994). Methods for identifying biased test items. Thousand Oaks, CA: Sage.
  • Cheung, G. W. and Rensvold, R. B. (2000). Assessing extreme and acquiescence response sets in crosscultural research using structural equations modeling. Journal of Cross-cultural Psychology, 31(2), 188-213.
  • Çet, S. (2006). A Multivariate analysis ın detectıng differentially functioning items through the use of programme for international student assessment (PISA) 2003 mathematıcs literacy items (Yayınlanmamış doktora tezi). Ortadoğu Teknik Üniversitesi, Ankara
  • Çepni, Z. (2011). Degişen madde fonksiyonlarının SIBTEST, Mantel Haenszel, Lojistik Regresyon ve Madde Tepki Kuramı yöntemleriyle incelenmesi (Yayımlanmamış doktora tezi). Hacettepe Üniversitesi, Ankara.
  • Demirtaşlı, R. N. (2014). Öğrenme, öğretim ve değerlendirme arasındaki ilişkiler. N. Demirtaşlı (Ed), Eğitimde Ölçme ve Değerlendirme İçinde (2. Baskı) (3-29). Edge Akademi: Ankara
  • Drasgow, F. and Kanfer, R. (1985). Equivalence of psychological measurement in heterogeneous populations. Journal of Applied Psychology, 70(4), 662-680.
  • Embretson, S.E. and Reise, S. (2000). Item response theory for psychologists. Mahwah, NJ: Erlbaum Publishers.
  • Figazzolo, L. (2008). Impact of PISA 2006 on the Education Policy Debate Education International.???http://download.eiie.org/docs/IRISDocuments/Research%20Website%20Docu ments/2009-00036-01-E.pdf adresinden alınmıştır.
  • Gierl, M.J. (2000). Construct equivalence on translated achievement tests. Canadian Journal of Education, 25(4), 280-296.
  • Gierl, M. H., Khaliq, S. N. and Boughton, K. (1999). Gender differential item functioning in mathematics and science: prevalence and policy implications. Paper presented at the Annual Meeting of the Canadian Society for the Study of Education, Canada
  • Gök, B., Kelecioglu, H. ve Doğan, N. (2010). Değişen madde fonksiyonunu belirlemede Mantel-Haenzsel ve lojistik regresyon tekniklerinin karşılaştırılması. Egitim veBilim, 35, 3-16
  • .Grisay, A. and Monseur, C. (2007). Measuring the equivalence of ıtem difficulty in the various versions of an ınternational test. Studies in Educational Evaluation,33, 69- 86.http://www.sciencedirect.com/science/article/pii/S0191491X07000077?# adresinden alınmıştır.
  • Hambleton, R. K. (2006). Good practices for ıdentifying differential ıtem functioning. Medical Care, 44, 182- 188.
  • Hambleton, R.K., and Swaminathan, H. (1989). Item response teory: principles and applications. USA: Kluwer Nijhoff Publishing.
  • Hofmann, D. A., Griffin, M. A., & Gavin, M. A. (2000). The application of hierarchical linear modeling to organizational research. In K. J. Klein & S. W. J. Kozlowski (Eds.), Multilevel Theory, Research, and Methods In Organizations: Foundations,Extensions And New Directions. San Francisco, CA: JosseyBass Inc.
  • Hopkins, D., Pennock, D., Ritzen, J., Ahtaridou, E. and Zimmer, K. (2008). External evaluation of the policy impact of PISA. OECD doc. EDU/PISA/GB(2008)35/REV1. Paris:OECD.
  • Hu, L. ve Bentler, P. (1995). Evaluating Model Fit. R. Hoyle (Ed). Structural equation modeling (pp. 76-99). Concepst, Issues and Application. Thousand Oasks: SagePublications. International Test Commission (2005). International test commission guidelines for test adaptation. London: Author.
  • Johnson, T. P. (1998). Approaches to Equivalence in Cross-Cultural and Cross-National Survey Research. ZUMA-Nachrichten Spezial, 1-40. http://www.ssoar.info/ssoar/handle/document/49730 adresinden alınmıştır.
  • Kamata, A. (2001). Item Analysis by the hierarchical generalized linear model. Journal of Educational Measurement, 38(1), 79-93.
  • Kamata, A., Chaimongkol, S., Genç, E. and Bilir, K. (2005).Random-effect differential ıtem functioning across group unites by the hierarchical generalized linear model. This paper was presented at the annual meeting of the American Educational Research Association, Montreal, Canada http://garnet.acns.fsu.edu/~akamata/papers/AERA%202005.pdf adresinden alınmıştır.
  • Kankaras, M. and Moors, G. (2014). Analysis of cross-cultural comparability of PISA 2009 scores. Journal of Cross-Cultural Psychology, 45(3) 381–399. http://jcc.sagepub.com/content/45/3/381.full.pdf+html adresinden alınmıştır.
  • Karasar, N (2011). Bilimsel araştırma yöntemi. Ankara: Nobel Yayın Dağıtım
  • Kim, W. (2003). Development of a differential item functioning (dif) procedure using the hierarchical generalized linear model: A comparison study with logistic regression procedure (doctoral dissertation). The Pennsylvania State University, Pennsylvania.
  • Le, L.T. (2009). Investigating gender differential item functioning across countries and test languages for PISA science items. International Journal of Testing,9(2), 122-133.
  • Luppescu, S. (2002). DIF detection in HLM. Paper Presented at The Annual Meeting of The American Educational Research Association, New Orleans.
  • OECD (2014). PISA 2012 technical report. Paris: OECD Publications. http://www.oecd.org/pisa/pisaproducts/PISA-2012-technical-report-final.pdf adresinden alınmıştır.
  • Osterlind, S., J. and Everson, H., T. (2009). Differential item functioning. (2nd). Thousand Oaks. CA: SAGE Publications, Inc. doi: http://dx.doi.org/10.4135/9781412993913
  • Pan, T. (2008). Using the multivariate multilevel logistic regression model to detect dif: A comparison with Hglm and Logistic Regression dif detection methods (Doctoral dissertation) Michigan State University, Michigan.
  • Prelow, H. M., Tein, J.Y., Roosa, M. W. & Wood, J. (2000). Do Coping Styles Differ Across Sociocultural Groups? The Role of Measurement Equivalence in Making This Judgment. American Journal of Community Psychology, 28(2), 225-244. Web: http://www.springerlink.com/media adresinden alınmıştır.
  • Raudenbush, S.W. and Bryk, A.S. (2002). Hierarchical linear models (2nd ed.). Newbury Park, CA: Sage.
  • Raju, N. S., Laffitte, L. J. and Byrne, B. M. (2002). Measurement equivalence: a comparison of methods based on confirmatory factor analysis and item response theory. Journal of Applied Psychology, 87(3), 527- 529.
  • Reise, S.P., Widaman, K.F., and Pugh, R.H. (1993). Confirmatory factor analysis and ıtem response theory: two approaches for exploring measurement equivalence. Psychological Bulletin, 114, 552-566.
  • Rensvold, R. B.,& Cheung, G. W. (1998). Testing Measurement Models for Factorial Invariance: A Systematic Approach. Educational and Psychological Measurement, 58, 1017-1034.
  • Sireci, S. G. and Swaminathan, H. (1996). Evaluating translation equivalence: So what’s the big dif?Paper Presented at the Annual Meeting of the NortheasternEducational Research Association, Ellenville, NY.
  • Şencan, H. (2005). Sosyal ve davranışsal ölçümlerde güvenirlik ve geçerlilik. Ankara: Seçkin Yayınları
  • Şimşek, Ö. F. (2007). Yapısal eşitlik modellemesine giriş:Temel ilkeler ve LISREL uygulamaları. Ankara: Ekinoks
  • Stark, S., Chernyshenko, O. S. and Drasgow, F. (2006). Detecting differential ıtem functioning with comfirmatory factor analysis and ıtem response theory: Toward A Unified Strategy. Journal of Applied Psychology, 91(6), 1292- 1306.
  • Tabachnick, B. G. and Fidell, L. S. (2007). Using multivariate statistics. Fifth Edition. Pearson: AB
  • Ulutaş, S. (2015). A study on detecting of differential item functioning of PISA 2006 science literacy items in Turkish and American samples. Eurasian Journal of Educational Research, 58, 41-60
  • Vandenberg, R. J. and Lance, C. E. (2000). A review and synthesis of the MI literature: suggestions, practices, and recommendations for organizational research. Organizational Research Methods, 3, 4-69.
  • Yıldırım, H. H. (2006). The differential İtem functioning (dif) analysis of mathematics İtems in the İnternational assessment programs. (Doctoral dissertation). Middle East Technical University, Ankara
  • Yıldırım, H., H. and Berberoğlu, G. (2009). Judgmental and statistical dİf analyses of the PISA-2003 mathematics literacy items. International Journal of Testing, 9, 108–121
  • Wendorf, C. A. (2002). Comparisons of structural equation modeling and hierarchical linear modeling approaches to couples' data. Structural Equation Modeling, 9, 126 - 140.
  • Wu, A. D., Li, Z. and Zumbo, B. D. (2007). Decoding the meaning of factorial ınvariance and updating the practice of multigroup confirmatory factor analysis: a demonstration with TIMSS data. Practical Assessment, Research and Evaluation, 12, 1-26.
APA KARAKOÇ ALATLI B, ÇOKLUK BÖKEOĞLU Ö (2018). Uluslararası Öğrenci Değerlendirme Programı (PISA-2012) Okuryazarlık Testlerinin Ölçme Değişmezliğinin İncelenmesi. , 1096 - 1115.
Chicago KARAKOÇ ALATLI Betül,ÇOKLUK BÖKEOĞLU ÖMAY Uluslararası Öğrenci Değerlendirme Programı (PISA-2012) Okuryazarlık Testlerinin Ölçme Değişmezliğinin İncelenmesi. (2018): 1096 - 1115.
MLA KARAKOÇ ALATLI Betül,ÇOKLUK BÖKEOĞLU ÖMAY Uluslararası Öğrenci Değerlendirme Programı (PISA-2012) Okuryazarlık Testlerinin Ölçme Değişmezliğinin İncelenmesi. , 2018, ss.1096 - 1115.
AMA KARAKOÇ ALATLI B,ÇOKLUK BÖKEOĞLU Ö Uluslararası Öğrenci Değerlendirme Programı (PISA-2012) Okuryazarlık Testlerinin Ölçme Değişmezliğinin İncelenmesi. . 2018; 1096 - 1115.
Vancouver KARAKOÇ ALATLI B,ÇOKLUK BÖKEOĞLU Ö Uluslararası Öğrenci Değerlendirme Programı (PISA-2012) Okuryazarlık Testlerinin Ölçme Değişmezliğinin İncelenmesi. . 2018; 1096 - 1115.
IEEE KARAKOÇ ALATLI B,ÇOKLUK BÖKEOĞLU Ö "Uluslararası Öğrenci Değerlendirme Programı (PISA-2012) Okuryazarlık Testlerinin Ölçme Değişmezliğinin İncelenmesi." , ss.1096 - 1115, 2018.
ISNAD KARAKOÇ ALATLI, Betül - ÇOKLUK BÖKEOĞLU, ÖMAY. "Uluslararası Öğrenci Değerlendirme Programı (PISA-2012) Okuryazarlık Testlerinin Ölçme Değişmezliğinin İncelenmesi". (2018), 1096-1115.
APA KARAKOÇ ALATLI B, ÇOKLUK BÖKEOĞLU Ö (2018). Uluslararası Öğrenci Değerlendirme Programı (PISA-2012) Okuryazarlık Testlerinin Ölçme Değişmezliğinin İncelenmesi. İlköğretim Online (elektronik), 17(2), 1096 - 1115.
Chicago KARAKOÇ ALATLI Betül,ÇOKLUK BÖKEOĞLU ÖMAY Uluslararası Öğrenci Değerlendirme Programı (PISA-2012) Okuryazarlık Testlerinin Ölçme Değişmezliğinin İncelenmesi. İlköğretim Online (elektronik) 17, no.2 (2018): 1096 - 1115.
MLA KARAKOÇ ALATLI Betül,ÇOKLUK BÖKEOĞLU ÖMAY Uluslararası Öğrenci Değerlendirme Programı (PISA-2012) Okuryazarlık Testlerinin Ölçme Değişmezliğinin İncelenmesi. İlköğretim Online (elektronik), vol.17, no.2, 2018, ss.1096 - 1115.
AMA KARAKOÇ ALATLI B,ÇOKLUK BÖKEOĞLU Ö Uluslararası Öğrenci Değerlendirme Programı (PISA-2012) Okuryazarlık Testlerinin Ölçme Değişmezliğinin İncelenmesi. İlköğretim Online (elektronik). 2018; 17(2): 1096 - 1115.
Vancouver KARAKOÇ ALATLI B,ÇOKLUK BÖKEOĞLU Ö Uluslararası Öğrenci Değerlendirme Programı (PISA-2012) Okuryazarlık Testlerinin Ölçme Değişmezliğinin İncelenmesi. İlköğretim Online (elektronik). 2018; 17(2): 1096 - 1115.
IEEE KARAKOÇ ALATLI B,ÇOKLUK BÖKEOĞLU Ö "Uluslararası Öğrenci Değerlendirme Programı (PISA-2012) Okuryazarlık Testlerinin Ölçme Değişmezliğinin İncelenmesi." İlköğretim Online (elektronik), 17, ss.1096 - 1115, 2018.
ISNAD KARAKOÇ ALATLI, Betül - ÇOKLUK BÖKEOĞLU, ÖMAY. "Uluslararası Öğrenci Değerlendirme Programı (PISA-2012) Okuryazarlık Testlerinin Ölçme Değişmezliğinin İncelenmesi". İlköğretim Online (elektronik) 17/2 (2018), 1096-1115.