Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir

Bademci, Vahit

Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir

Vahit BADEMCİ (Gazi Üniversitesi, Endüstriyel Sanatlar Eğitim Fakültesi, Eğitim Bilimleri Bölümü, Ankara, Türkiye)

İnönü Üniversitesi Eğitim Fakültesi Dergisi

172 69

Yıl: 2006 Cilt: 7 Sayı: 12 Sayfa Aralığı: 3 - 26 Metin Dili: Türkçe İndeks Tarihi: 29-07-2022

Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir

Öz:

Güvenirlik, aracın kendisine değil, bir ölçme aracıyla elde edilmiş ölçümlere (veya sonuçlara) işaret eder. Güvenirlik testin kendisinin değil, eldeki veriler veya ölçümlerin bir özelliğidir. Böylelikle, “testin güvenirliği” veya “aracın güvenirliği” ya da “test güvenilirdir” diye ifade etmek doğru değildir. Zira ölçümler güvenilir veya güvenilir değildir. Basit şekliyle, testler güvenilir değildir. Cronbach’ın (1951) alfa katsayısı yöntemi, ölçüm güvenirliği kestirimi için kullanılmaktadır. Alfa katsayısı değişik faktörler tarafından etkilenmektedir. Örneğin, toplam test ölçüm varyansı, alfa katsayısı üzerinde en büyük etkiye sahiptir. Böylece, toplam test ölçümlerinin varyansı, madde varyansları toplamından daha küçükse, sonrasında Cronbach’ın alfa katsayısı negatif olabilecektir. Matematiksel olarak, Cronbach alfa, negatif ve “–1”’den küçük olabilir.

Anahtar Kelime: ölçüm güvenirliği ölçme ve değerlendirme güvenirlik test güvenirliği

Konular: Eğitim, Eğitim Araştırmaları

To understand reliability properly and to overthrow some cliches: contrary to the known facts,cronbach's coefficent alpha can be negative and smaller than “–1”

Öz:

Reliability refers to the scores (or results) obtained with an measurement instrument and not to the instrument itself. Reliability is a characteristic of scores or the data in hand, not of the test itself. Thus, it is incorrect to speak of “the reliability of the test” or “the reliability of the instrument” or “the test is reliable.” Because, it is the scores that are reliable or unreliable. Simply, tests are not reliable. Cronbach’s (1951) coefficient alpha method is used for estimating score reliability. Coefficient alpha is affected by various factors. For example, total test score variance has the biggest effect on coefficient alpha. Thus, if the variance of total test scores is less than the the sum of the item variances, then Cronbach’s coefficient alpha will be negative. Mathematically, Cronbach’s alpha can be negative and smaller than” –1”

Anahtar Kelime: test reliability score reliability measurement and evaluation reliability

Konular: Eğitim, Eğitim Araştırmaları

Belge Türü: Makale Makale Türü: Araştırma Makalesi Erişim Türü: Erişime Açık

Aiken, L. S. ve Arkadaşları (1990). Graduate training in statistics, methodology, and measurement in psychology: A survey of PhD programs in North America. American Psychologist, Vol. 45, 721–734. Akdeniz, C., Aydemir, Ö., Akdeniz, F., Gülseren, Ş. ve Kültür, S. (1999). Sağlık düzeyi ölçeği’nin Türkçe’ye uyarlanması ve güvenilirliği. Klinik Psikofarmakoloji Bülteni, Cilt 9 (2), 104–108. Allen, M. J. ve Yen, W. M. (1979). Introduction to measurement theory. Monterey, California: Brooks/Cole Anıl, D. ve Arkadaşları. (2003). Öğretmen adayları için tamamı konu anlatımlı KPSS. Ankara: Çağdaş Öğretmen Yayınları Arnold, M. E. (1996). Influences on and limitations of classical test theory reliability estimates. (ERIC Document Reproduction Service No. ED 395 950). Aygin, D. ve Eti Aslan, F. (2005). Kadın cinsel işlev ölçeği’nin Türkçeye uyarlanması. Türkiye Klinikleri Tıp Bilimleri Dergisi, Cilt 25 (3), 393–399. Bademci, V. (2006). Paradigma değişikliği: Testler güvenilir değildir. Düzenleyen: G.Ü. Endüstriyel Sanatlar Eğitim Fakültesi Dekanlığı. Ankara: G.Ü. Mesleki Eğitim Fakültesi Konferans Salonu, 28 Nisan. [Konferansla ilgili haber için; Gazi Haber, Nisan 2006, Sayı:66, Sayfa 64]. Bademci,V. (2005a). Araştırmalarda ölçme ile ilgili bazı büyük hataları düzeltmek ve bir reformu başlatmak: Güvenirlik, testlerin bir özelliği değildir. Eğitim Fakültelerinde Yeniden Yapılandırmanın Sonuçları ve Öğretmen Yetiştirme Sempozyumunda Sunulan Bildiri. Ankara: Gazi Üniversitesi, Gazi Eğitim Fakültesi, 22–24 Eylül. Bademci, V. (2005b). Testler güvenilir değildir: Ölçüm güvenirliğine yeterli dikkat ve güvenirlik çalışmaları için örneklem büyüklüğü. Gazi Üniversitesi Endüstriyel Sanatlar Eğitim Fakültesi Dergisi, Sayı 17, 33–45. Bademci, V. (2005c). Hakemlerin değerlendirmelerindeki hatalar üzerine: Fisher’in Z dönüşümü ve güvenirlik çalışmaları için örneklem büyüklüğü. Gazi Üniversitesi Endüstriyel Sanatlar Eğitim Fakültesi Dergisi, Sayı 17, 46–75. Bademci, V. (2005d). Araştırmalarda ölçme ile ilgili bazı büyük hataları düzeltmek ve eğitimde yeniden yapılanmayı sürdürmek: Güvenirlik, testlerin bir özelliği değildir. Yayına Hazırlanmış Makale. (28 sayfa). Bademci, V. (2004). Testin güvenirliği veya test güvenilirdir diye ifade etmek doğru değildir. Türk Eğitim Bilimleri Dergisi, Cilt 2 (3), 367–372. Bademci, V. (2002). Türkiye’deki okullar ne işe yarar? Türkiye’nin anomi, yabancılaşma, ekonomik büyüme, demokratikleşme sorunlarına çözüm önerisi.” Düzenleyen: ESEF Öğrenci Bilimsel Faal. Org. Kom. Ankara: G.Ü. Mesleki Eğitim Fakültesi Konferans Salonu, 30 Mayıs. Bademci, V. (2001a). Türkiye’deki okullar ne işe yarar? Düzenleyen: Çayyolu Türk Telekom Anadolu Teknik L. Ankara: Başkent Öğretmenevi Konferans Salonu, 9 Aralık. Bademci, V. (2001b). Düşünmenin öğretilmesi ve öğretimde kullanılan yöntemler– teknikler. Düzenleyen: TÜRMOB. Bursa: Bursa SMMM Odası Konferans Salonu, 9 Kasım. Bademci, V. (1999). Hedefin davranışlara çevrilmesi, Davranışlardan seçmeli test maddeleri yazılması. (Geliştirilmiş Üçüncü Baskı). Ankara: Gazi Kitabevi. Baugh, F. (2002).Correcting effect sizes for score reliability: A reminder that measurement and substantive issues are linked inextricably. Educational and Psychological Measurement, Vol. 62, 254-263. Baykul, Y. (2001). İlköğretimde ölçme ve değerlendirme. Ankara: T.C. MEB Projeler Koordinasyon Merkezi Başkanlığı. Baykul, Y. (2000). Eğitimde ve psikolojide ölçme: Klasik test teorisi ve uygulaması. Ankara: ÖSYM. Buhi, E. R. (2005). Reliability reporting practices in rape myth research. Journal of School Health, Vol. 75 (2), 63-66. Büyüköztürk, Ş. (2004). Sosyal bilimler için veri analizi el kitabı. (Dördüncü Baskı). Ankara: PegemA. Büyüköztürk, Ş. (2005). Sosyal bilimler için veri analizi el kitabı. (Gözden Geçirilmiş 5. Baskı). Ankara: PegemA. Capraro, M. M., Capraro, R. M. ve Henson, R. K. (2001). Measurement error of scores on the Mathematics anxiety rating scale across studies. Educational and Psychological Measurement, Vol. 61, 373-386. Capraro, R. M. ve Capraro, M. M. (2002). Myers-Briggs type indicator score reliability across studies: A meta-analytic reliability generalization study. Educational and Psychological Measurement, Vol.62, 590-602. Caruso, J. C. (2000). Reliability generalization of the neo personality scales. Educational and Psychological Measurement, Vol.60, 236-254. Cousin, S. L. ve Henson, R. K. (2000). What is reliability generalization, and why is it important? (ERIC Document Reproduction Service No. ED 445 077). Crocker, L. ve Algina, J. (1986). Introduction to classical and modern test theory. fort worth: Holt, Rinehart and Winston. Cronbach, L. J.(1951). Coefficient alpha and the internal structure of tests. Psychometrika, Vol. 16, 297-334. Dawis, R. V. (1987). Scale construction. Journal of Counseling Psychology, Vol. 34, 481-489. Dawson, T. E. (1997). Basic concepts in classical test theory: Relating variance partitioning in substantive analyses to the same process in measurement analyses. (ERIC Document Reproduction Service No. ED 406 443). Ebel, R. L. (1972). Essential of educational measurement. (Second Edition). Englewood Cliffs, New Jersey: Prentice- Hall, Inc. Ebel, R. L. ve Frisbie, D. A. (1991). Essentials of educational measurement. (Fifth Edition). Englewood Cliffs, New Jersey: Prentice Hall. Erkuş, A. (2003). Psikometri üzerine yazılar. (1. Basım). Ankara: Türk Psikologlar Derneği Yayınları, 24. Flanders, N. A., Anderson, J. P. ve Amidon, E. J. (1961). Measuring dependence proneness in the classroom. Educational and Psychological Measurement, Vol. 21, 575-587. Gelbal, S. (2002). Ölçme ve değerlendirme. Öğretmen adayları için konu anlatımlı KMS. (Beşinci Baskı). Ö. Demirel ve diğerleri. Ankara: Pegem A. Gelbal, S. (1999). Öğrenci başarısının ölçülmesinde ölçme ve değerlendirme teknikleri. Cumhuriyet Döneminde Eğitim II. Ankara: T.C. MEB Talim ve Terbiye Kurulu Başkanlığı. Gronlund, N. E. ve Linn, R. L. (1990). Measurement and evaluation in teaching. (Sixth Edition). New York: Macmillan. Gronlund, N. E. (1965). Measurement and evaluation in teaching. New York: Macmillan.Guilford, J. P. ve Fruchter, B. (1973). Fundamental statistics in psychology and education. (Fifth Edition). New York: McGraw-Hill. Guthrie, A. C. (2000). A review of coefficient alpha and some basic tenets of classical measurement theory. (ERIC Document Reproduction Service No. ED 438 307). Gürsoy, F., Aral, N., Bütün Ayhan, A. ve Aydoğan, Y. (2004). Annesi çalışan ve çalışmayan çocukların bağımlılık eğilimlerinin incelenmesi. Hacettepe Üniversitesi Eğitim Fakültesi Dergisi, Sayı 26, 62–71. Helms, L. S. (1999). Basic concepts in classical test theory: Tests aren’t reliable, the nature of alpha, and reliability generalization as meta-analytic method. (ERIC Document Reproduction Service No. ED 427 083). Helmstadter, G. C. (1964). Principles of psychological measurement. New York: Appleton-Century-Crofts. Henson, R. K. (2000a). A Primer on Coefficient Alpha. (ERIC Document Reproduction Service No. ED 447 210). Henson, R. K. (2000b). Sacrificing reliability and exalting sampling error at the altar of parsimony: Some cautions concerning short-form test development. (ERIC Document Reproduction Service No. ED 447 211). Henson, R. K. (2001). Understanding internal consistency reliability estimates: A conceptual primer on coefficient alpha. Measurement and Evaluation in Counseling and Development, Vol. 34, 177-189. Henson, R. K. ve Thompson, B. (2002). Characterizing measurement error in scores across studies: Some recommendations for conducting reliability generalization studies. Measurement and Evaluation in Counseling and Development, Vol. 35, 113-126. Henson, R. K., Kogan, L. R. ve Vacha-Haase, T. (2001). A reliability generalization study of the teacher efficacy scale and related instruments. Educational and Psychological Measurement, Vol.61, 404-420. Kieffer, K. M. (1999). Why reliability theory is essential and classical test theory is often inadequate. Advances in Social Science Methodology, Volume 5. Ed. B. Thompson. Stamford, Connecticut: JAI. Lane, G. G., White, A. E. ve Henson, R. K. (2002). Expanding reliability generalization methods with kr-21 estimates: An RG study of coopersmith self-esteem inventory. Educational and Psychological Measurement, Vol.62, 685-711. Linn, R. L. ve Miller, M.D. (2005). Measurement and assessment in teaching. (Ninth Edition). Upper Saddle River, New Jersey: Pearson. Linn, R. L. ve Gronlund, N. E. (2000). Measurement and assessment in teaching. (Eighth Edition). Upper Saddle River, New Jersey: Merrill. Livingston, S. A. (1988). Reliability of test results. Educational Research, Methodology, And Measurement: An International Handbook. Ed. John P.Keeves. Oxford: Pergamon. Lord, F. M. ve Novick, M. R. (1968). Statistical theories of mental test scores. reading, Massachusetts:Addison-Wesley. McDonald, R. P. (1999). Test theory: A unified treatment. Mahwah, New Jersey: Lawrence Erlbaum. Mehrens, W. A. ve Lehmann, I. J. (1991). Measurement and evaluation in education and psychology. (Fourth Edition). Fort Worth: Harcourt Brace. Meier, S. T. ve Davis, S. R. (1990). Trends in reporting psychometric properties of scales used in counseling psychology research. Journal of Counseling Psychology, Vol. 37, 113-115. Mittag, K. C. ve Thompson, B.(2000). A national survey of AERA members’ perceptions of statistical significance tests and other statistical issues. Educational Researcher, May, 14-20. Nunnally, J. C. (1982). Reliability of measurement. Encylopedia of educational research. (Fifth Edition). Ed. H.E.Mitzel. New York: The Free Press. Nunnally, J. C. ve Bernstein, I. H. (1994). Psychometric theory. (Third Edition). New York: McGraw-Hill. Onwuegbuzie, A. J. ve Daniel, L. G. (2000). Reliability generalization: The importance of considering sample specificity, confidence interval, and subgroup differences. (ERIC Document Reproduction Service No. ED 448 204). Öncü, H. (1997). Eğitimde ölçme ve değerlendirme. Eğitim bilime giriş. Ed. L. Küçükahmet. Ankara: Gazi Kitabevi. Özçelik, D. A. (1989). Test hazırlama kılavuzu.(Genişletilmiş İkinci Baskı). Ankara: ÖSYM Eğitim Yayınları,5. Özdamar, K. (2004). Paket programlar ile istatiksel veri analizi-1. (Genişletilmiş 5. Baskı). Eskişehir : Kaan. Pedhazur, E. J. ve Schmelkin, L. P. (1991). Measurement, design, and analysis: An integrated approach. Hillsdale, New Jersey: Lawrence Erlbaum.
Reinhardt, B. (1996). Factors affecting coefficient alpha: A mini monte carlo study. Advances in Social Science Methodology, Volume 4. Ed. B. Thompson. Greenwich, Connecticut: JAI. Rowley, G. R. (1976). The reliability of observational measures. American Educational Research Journal, Vol.13, 51-59. Shields, A. L. ve Caruso, J. C. (2004). A reliability induction and reliability generalization study of the cage questionnaire. Educational and Psychological Measurement, Vol. 64, 254-270. Suen, H. K. (1990). Principles of test theories. Hillsdale, New Jersey: Lawrence- Erlbaum. Tan, Ş. ve Erdoğan, A. (2004). Öğretimi planlama ve değerlendirme. (Genişletilmiş 5.Baskı). Ankara: PegemA. Tekin, H. (1982). Eğitimde ölçme ve değerlendirme. (Üçüncü Baskı). Ankara: Daily News Web Ofset Tesisleri. Thompson, B. (2001). Significance, effect sizes, stepwise methods and other issues: Strong arguments move the field. The Journal of Experimental Education, Vol. 70, 80-93. Thompson, B. (1999). Five methodology errors in educational research: A pantheon of statistical significance and other Faux Pas. Advances in Social Science Methodology, Volume 5. Ed. B. Thompson. Stamford, Connecticut: JAI. Thompson, B. (1994a). Guidelines for authors. Educational and Psychological Measurement, Vol.54, 834-47. Thompson, B. (1994b). It is incorrect to Say “The test is reliable”: Bad language habits can contribute to incorrect or meaningless research conclusions. (ERIC Document Reproduction Service No. ED 367 707). Thompson, B. (1992). Two and one-half decades of leadership in measurement and evaluation. Journal of Counseling and Measurement, Vol. 70,434-438. Thompson, B. (1991). Review of generalizability theory: A Primer by Richard J. Shavelson and Noreen M. Webb. Educational and Psychological Measurement, 51, 1069-1075. Thompson, B. ve Vacha-Haase, T. (2000). Psychometrics is datametrics : The test is not reliable. Educational and Psychological Measurement, Vol. 60, 174-195. Thompson, B. ve Snyder, P. A. (1998). Statistical significance and reliability analyses in recent Journal of Counseling & Development research articles. Journal of Counseling and Development, Vol. 76, 436-441. Thorndike, R. L. (1982). Applied psychometrics. Boston: Houghton Mifflin. Töreci, K. (2005). Yayın etiği. http://www.endokrin.com (en son 25.10.2005’de ulaşılmıştır). Turgut, M. F. (1993). Eğitimde ölçme ve değerlendirme metotları. (Dokuzuncu Baskı). Ankara: Saydam Matbaacılık. Turgut, S. (2002). Akıl defterimden notlar. http://www.hürriyetim.com.tr (en son 25.10.2005’de ulaşılmıştır.) Uluğtekin, S. (1976). Çocuk yetiştirme açısından anababa çocuk ilişkileri. Anababa davranışlarıyla çocuğun saldırganlık ve bağımlılık eğilimi arasındaki ilişkilerin araştırılması. Yayımlanmamış Doktora Tezi. Ankara: A.Ü.Eğitim Fakültesi. Vacha-Haase, T. (1998). Reliability generalization: Exploring variance in measurement error affecting score reliability across studies. Educational and Psychological Measurement, Vol. 58, 6-20. Vacha-Haase, T., Kogan, L. R., Tani, C. R. ve Woodall, R. A. (2001). Reliability generalization: Exploring variation of reliability coefficients of mmpı clinical scales scores. Educational and Psychological Measurements, Vol. 61, 45–59. Vacha-Haase, T., Kogan, L. R. ve Thompson, B. (2000). Sample compositions and variabilities in published studies versus those in test manuals: Validity of score reliability inductions. Educational and Psychological Measurement, Vol. 60, 509-522. Vacha-Haase, T., Ness, C., Nilsson, J. ve Reetz, D. (1999). Practices regarding reporting of reliability coefficients: A review of three journals. The Journal of Experimental Education, Vol. 67 (4), 335-341. Whittington, D. (1998). How well do researchers report their measures? An evaluation of measurement in published educational research. Educational and Psychological Measurement, Vol. 58, 21-37. Wilkinson, L. ve APA Task Force on Statistical Inference. (1999). Statistical methods in psychology journals: Guidelines and explanations. American Psychologist, Vol. 54, 594-604. Worthen, B. R., White, K. R., Fan, X ve Sudweeks, R. R. (1999). Measurement and assessment in schools. (Second Edition). New York: Addison Wesley Longman.

APA	Bademci V (2006). Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir. , 3 - 26.
Chicago	Bademci Vahit Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir. (2006): 3 - 26.
MLA	Bademci Vahit Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir. , 2006, ss.3 - 26.
AMA	Bademci V Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir. . 2006; 3 - 26.
Vancouver	Bademci V Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir. . 2006; 3 - 26.
IEEE	Bademci V "Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir." , ss.3 - 26, 2006.
ISNAD	Bademci, Vahit. "Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir". (2006), 3-26.

APA	Bademci V (2006). Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir. İnönü Üniversitesi Eğitim Fakültesi Dergisi, 7(12), 3 - 26.
Chicago	Bademci Vahit Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir. İnönü Üniversitesi Eğitim Fakültesi Dergisi 7, no.12 (2006): 3 - 26.
MLA	Bademci Vahit Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir. İnönü Üniversitesi Eğitim Fakültesi Dergisi, vol.7, no.12, 2006, ss.3 - 26.
AMA	Bademci V Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir. İnönü Üniversitesi Eğitim Fakültesi Dergisi. 2006; 7(12): 3 - 26.
Vancouver	Bademci V Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir. İnönü Üniversitesi Eğitim Fakültesi Dergisi. 2006; 7(12): 3 - 26.
IEEE	Bademci V "Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir." İnönü Üniversitesi Eğitim Fakültesi Dergisi, 7, ss.3 - 26, 2006.
ISNAD	Bademci, Vahit. "Güvenirliği doğru anlamak ve bazı klişeleri yıkmak: Bilinenlerin aksine,cronbach'in alfa katsayısı,negatif ve “–1” den küçük olabilir". İnönü Üniversitesi Eğitim Fakültesi Dergisi 7/12 (2006), 3-26.