Yıl: 2005 Cilt: 4 Sayı: 8 Sayfa Aralığı: 1 - 18 Metin Dili: Türkçe İndeks Tarihi: 29-07-2022

CURE, AGNES ve K-Means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması

Öz:
Bu çalışmada, hiyerarşik kümeleme algoritmalarından CURE (Clustering Using REpresentatives) ve AGNES (AGglomerative NEsting) ile bölümleyici kümeleme algoritmalarından çok sık kullanılan k-means' in sentetik veri setlerinde uygulanmasıyla elde edilen sonuçların karşılaştırması açıklanmaktadır. Gerçekleştirilen uygulamalarda, k-means algoritmasının ayrık ve sıkışık bulutlar halindeki kümeleri başarıyla bulduğu görülmüştür. Bu algoritma benzer büyüklükteki küresel kümeleri bulabilirken, çok büyük kümeleri küresel de olsa parçalara ayırmaktadır. AGNES algoritması uygulamaları bu algoritmanın küresel kümeleri etkili bir şekilde bulduğunu, ancak sıradışı noktalara karşı çok duyarlı olduğunu göstermiştir. CURE algoritması uygulamalarında bu algoritmanın farklı büyüklüklerde ve farklı şekillerdeki kümeleri sıradışı noktalardan etkilenmeden başarıyla bulduğu görülmüştür. Ancak, CURE algoritmasıyla elde edilen kümelerin giriş parametrelerinin değerlerinden etkilendiği saptanmıştır.
Anahtar Kelime:

Comparison of clustering characteristics of CURE, AGNES and K-means algorithms

Öz:
In this study, applications on the synthetic datasets using hierarchical clustering algorithms, CURE (Clustering Using REpresentatives) and AGNES (AGglomerative NEsting), and a partitioning based clustering algorithm, k-means are compared. This applied study shows that k-means algorithm can find discrete and condensed clusters successfully. According to the results of k-means applications, this algorithm can be used to find similar sized and spherical clusters, but, it divides the big clusters into smaller partitions even they are spherical. Applications on AGNES algorithm show that AGNES can find spherical clusters effectively, but, it is very sensitive to the outliers. Applied studies on CURE algorithm show that this algorithm can find different sized and different shaped clusters effectively. On CURE applications, it is found out that, clustering process is not affected from outliers but it is very sensitive to the value of the input parameters.
Anahtar Kelime:

Belge Türü: Makale Makale Türü: Araştırma Makalesi Erişim Türü: Erişime Açık
  • 1.Anders K-H., (2003), A Hierarchical Graph Clustering Approach to Find Groups of Data, Institute of Cartography and Geoinformatics University of Hannover. 2.Baltrunas L. ve Gordevicius J., "Implementation of CURE Clustering Algorithm", Technical Report, http://www.inf.unibz.it/dis/teaching/DWDM05/reports/cure.pdf; Erişim tarihi: 17/04/2005. 3.Berkhin P., (2002), Survey of Clustering Data Mining Techniques, San Jose, California, USA, Accrue Software Inc.. 4.Bilgin T., (2003), Veri Madenciliğinde Kümeleme Analizi Yöntemi Uygulaması, Yüksek Lisans Tezi, Marmara Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar ve Kontrol Eğitimi. 5.Bilgin T. ve Çamurcu Y., (2003), "A Data Mining Application on Air temperature Database", Lecture Notes in Computer Science, Springer-Verlag. 6.Boutsinas B. ve Gnardellis T., (2002), "On Distributing the Clustering Process", Pattern Recognition Letters 23, 999-1008. 7.Fasulo D., (1999), An Analysis of Recent Work on Clustering Algorithms, Technical Report, 01-03-02, Department of Computer Science & Engineering, University of Washington. 8.Guha S., (2000), Approximation Algorithms for Facility Location Problems, Stanford University Computer Science. 9.Guha S., Rastogi R. ve Shim K., (2002), "CURE: An Efficient Clustering Algorithm for Large Databases", Information Systems 26,1, 35-58. 10.Halkidi M., Batistakis Y. ve Vazirgiannis M., (2001), On Clustering Validation Techniques, Kluwer Academic Publishers. 11.Han E.-H., (2005), İnternette Kişisel Görüşme, Research Associate, Department of Computer Science, University of Minnesota, Minneapolis. 12.Han.J. ve Kamber M., (2001), Data Mining Concepts and Techniques, Morgan Kauffmann Publishers Inc. 13.Han J., Kamber M. ve Tung A. K. H., (2001) "Spatial Clustering Methods in Data Mining: A Survey", Geographic Data Mining and Knowledge Discovery, H. Miller ve J. Han (ed.), Taylor and Francis. 14.Ho T. K. ve KleinBerg E. M., (1996), "Building Projectable Classifiers of Arbitrary Complexity", Proceedings of the 13th International Conference on Pattern Recognition, Vienna, Austria, 880-885. 15.Ho T. K. ve KleinBerg E. M., Checkboard Dataset http://www.cs.wisc.edu/math-prog/mpml.html; Erişim tarihi: 07/01/2005. 16.Jain A. K. ve Dubes R. C, (1988), "Algorithms for Clustering Data", Englewood Cliffs, New Jersey, 07632, Prentice Hall. 17.Jain A. K., Murty M. N. ve Flynn P. J., (1999), "Data Clustering: A Review", ACM Computing Surveys, 31, 3. 18.Jang R., Computer Science Department of Tsing Hua University, Taiwan, http://neural.cs.nthu.edu.tw/jang/matlab/demo/; Erişim tarihi: 06/06/2005. 19.Karypis G., Han E. H. ve Kumar V., (1999), "CHAMELEON: A Hierarchical Clustering Algorithm Using Dynamic Modeling", IEEE Computer 32, 8, 68-75. 20.Kaufman L. ve Rousseeuw P. J., (1990), Finding Groups in Data: an Introduction to Cluster Analysis, John Wiley and Sons. 21.MacQueen J., (1967), Some Methods for Classification and Analysis of Multivariate Observations, Berkeley, University of California Press. 22.Mercer D. P., (2003), "Clustering Large Datasets", http://www.stats.ox.ac.uk/~mercer/documents/transfer.pdf; Erişim tarihi: 13/05/2005. 23.Shlens J., e-posta: jonshlens@ucsd.edu , Erişim tarihi: 09/10/2002. 24.Syed A. A., (2004), Performance Analysis of K-Means Algorithm and Kohonen Networks, Yüksek Lisans Tezi, Florida Atlantic University, Master of Science . 25.Szymkowiak A., Larsen J. ve Hansen L. K., (2001), "Hierarchical Clustering for Data Mining", KES'2001 Fifth International Conference on Knowledge-Based Intelligent Information Engineering Systems & Allied Technologies, Osaka-Japan. 26.Valgeirsson A. G., Erlingsson B. ve Einarson I. S., (2003), Using Clustering to Index Image Descriptors: A Performance Evaluation, Reykjavik University, B.Sc. Project. 27.Wang W. ve Zaiane O. R., (2002), "Clustering Web Sessions by Sequence Alignment", SIGMOD Conference. 28.Witten I. H., Frank E., (1999), "Data Mining: Practical machine learning tools with Java implementations.", San Francisco, Morgan Kaufmann. 29.Xiong H., Steinbach M., Tan P.-N. ve Kumar V., (2004), "HICAP: Hierarchial Clustering with Pattern Preservation", In Proc. of the Fourth SIAM International Conf. on Data Mining (SDM'04), Florida, USA. 30.Zhao Y. ve Karypis G., (2002), "Clustering in Life Sciences.", Technical Report, Department of Computer Science and Engineering University of Minnesota, TR 02-016.
APA DEMİRALAY M, ÇAMURCU A (2005). CURE, AGNES ve K-Means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması. , 1 - 18.
Chicago DEMİRALAY Meral,ÇAMURCU A. Yılmaz CURE, AGNES ve K-Means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması. (2005): 1 - 18.
MLA DEMİRALAY Meral,ÇAMURCU A. Yılmaz CURE, AGNES ve K-Means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması. , 2005, ss.1 - 18.
AMA DEMİRALAY M,ÇAMURCU A CURE, AGNES ve K-Means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması. . 2005; 1 - 18.
Vancouver DEMİRALAY M,ÇAMURCU A CURE, AGNES ve K-Means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması. . 2005; 1 - 18.
IEEE DEMİRALAY M,ÇAMURCU A "CURE, AGNES ve K-Means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması." , ss.1 - 18, 2005.
ISNAD DEMİRALAY, Meral - ÇAMURCU, A. Yılmaz. "CURE, AGNES ve K-Means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması". (2005), 1-18.
APA DEMİRALAY M, ÇAMURCU A (2005). CURE, AGNES ve K-Means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, 4(8), 1 - 18.
Chicago DEMİRALAY Meral,ÇAMURCU A. Yılmaz CURE, AGNES ve K-Means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi 4, no.8 (2005): 1 - 18.
MLA DEMİRALAY Meral,ÇAMURCU A. Yılmaz CURE, AGNES ve K-Means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, vol.4, no.8, 2005, ss.1 - 18.
AMA DEMİRALAY M,ÇAMURCU A CURE, AGNES ve K-Means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi. 2005; 4(8): 1 - 18.
Vancouver DEMİRALAY M,ÇAMURCU A CURE, AGNES ve K-Means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi. 2005; 4(8): 1 - 18.
IEEE DEMİRALAY M,ÇAMURCU A "CURE, AGNES ve K-Means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması." İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, 4, ss.1 - 18, 2005.
ISNAD DEMİRALAY, Meral - ÇAMURCU, A. Yılmaz. "CURE, AGNES ve K-Means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması". İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi 4/8 (2005), 1-18.