Parallel hierarchical clustering on shared memory platforms

William Hendrix; Md. Mostofa Ali Patwary; Ankit Agrawal; Wei-keng Liao; Alok Choudhary

doi:10.1109/HiPC.2012.6507511

20th Annual International Conference on High Performance Computing

Parallel hierarchical clustering on shared memory platforms

Year: 2012, Pages: 1-9

DOI Bookmark: 10.1109/HiPC.2012.6507511

Authors

William Hendrix, Department of Electrical Engineering and Computer Science Northwestern University Evanston, IL 60208
Md. Mostofa Ali Patwary, Department of Electrical Engineering and Computer Science Northwestern University Evanston, IL 60208
Ankit Agrawal, Department of Electrical Engineering and Computer Science Northwestern University Evanston, IL 60208
Wei-keng Liao, Department of Electrical Engineering and Computer Science Northwestern University Evanston, IL 60208
Alok Choudhary, Department of Electrical Engineering and Computer Science Northwestern University Evanston, IL 60208

Abstract

Hierarchical clustering has many advantages over traditional clustering algorithms like k-means, but it suffers from higher computational costs and a less obvious parallel structure. Thus, in order to scale this technique up to larger datasets, we present SHRINK, a novel shared-memory algorithm for single-linkage hierarchical clustering based on merging the solutions from overlapping sub-problems. In our experiments, we find that SHRINK provides a speedup of 18–20 on 36 cores on both real and synthetic datasets of up to 250,000 points. Source code for SHRINK is available for download on our website, http://cucis.ece.northwestern.edu.

Like what you’re reading?

Already a member?

Get this article FREE with a new membership!

A new hierarchical clustering algorithm
2015 International Conference on Intelligent Informatics and Biomedical Sciences (ICIIBMS)
Cluster merging and splitting in hierarchical clustering algorithms
2002 IEEE International Conference on Data Mining, 2002. Proceedings.
A scalable algorithm for single-linkage hierarchical clustering on distributed-memory architectures
2013 IEEE Symposium on Large-Scale Data Analysis and Visualization (LDAV)
Top-down vs bottom-up methods of linkage for asymmetric agglomerative hierarchical clustering
2012 IEEE International Conference on Granular Computing
An Efficient Hierarchical Clustering Algorithm via Root Searching
2014 IEEE 17th International Conference on Computational Science and Engineering (CSE)
Hierarchical Ensemble Clustering
2010 IEEE International Conference on Data Mining
Parallel Hierarchical Subspace Clustering of Categorical Data
IEEE Transactions on Computers
Hierarchical Density-Based Clustering Using MapReduce
IEEE Transactions on Big Data
Learning Hierarchical Graph Neural Networks for Image Clustering
2021 IEEE/CVF International Conference on Computer Vision (ICCV)
Cross-modal Scalable Hyperbolic Hierarchical Clustering
2023 IEEE/CVF International Conference on Computer Vision (ICCV)

Parallel hierarchical clustering on shared memory platforms

Authors

Abstract

Related Articles