一、hcluster函数
hcluster(d, method = "complete", members = NULL)
hcluster是hierarchical clustering的简称,是R语言中用于层次聚类分析的函数。
该函数的第一个参数d为待聚类的距离矩阵或者相似性矩阵,必要参数;第二个参数method为hclust阈值聚类算法,表示使用何种聚类方式,默认值为”complete”,即最大距离法。
members参数为一个向量,表示哪些数据单位应该被聚类在一起,这一参数通常给默认空值就行了。
二、hclust method
hclust method代表聚类的方法,一共有六种实现方法,它们分别是:
- complete:最大距离法,即连两个聚类的最大距离
- average:平均距离法,即连两个聚类的平均距离
- single:最小距离法,即连两个聚类中距离最近的观测值
- ward.D:把两个离最近的聚类合并的离差平方和减少数最多法
- ward.D2:把两个离最近的聚类合并的离差平方和(D2)减少数最多法
三、hclust聚类分析
hclust函数可以应用于层次聚类分析,该函数可以直接将距离矩阵或相似性矩阵输入,并根据聚类算法得到聚类结果。下面以一个实例进行说明:
#生成数据 set.seed(123) d <- data.frame(matrix(rnorm(100), ncol = 10)) #生成距离矩阵 dist.d <- dist(d) #聚类 hc <- hclust(dist.d) #可视化聚类结果 plot(hc)
本例中,我们先使用rnorm(100)函数生成一个100个数据的随机向量,然后使用矩阵转换函数matrix将向量转化为10列的矩阵。
然后再利用dist函数生成距离矩阵,然后将该距离矩阵传入hclust函数,得到hr拟合系数矩阵,最后可视化聚类结果,如下图所示:
四、hclust在r语言中的含义
hclust函数是R语言中用于实现层次聚类分析的函数,可以根据输入的距离矩阵进行聚类分析,并返回聚类结果。
五、hclust函数method怎么选
对于hclust函数method参数的选择,根据不同的问题和实验结果不同,需要对不同的聚类方法进行尝试,以便得到合适的聚类结果。
原创文章,作者:SPSWZ,如若转载,请注明出处:https://www.506064.com/n/368096.html