2026a
# clusterdata
从数据构造聚集簇
函数库: TyMachineLearning
# 语法
res = clusterdata(X, cutoff)
# 说明
res = clusterdata(X, cutoff)返回数据X在分割凝聚层次树的阈值cutoff下的聚类结果索引列表。
# 示例
指定层次树的阈值cutoff进行层次聚类
加载数据集。
using TyMachineLearning
using CSV
using DataFrames
file = joinpath(pkgdir(TyMachineLearning), "data/Cluster/clusterdata.csv")
X = CSV.read(file, DataFrame; header=false)
对数据进行层次聚类。
cutoff = 3
#创建聚类树
res = clusterdata(X, cutoff)
30-element Vector{Int32}:
1
1
1
1
1
1
1
1
1
1
1
1
1
⋮
1
1
1
1
1
1
1
1
1
1
1
1
# 输入参数
X - 输入数据
数值矩阵
输入数据,指定为具有两行或更多行的数字矩阵。行表示样本数,列表示类别或维度。指定为n×m矩阵。
数据类型: DataFrame
cutoff - 构建层次树的阈值
正整数
构建层次树的阈值。
数据类型: Int
# 输出参数
res - 聚类返回的索引
向量
与输入数据X的行数相同,每一行代表着数据X中相应观测的聚类分配。
数据类型: Vector
# 另请参阅
cluster | dendrogram | inconsistent | kmeans | linkage