2026a

# clusterdata


从数据构造聚集簇

函数库: TyMachineLearning

# 语法

res = clusterdata(X, cutoff)

# 说明

res = clusterdata(X, cutoff)返回数据X在分割凝聚层次树的阈值cutoff下的聚类结果索引列表。

# 示例

指定层次树的阈值cutoff进行层次聚类
加载数据集。
using TyMachineLearning
using CSV
using DataFrames

file = joinpath(pkgdir(TyMachineLearning), "data/Cluster/clusterdata.csv")
X = CSV.read(file, DataFrame; header=false)

对数据进行层次聚类。

cutoff = 3
#创建聚类树
res = clusterdata(X, cutoff)
30-element Vector{Int32}:
 1
 1
 1
 1
 1
 1
 1
 1
 1
 1
 1
 1
 1
 ⋮
 1
 1
 1
 1
 1
 1
 1
 1
 1
 1
 1
 1

# 输入参数

X - 输入数据
数值矩阵
输入数据,指定为具有两行或更多行的数字矩阵。行表示样本数,列表示类别或维度。指定为n×m矩阵。

数据类型: DataFrame

cutoff - 构建层次树的阈值
正整数
构建层次树的阈值。

数据类型: Int

# 输出参数

res - 聚类返回的索引
向量
与输入数据X的行数相同,每一行代表着数据X中相应观测的聚类分配。

数据类型: Vector

# 另请参阅

cluster | dendrogram | inconsistent | kmeans | linkage