# 聚类


将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。

# 层次聚类

层次聚类

层次聚类

函数名 简介
inconsistent 不一致系数
cluster 从联系构建集聚集群
clusterdata 从数据构造聚集簇
cophenet 共相关系数
linkage 凝聚层次聚类树
pdist 成对观测值之间的两两距离
squareform 格式化距离矩阵

# 异常检测

Machine Learning Toolbox™ 为未标注的多元样本数据提供了几种异常检测方法。异常检测通过训练模型或学习参数来检测离群值(训练数据中的异常)。对于新奇值检测(使用未污染的训练数据检测新数据中的异常),您可以使用未污染的训练数据(没有离群值的数据)训练模型或学习参数,并通过使用训练的模型或学习的参数来检测新数据中的异常。

异常检测

函数名 简介
iforest 适合异常检测的隔离林
isanomaly 使用隔离林查找数据中的异常
lof 为异常检测创建局部离群因子模型
ocsvm 拟合一类支持向量机(SVM)模型进行异常检测
robustcov 稳健的多变量协方差和均值估计

# k均值聚类和k中心点聚类

k均值聚类和k中心点聚类

k均值聚类和k中心点聚类

函数名 简介
kmeans k 均值聚类
kmedoids k-中心点聚类
mahal 样本的马氏距离

# 基于密度的含噪数据空间聚类

基于密度的含噪数据空间聚类

基于密度的含噪数据空间聚类

函数名 简介
dbscan 基于密度的噪声应用空间聚类(DBSCAN)

# 谱聚类

谱聚类

谱聚类

函数名 简介
spectralcluster 谱聚类

# 簇的可视化和计算

簇的可视化和计算

簇的可视化和计算

函数名 简介
dendrogram 树状图
optimalleaforder 层次聚类的最优叶序
silhouette 绘制轮廓图

# 隐马尔可夫模型

隐马尔可夫模型

隐马尔可夫模型

函数名 简介
hmmdecode 隐马尔可夫模型后验状态概率
hmmestimate 基于排放和状态的隐马尔可夫模型参数估计
hmmtrain 基于输出观测概率矩阵的隐马尔可夫模型参数估计
hmmgenerate 隐马尔可夫模型的状态与观测
hmmviterbi 隐马尔可夫模型最可能状态路径

# 最近邻

最近邻

最近邻

函数名 简介
KDTreeSearcher 创建Kd树最近邻搜索器
knnsearch 使用搜寻器对象查找k近邻
rangesearch 使用搜寻器对象查找指定距离内的所有邻近点
createns 创建最近邻搜索器对象
ExhaustiveSearcher 创建穷举最近邻搜索器

# 高斯混合模型

高斯混合模型

高斯混合模型

函数名 简介
fitgmdist 将高斯混合模型拟合到数据
gmdistribution 创建高斯混合模型
posterior 计算后验概率
randomgm 来自高斯混合分布的随机变量

# 增量学习聚类模型

对流式数据进行聚类的增量学习模型

增量学习聚类模型

函数名 简介
incrementalCluster 创建流式数据聚类模型
fitOne 训练流式数据聚类模型
predictOne 预测一个观测样本的簇编号