概览
2023-02-28

基于图论的聚类

基于图论的距离 Affinity Propagation Affinity Propagation,亲和力传播 Affinity Propagation 是一种基于图论的聚类算法,旨在识别数据中的 “exemplars”(代表点)和 “clusters”(簇)。 …

Machine learning 阅读
2022-11-22

层次聚类

层次聚类 层次聚类(Hierarchical)是一个通用的聚类算法家族,它通过连续合并或拆分嵌套聚类来构建嵌套聚类。 这种集群层次结构表示为树(或树状图)。树的根是收集所有样本的唯一簇,叶子是只有一个样本的簇 层次聚类算法的关键是如何计算两个样本点之间以及两个聚类簇之间的距离 计算两个样本点之间的距离 距离矩 …

Machine learning 阅读
2022-11-22

学习向量量化聚类

算法介绍 LVQ(Learning vector Quantization) 假设数据样本带有类别标记, 学习过程利用样本的这些监督信息来辅助聚类. 给定样本集 $D=\{(x_{1}, y_{1}), (x_{2}, y_{2}), \ldots, (x_{n}, y_{n})\}$, $x_{i} \in …

Machine learning 阅读
2022-11-22

基于质心的聚类

K-Means 算法原理 初始化数据, 选择 $k$ 个对象作为中心点, 对于 $k$ 的选择, 需要经过交叉验证等方法进行选取; 遍历整个数据集, 计算每个点与每个中心点的距离, 将它们分配给距离中心最近的组; 重新计算每个组的平均值, 作为新的聚类中心; 重复上面的 2-3 步, 直到函数收敛, 不再有新的分组情况 …

Machine learning 阅读
2022-11-22

基于密度的聚类

DBSCAN 算法原理介绍 基本原理 DBSCAN (Density-Based Spatial Clustering of Applications with Noise)是一种基于密度的聚类算法, 其可以有效地发现任意形状的簇,并能够处理噪声数据。DBSCAN算法的核心思想是:对于一个给定的数据点, 如果它的密度达 …

Machine learning 阅读
2022-11-22

基于分布的聚类

高斯混合聚类 算法介绍 高斯混合聚类(Mixture-of-Gaussian)采用概率模型来表达聚类原型. (多元)高斯分布 对 $n$ 维样本空间 $\mathcal{X}$ 中的随机向量 $x$, 若 $x$ 服从(多元)高斯分布, 其概率密度函数为: $$p(x| \mu, …

Machine learning 阅读
2022-07-19

聚类算法概览

聚类算法 聚类是从数据集中挖掘相似观测值集合的方法。聚类试图将数据集中的样本划分为若干个通常是不相交的子集, 每个子集称为一个"簇"(cluster)。通过这样的划分,每个簇可能对应于一些潜在的概念(类别)。 聚类过程仅能自动形成簇结构,簇所对应的概念语义需由使用者自己来把握。 聚类既能作为一个单独 …

Machine learning 阅读