Python sklearn.cluster.AgglomerativeClustering实例讲解
用法:
class sklearn.cluster.AgglomerativeClustering(n_clusters=2, *, affinity='euclidean', memory=None, connectivity=None, compute_full_tree='auto', linkage='ward', distance_threshold=None, compute_distances=False)
凝聚聚类。
递归合并样本数据对的集群;使用链接距离。
在用户指南中阅读更多信息。
- n_clusters:整数或无,默认=2
要查找的集群数。如果
distance_threshold
不是None
,则它必须是None
。- affinity:str 或可调用,默认='euclidean'
用于计算链接的度量。可以是“euclidean”、“l1”、“l2”、“manhattan”, “cosine”, or “precomputed”。如果联动是“ward”,则只接受“euclidean”。如果“precomputed”,则需要距离矩阵(而不是相似度矩阵)作为拟合方法的输入。
- memory:带有joblib.Memory 接口的str 或对象,默认=None
用于缓存树计算的输出。默认情况下,不进行缓存。如果给出一个字符串,它是缓存目录的路径。
- connectivity:array-like 或可调用,默认=无
连接矩阵。为每个样本定义遵循给定数据结构的相邻样本。这可以是连接矩阵本身或将数据转换为连接矩阵的可调用对象,例如从
kneighbors_graph
派生的。默认值为None
,即层次聚类算法是非结构化的。- compute_full_tree:‘auto’ 或布尔值,默认='auto'
在
n_clusters
处尽早停止树的构建。如果集群的数量与样本数量相比不小,这对于减少计算时间很有用。此选项仅在指定连接矩阵时有用。还要注意,当改变集群的数量并使用缓存时,计算完整的树可能是有利的。如果distance_threshold
不是None
,则它必须是True
。默认情况下compute_full_tree
为 “auto”,当distance_threshold
不是None
或n_clusters
低于 100 或0.02 * n_samples
之间的最大值时,它等效于True
。否则,“auto” 等价于False
。- linkage:{‘ward’, ‘complete’, ‘average’, ‘single’},默认='病房'
使用哪个链接标准。链接标准确定在观察集之间使用哪个距离。该算法将合并使该标准最小化的集群对。
- ‘ward’ 最小化被合并的集群的方差。
- ‘average’ 使用两组每个观测值的距离平均值。
- ‘complete’ or ‘maximum’ 链接使用两组所有观测值之间的最大距离。
- ‘single’ 使用两组所有观测值之间距离的最小值。
- distance_threshold:浮点数,默认=无
链接距离阈值,超过该阈值,集群将不会被合并。如果不是
None
,n_clusters
必须是None
并且compute_full_tree
必须是True
。- compute_distances:布尔,默认=假
即使不使用
distance_threshold
,也会计算集群之间的距离。这可用于进行树状图可视化,但会引入计算和内存开销。
- n_clusters_:int
算法找到的聚类数。如果
distance_threshold=None
,它将等于给定的n_clusters
。- labels_:形状的ndarray(n_samples)
每个点的聚类标签。
- n_leaves_:int
层次树中的叶子数。
- n_connected_components_:int
图中连接组件的估计数量。
- n_features_in_:int
拟合期间看到的特征数。
- feature_names_in_:ndarray 形状(
n_features_in_
,) 拟合期间看到的特征名称。仅当
X
具有全为字符串的函数名称时才定义。- children_:array-like 形状 (n_samples-1, 2)
每个非叶节点的子节点。小于
n_samples
的值对应于作为原始样本的树的叶子。大于或等于n_samples
的节点i
是非叶节点,并且具有子节点children_[i - n_samples]
。或者在 i-th 迭代中,children[i][0] 和 children[i][1] 合并形成节点n_samples + i
。- distances_:array-like 形状 (n_nodes-1,)
children_
中对应位置的节点之间的距离。仅在使用distance_threshold
或compute_distances
设置为True
时计算。
参数:
属性:
例子:
>>> from sklearn.cluster import AgglomerativeClustering >>> import numpy as np >>> X = np.array([[1, 2], [1, 4], [1, 0], ... [4, 2], [4, 4], [4, 0]]) >>> clustering = AgglomerativeClustering().fit(X) >>> clustering AgglomerativeClustering() >>> clustering.labels_ array([1, 1, 1, 0, 0, 0])
- 简单易学的机器学习算法——受限玻尔兹曼机RBM
- 博客群发(2)--实现登陆
- 算法——递推算法
- 算法——贝叶斯
- 机器学习算法实现解析——liblbfgs之L-BFGS算法
- 机器学习算法实现解析——libFM之libFM的训练过程之Adaptive Regularization
- 虚拟化平台cloudstack(2)——安装(上)
- 机器学习算法实现解析——libFM之libFM的训练过程之SGD的方法
- 虚拟化平台cloudstack(3)——安装(下)
- 机器学习算法实现解析——libFM之libFM的训练过程概述
- 虚拟化平台cloudstack(4)——几个异常
- Golang语言 xml解析实例
- 机器学习算法实现解析——libFM之libFM的模型处理部分
- Go语言使用protobuf数据通信--师出同门,懂的人理解吧
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 线程池的execute方法和submit方法有什么区别?
- os.mkdir()
- Java自动化测试(Jmeter 12)
- python剪切文件
- 设计模式(一):Android 源码中的单例模式
- Flask(数据库操作 十一)
- Golang | 既是接口又是类型,interface是什么神仙用法?
- 剑指offer第11题:机器人运动范围
- SQL 查找是否"存在",别再 count 了,很耗费时间的!
- 【LeeCode 中等 字节 python3】567. 字符串的排列
- Spark实现WordCount的几种方式总结
- Redis6之pub/sub发布与订阅(对比List和Kafka)
- SpringBoot原理?属性配置?在这里
- 【LeeCode 中等 矩阵】面试题 01.07. 旋转矩阵
- pytest文档44-allure.dynamic动态生成用例标题