一个NotionNext搭建的博客
数据库系统概论
大数据原理与应用
javaWeb应用开发基础教程
python
毕业设计
大数据技术综合应用
实训-航空数据系统
java面向对象程序设计
数据结构
算法分析与设计
SPARK
Python爬虫大数据采集与挖掘
云计算
概率论与数理统计
数字逻辑
计算机网络
计算机组成原理
linux
操作系统
人工智能导论
数据仓库与数据挖掘
数据可视化
大数据安全与隐私保护
c语言
C++
【第九章】高维数据可视化

高维数据的变换
- 线性方法
- 主成分分析(Principal Components Analysis, PCA)
- 多维尺度分析 (Multi Dimensional Scaling, MDS)
- 非矩阵分解 (Non-negative Matrix Factorization, NMF)
- 非线性方法
- 等距特征映射 (Isometric Feature lapping, ISO MAP)
- 局部线性嵌套 (Locally Linear Embedding, LLE)
- t-SNE算法
主成分分析
线性变换将数据变换到一个新的坐标系统中
- 使得任何数据点投影到第一个坐标(成为第一主成分)的方差最大,在第二个坐标(第二主成分)的方差为第二大,以此类推。
t-SNE算法
非线性降维算法,在邻域图上随机游走的概率分布来找到数据内结构
- 通过仿射(affinitie)变换将数据点映射到概率分布上
- SNE构建一个高维对象之间的概率分布,使得相似的对象有更高的概率被选择,而不相似的对象有较低的概率被选择 。
- SNE在低维空间里构建这些点的概率分布,使得这两个概率分布之间尽可能地相似。
- 不足
- 倾向于保存局部特征
- 没有唯一最优解,且没有预估部分
等距离特征算法(isomap
非线性降维方法,代替原来的两点之间最短路径算法(MDS
分面图
数据类别按行或者列,使用多个该类别的散点图、气泡图、柱形图或者曲线图等基础图表展示数据揭示数据之间的关系,可以适用于四维到五维的数据结构类型
矩阵散点图
展示多维数据通道两两之间的关系
- 自己和自己也要相关,对角线上是做自己的统计直方图
- 关于主对角线对称
Prev
【第四章】类别比较型图表
Next
【第一章】网络空间安全:理解与认识
Loading...