ShihanRan's Blog Life is like a Markov Chain.

Data Visualization


This is a note taken in Chinese for my data science course Data Visualization.

数据属性特征

定义

  • 数据:一切可被记录的东西
    • 并保存下来 可再次访问
  • 数据值类型
    • 类别型
      • 用0和1表达相同与相异
    • 序数型
      • 会多一个表达的空间 e.g. 大一与大一的相似度高于大一与大二的相似度
    • 数值型
      • 区间型
        • 区间型数据在设置了零点后,可以转化为比值型
      • 比值型
        • 各种距离:欧式距离(L2)、曼哈顿距离(L1)、明科夫斯基距离(LP)
    • 总结:
  • 数据对象间的关系:相似度和相异度
    • 注意:归一化的运用 处理单位不同的情况
  • 基本统计描述
    • 均值、中位数、方差、区间值
  • 数据不确定来源
    • 本身误差、精度转换、特定应用需求、缺失值、数据集成

数据预处理

  • 预处理常用操作
    • 数据清洗、数据整合、数据规范、数据离散化、数据变换

数据清洗

  • 数据错误类型及处理方法
    • 缺失值:常量代替缺失值、属性平均值填充、回归、人工填充
    • 噪声值:回归分析、离群点分析
  • 可视数据清洗:使用可视化工具

数据整合

  • 任务包括 (合并和处理)
    • 合并来自多个数据源的数据
    • 向用户提供这些数据的统一视图
  • 挑战 (多数据源)
    • 重复的记录、冲突的记录
    • 结构冲突,模式不同、数据冲突

数据存储

基于文件的存储

  • 常用结构化的数据格式:csv、html、xml
  • 其他格式数据:医学病历文本、医学模型

关系数据库

  • 结构化查询语言SQL
  • 关系模型:表(关系)、列(属性)、行(记录)、约束、键、索引
  • 挑战与问题
    • 响应时间、大尺度数据索引、数据间语义关系

数据仓库

  • 特点:海量数据、存储后很少更改、面向主题、集成化、非易失、时变

视觉感知与认知

定义

信息的处理流程

  • 视觉感知->可视信息->编码->形成认知+交互->解决方案
  • 人是主体 人的感知认知能力直接影响信息获取和处理进程

感知与认知

  • 感知:客观事物通过感觉器官在人脑中形成的直接反映
    • 感觉器官:眼耳鼻、神经末梢
  • 认知:一系列信息加工处理过程

视觉

  • 高阶视觉
    • 相对概念
    • 对物体识别和分类
  • 低阶视觉
    • 针对看到的物体的物理信息(颜色、边缘信息等)
  • 一些结论
    • 记忆在人类认知过程中起着至关重要的作用,但工作记忆容量十分有限
    • 视觉系统观察的是变化而不是绝对值
    • 不同物体间使用高对比度使得物体更容易区分
    • 动画的形式突出可视化中的变化从而减轻突变给认知带来的负担

处理过程

视觉感知处理过程

  • 人类感知由两个系统组成
    • 负责语言
      • 根据联想与层及组织
    • 负责其他非语言事物(尤其是视觉方面)
      • 部分与整体的关系组织

Gestalt 格式塔理论

格式塔心理学

  • 强调经验和行为的整体性
  • 感知的事情大于眼睛见到的事物
  • 人在进行观察时倾向将视觉感知内容理解为常规、简单、相邻、对称或有序的结构
  • 人在获取视觉感知时会倾向于将事物理解成一个整体而不是部分之和

Gestalt Rule

  • 贴近原则:结构比元素重要,视觉形象作为统一的整体被认知
  • 相似原则:依据属性相似性组合在一起
  • 连续原则:凡具有连续性或共同运动方向的刺激容易被看成一个整体
  • 闭合原则:缺少轮廓/中间挖空也能看出来
  • 共势原则:从一堆字符中认知语句
  • 好图原则:人眼通常会将一组物体按简单、规则、有序的元素排列方式识别
  • 对称性原则:人的意识倾向于将物体识别为沿某点或某轴对称的形状
  • 经验原则:在某些情形下,视觉感知与过去的经验有关

视觉感知的相对性

  • 感知系统基于相对判断而非绝对判断
    • 如果物体使用相同的参照物或者进行对齐操作则会有助于做出更加准确的相对判断

颜色与视觉通道

颜色

光谱与人眼

  • 人眼的杆状细胞和锥状细胞
    • 杆状细胞:启动暗视觉过程的光敏色素,在弱光照下有较好敏感性,不参与颜色刺激区分
    • 锥状细胞:主导明视觉活动的感光细胞,负责光亮条件下的视觉活动,既可辨别光的强弱又可辨别彩色还可辨别细节(真强!
  • 视觉关注机制:主动选择性的心理活动
    • 客观内容驱动自底向上关注模型
    • 主观命令指导自顶而下关注模型

颜色与视觉

  • 基色:e.g. RGB/CMYK(青、品红、黄、黑)
  • 颜色视觉理论
    • 三色视觉理论:RGB加色法系统
      • 假定只需要 3 种感受体就能产生所有的颜色
      • 可以解释颜色混合的现象,不能解释色盲的现象
    • 补色过程理论:CMYK减色法系统
      • 白色减去某个颜色

颜色视觉障碍(色盲色弱)

  • 红色盲、绿色盲、蓝色盲、全色盲等
  • PS:工作中在作图时要考虑到色盲现象

色彩空间

  • RGB/CMYK
  • HSV/HSL
    • HSL:色相(Hue)/饱和度(Saturation)/亮度(Lightness)
  • CIE XYZ/CIE Lab
  • 绝对色彩空间/相对色彩空间

视觉通道

感知相对判断

  • 视觉感知的相对性
    • 感知系统对于亮度和颜色的判断完全是基于周围环境
    • 人类感知系统的工作原理决定于对所观察事物的相对判断,也就是找参照物
    • 相对判断给用户提供一种定性的有效手段(可以对齐比长度)
  • 视觉假象
    • 指人们通过眼睛所获得的信息被大脑处理后形成的关于事物的感知,与事物的客观世界中的物理显示不一致的现象
    • 不合理设定事物的上下文环境也会导致判断真实性的失效
  • Webber定律
    • 人类感知系统将可察觉的刺激强度的变化$\Delta L$表达为一个目标刺激强度$L$的一个固定百分比$K$,即$K=\Delta L$.

标记和视觉通道

  • 可视化编码:数据——>可视化元素
    • 标记:数据属性到可视化元素的映射(点线面
    • 视觉通道:是数据的标记的视觉表现属性映射(位置、大小、形状、方向、色调、饱和度、亮度
  • 类型:定量、定性、分组
  • 表现力 (主观)
    • 要求:视觉通道准确编码数据包含的所有信息且需要尽量忠于原始数据
    • 判断标准:精确性、可辨性、可分离性、视觉突出
    • 特性:平面位置、颜色(包括亮度、饱和度、色调、配色方案)、尺寸、斜度和角度、形状、纹理及动画
      • 颜色+形状+布局
    • 一个主观定义的表现力

统计图表

图表分类

  • 部分与整体的关系:饼状图
    • 注意:避免3D
  • 比较与比例:柱状图(纵向)或横条图(横向) + 排序
    • 注意:标注、尺度(截断、中断、log尺度)、偏离设计(正负轴)、立体显示、对偶柱状图、隐喻
  • 堆叠图:堆叠柱状图、堆积图
  • 结合整体与部分、比较与比例
  • 趋势与模式:折线图
    • 设计原则:色彩、宽高比、尺度(清晰标识尺度的中断)
    • 注意:两条线段在平均绝对角度为45度时能够最大程度被区分
  • 散点图:隐喻、趋势、参考线
  • 盒须图

作图流程

设计原则和视觉编码

可视化设计原则

设计目标

  • 表达力强 (真实全面)
  • 有效性强(理解效率)
  • 简洁、直观、具有美感

设计框架

  • 循环式设计模型
  • 4个层次
    • 问题刻画
    • 抽象数据类型和任务
    • 设计编码和交互(核心)
    • 实现编码和交互

设计原则

  • 数据到可视化的直观映射
    • 确定数据类型、合适的编码方式、优先级
  • 视图选择与交互设计
    • 滚动与缩放、颜色修改、更改映射方式
  • 信息密度——数据的筛选
    • 设计者必须决定可视化所能处理的数据的信息量
    • 避免展示过少或试图传递过多信息
    • 解决方案:
      • 数据筛选——让用户选择当前显示的部分数据
      • 多视图或多显示器——根据数据的相关性分别显示
  • 美学因素
    • 坐标轴刻度、网格

    • 标注、图例、标题
    • 正确使用颜色
    • 美学三原则:聚焦、平衡、简单
  • 颜色与透明度

  • 可视化隐喻
    • 在视觉上将目标物体/形象与另一领域的(源)物体进行相似性对比
    • 将数据特性与自然界真实物体结合
  • 动画与过渡
    • 用时间换取空间
    • 辅助不同视图之间的转换与跟踪
    • 增加用户在可视化系统中的交互的反馈效果
    • 引起观察者注意力

地理信息可视化

地图和地图投影

地图

  • 地图的主题
    • 疆界,地形,河流
  • 地图细节的选择
    • 简化,合并,强调
  • 地图的映射
    • 球面投影,圆锥投影,等距投影

地图投影

  • 地图映射
    • 也就是将数据中的地理坐标转换成屏幕上的坐标
  • 实质
    • 将数据中的地理坐标转换到二维的屏幕坐标,在两个面之间建立一一映射的关系
  • 失真问题的三个优化原则
    • 常见:等角度(正形投影),少见:等面积、等距离(等方位角)
  • 等角度映射的一个应用:墨卡托投影
    • 应用:各种航海地图,导航地图(百度地图,高德地图)
    • 优点:由于不存在角度变形,所以从A到B,沿着地图上A点到B点的方向,一定可以最终到达
    • 缺点:由于不具备等面积特性,所以在远离赤道的区域,两个点之间的距离会远远超过真实值,容易给人带来混乱
  • 等面积投影的一个应用:亚尔勃斯投影
    • 原理:改变纬线的长度
    • 应用:常用于表现国家疆域面积大小的图示中
  • 等方位角的一个应用:等方位角(azimuth)投影(等距离投影)
    • 属于等距投影的一种,地图上任何一点沿着经度线到投影中原点的距离保持不变。
    • 优点:原点是目标点,方位角投影能非常准确地表示地图上任何位置到原点的距离。
      • 地震中震源为中心点
    • 应用:常被用于导航地图

地理基本信息可视化

点数据可视化

  • 定义:描述的对象是地理空间中离散的点,具有经度和纬度的坐标
  • 最直接可视化点数据的方法
    • 根据坐标直接标识在地图上,圆点是最常用的标识符号
    • 其它标识符号:向量箭头、六边形蜂窝网格

线数据可视化

  • 定义:连接两个或更多地点的线段或者路径
    • 长度属性+连接关系
  • 可视化形式:颜色,线型,宽度和标注
  • 挑战:研究减少空间分布上不同线数据的重叠交叉的算法

区域数据可视化

  • 等值区间地图Choropleth
    • 假设数据的属性在一个区域内部平均分布,因此一个区域用同一种颜色来表示其属性
    • 挑战:数据分布与地理区域大小不对称
  • 比较统计地图Cartogram
    • 按照各区域数据值的大小调整形状和面积
    • 算法:CartoDraw
      • 输入:平面多边形网络和每个区域对应的数值
      • 目标:使得变化后每个网格多边形的面积和数值成正比,并最小化形状误差面积误差的空间优化问题
  • 多元关系地图
    • 目的:显示地理空间不同位置上的区域属性直接的多元关系
    • 方法:采用连线、集合等方法表达
    • 例子:地铁图

三维可视化

  • 应用:移动导航、市政规划、交通模拟、移动广告、旅游线路规划
  • 挑战:
    • 可能带来视觉干扰:和具体应用紧密相关
    • 视觉遮挡、错觉:距离更难估计,遮挡隐藏物体
      • 解决思路:扩充关键道路的宽度、放大标志性建筑物的体积

时间相关属性

  • 三种现象
    • 存在性变化:特定特征的出现或消失
      • 解决方案:扩展第三维
    • 地理属性变化:地点、形状、大小变化
      • 解决方案:运动轨迹、扩展第三维、使用动画
    • 主题属性变化:定量的或定性的特定属性变化
      • 解决方案:混合视图、动画

图像数据基本变换

基础概念

图像

  • 图像与数字图像
    • 图像(Picture)有多种含义,其中最常见的定义是指各种图形和影像的总称。广义上,图像就是所有具有视觉效果的画面。
  • 图像采样
    • 把连续的图像(模拟图像)转换成离散采样点/像素集合(数字图像)
    • 采样方式Sampling:笛卡尔采样、六边形采样、非均匀采样
    • 图像量化Quantization:
      • 将像素的灰度变换成离散整数值的操作,eg. 二值化
  • 数字图像表达
    • 结构:像素+灰度值+坐标
  • 图像像素
    • 定义:一张图片的最小单元元素
  • 图像灰度值
    • 指灰的程度,一般分为256级,范围为0-255,0是最不灰,也就是白色 ,255是最灰,也就是黑色。
  • 图像分辨率
  • 医学图像
    • 与一般计算机视觉领域的差异:亮度/图像大小/视野/片厚/方向
  • 坐标系

灰度直方图二值化

灰度变换与对比度增强

图像变换:灰度变换

  • Contrast enhancement in the spatial domain depends on grey level transformation (mapping): $s=T(r)$
  • Basic grey level transformation: Linear(identity), Logarithmic(Log), Power-law
    • 线性变换(恒等/反转变换)
      • 如果灰度值区间为$[0, L-1]$, r为输入,s为输出,e.g. 负向图 $(L-1)-r=s$
    • 对数变换
      • e.g. $s= c\log (1+r)$
      • 作用:使得灰度较低的区域的对比度得到增强或使得灰度较高的区域对比度增强(反对数变换公式)
    • 幂律(伽马)变换
      • e.g. $s= cr^\gamma$
      • 作用:用于伽马校正(处理太亮或者太暗的图像)和对比度增强

图像变换:对比度拉伸

  • Contrast stretching transformation: the simplest piecewise linear functions
  • e.g. 分段线性函数

基于直方图分析的变换

==图像变换:灰度直方图均衡化==

  • Histogram is a pixel distribution function based on each gray level.
  • 假设灰度值归一化为0-1
    • $s$在$[0,1]$上均匀分布,即:$P(s<a)=a$,累积分布函数为$T(r)=P(w<r)$
    • $s=T(r)=\int_0^r P_r(w)dw, s_k=T(r_k)=\sum_{j=0}^k p_r(r_j)=\sum_{j=0}^k \frac{n_j}{n}, k=0,1,2,\cdots, L-1$

图像二值化

  • 阈值的定义
    • 定义:通常指一个可以把像素分成两类的强度值,由阈值可以生成二值图片
    • 分类:固定阈值/自适应阈值
  • 几种二值化算法(fix threshold)
    • Isodata Algorithm
    • Optimal Thresholding
    • OTSU Algorithm
    • Entropy Method
    • 总结:

采样插值及应用

图像采样和插值

图像采样和量化

  • Interpolation is the process of using known data to estimate values at unknown locations. (用已知估计未知 即:使用已知数据在未知位置上估计值
  • Image interpolation is an image resampling methods for image resizing (shrinking and zooming)
    • Image up-sampling resamples the original image as a new image with higher spatial resolution 上采样->分辨率更高
    • Image down-sampling resamples the original image as a new image with lower spatial resolution 下采样->分辨率更低

图像空间、灰度分辨率

图像插值

  最邻近元法 Nearest neighbor interpolation 双线性插值法 Bilinear interpolation 三次多项式插值法 Cubic polynomial interpolation
图示
原理 在待求象素的四邻象素中,将距离待求象素最近的邻象素灰度赋给待求象素。 利用待求象素四个邻象素的灰度在两个方向上作线性内插 利用三次多项式S(x)求逼近理论上最佳插值函数sin(x)/x,待求像素(x, y)的灰度值由其周围16个灰度值加权内插得到。
优点 计算量较小 没有灰度不连续的缺点,结果基本令人满意。 插值后的图像效果最好。
缺点 可能会造成插值生成的图像灰度上的不连续,在灰度变化的地方可能出现明显的锯齿状。 计算比最邻近点法复杂,计算量较大。且具有低通滤波性质,使高频分量受损,图像轮廓可能会有一点模糊 计算量较大。

空间标量场可视化

空间标量场插值

  • 目的:将离散点的测量数据转换为连续的数据曲面
  • 基本信息:单元类型/单元顶点上的数值/待求点的坐标
  • 公式:$D=\sum_{I=0}^{n-1} w_i*d_i$,不同的单元对应不同的权重$w$

应用

  • 颜色映射
  • 等值线/面

==平滑梯度锐化==

图像滤波

  • 定义:在尽量保留图像细节特征的条件下对目标图像的噪声进行抑制
    • 邻域操作:在图像中逐点移动滤波器mask,然后各邻居进行加权平均
  • 公式

图像平滑

  • 空间滤波—平滑滤波

    • 目的:模糊和减少噪声干扰
      • 可以进行n次,n越大越模糊
    • Output is the average of the pixels contained in the neighborhood of the

    filter mask

    • The same name as averaging filters or lowpass filters

图像梯度

  • 表示为向量:Gradient of digital image is defined by a vector
  • 表示为数字:Gradient at an edge point, (x,y), can also be interpreted as a complex number with its magnitude determined by
  • and the direction determined by

图像锐化(利用梯度信息)

  • 目的:突出细节和增强模糊细节
    • 注意:在这个过程中也可能会把噪声加强,因此一般先进行平滑处理
  • 空间滤波—锐化滤波
    • Highlight fine detail or enhance blurred detail

  • 做完锐化之后:
    • 记得灰度值==归一化==!!图像才能不那么黑!!$\frac{f(x)-\min_f}{\max_f-\min_f}\times 255$
    • 记得与原图进行叠加

卷积运算

空间变换

  • 表示方法:$X’=T(X)$
  • 实质:

线性变换

刚性变换

  • 2D: Rigid transformation preserves the angels and distances within the model
    • 只有平移和旋转操作,保持形状(即模型内部的角度和距离)不变
  • 3D: A 3D rigid body transform is defined by
    • 3 translations - in X, Y & Z directions
    • 3 rotations - about X, Y & Z axes
    • 注意:对xyz做变换的时候操作顺序很重要

相似变换

  • Similarity transformation adds scaling {s}
  • 公式:

仿射变换

  • Affine transformation applies a function between affine spaces which preserves points, straight lines and planes.
  • 公式:

非线性变换

  • Free-form Deformation 自由形变变换
    • 操纵包含物体的一个空间平行点阵来完成变形
    • 实现方式:薄板样条+自由形变
    • 算法步骤:

全局vs局部

局部仿射

  • 应用:地图可视化
    • 可能做法:放大整个街区,鱼眼放大
    • 基于网格,有针对性的方法(空间利用率更高,没有变形

空间标量场可视化

空间标量场

一维数据

  • 定义:一维空间标量场是指沿着空间某一条路径采样得到的标量场数据

二维数据

  • 可视化方法:颜色映射法、等值线映射法、高度映射法
  • 颜色映射
    • 步骤
      • 建立颜色映射表
      • 将标量数据转换为颜色表的索引值
    • 颜色映射 —— 传输函数设计
  • 等值线映射
    • 曲线上的每一点代表的数值相同 (iso-contour)
      • 稀疏的地方表示地形越平缓(变化小)。
  • 高度映射法
    • 高度通常用于编码测量到的数据 (3D柱状图)
  • 算法
    • 等值线计算
      • 三维等值面计算(Marching Cube)

三维数据

  • 定义:三维标量场指,分布在三维空间中,记录空间场分布的物理化学等属性及其演化规律的数据场。
  • 可视化方法
    • 截面可视化 – 常见的如三个正交平面
    • 间接体绘制 – 等值面提取 (matching cube共15种)
    • 直接体绘制
  • 举例
    • 医学影像数据
    • 地理气候数据 - 如:大气数值模拟数据

等值线-面

二维标量场的等值线

  • 算法——Divide-and-conquer algorithm
    • 每次关注一个cell
    • 比较这四个顶点的值与等值线C的大小情况
    • 对于边进行线性插值
      • 先标记出包含点P的边(点P的值为C):只要保证$v_1<C<v_2$即可
      • 计算点P的位置:$P=P_1+(C-v_1)/(v_2-v_1)*(P_2-P_1)$
    • 将所有点连接起来,线上的点值为C

三维标量场的等值面

  • 将二维的分治法扩大到三维
  • 三维等值面显示时法向量的重要性
  • 图像梯度
  • 颜色映射和动画
Marching cube算法
  • 相当于线性插值的3D拓展

  • 几何空间法
    • 八叉树
      • 每个节点存储最大最小灰度值区间[a, b] (8——代表将正方体八等分)
      • 搜索时从根节点开始,检测c是否处于[a, b]区间
  • 图像空间法
    • 视点依赖的等值面提取算法(体素遍历方法)
    • 移动四面体算法
  • 值域空间法
    • 每个体素的八个顶点的最大最小值作为坐标投影坐标轴
    • 优缺点:快!但耗内存!
  • Contour Propagation
    • 基本思想:Given an initial cell that contains isosurface, the remainder of the isosurface can be found by propagation/先找到一个含有等值面的初始cell然后进行传播
    • 挑战和难点:Need to know the initial cells

三维数据场表达

  • 空间数据网格
  • 网格采样方式
  • 离散采样重建
  • 空间数据特征计算
    • 空间数据特征
      • 梯度,一阶导数
      • 梯度模变化,二阶导数
      • 曲率,法向曲率,平均曲率,高斯曲率
    • 三维空间特征线
      • 数据场有关:折痕线(表面上相邻方向不连续的点构成的线),脊线和谷线(表面主曲率局部最大值)
      • 数据场+视点都有关:轮廓线,提示轮廓线
    • 艺术增强技巧
      • 点画,区域填充,阴影,光晕
    • eg. 视觉增强
      • 轮廓线(法向量与视线方向)
      • 用曲率控制轮廓线的厚度
  • 离散采样压缩(不掌握)

直接体渲染

面渲染

  • 意义
    • 必须通过阈值或极值的方法构造出中间曲面
    • 细节丢失,分割面被扩大
    • 更好的图形质量的需求

体渲染

  • 基本信息
    • 直接计算最终可视化里的每一个像素
    • 体绘制中所有体素对最后的图像亮度都有贡献

基于光线投影的直接体绘制方法

  • 伪代码:

  • 名称:Ray casting/Ray tracing
  • 关键步骤:采样重建、数据分类、光照计算、光学积分

体采样(采样重建)

  • 等距离采样——步长很关键
    • 步长太小(delta _t),速度太慢;步长太大,漏掉特征
  • 采样重建
    • 采样率
      • 每个体素至少需要2个采样点(不丢失太多本身物体包含的信息)
    • 自适应采样
      • 平缓均匀区域增大采样间隔
  • 常用的方法
    • 最近领域插值、三线形插值
  • 代码
t = t1;
v = undefined; 
while (t < t2){
    x = x0 + a*t; 
    y = y0 + b*t;
    z = z0 + c*t; 
    v = EvaluateRayFunction (v,t);
    t = t+delta_t;
}

体分类和传输函数(数据分类)

  • 传输函数

    • 定义:一组定义了数据值及其相关属性,不透明度等视觉元素之间的映射关系的函数,即:标量s->发射RGB和吸收$\alpha$

    • 设计

体光照模型(光照计算)

  • 典型的几种体绘制光照模型

  • 只发射、只吸收、吸收(不透明度$\alpha$)+发射(颜色RGB)、散射+阴影、多重散射

  • 体绘制中最常用吸收+发射模型
    • 发射 —〉颜色(r,g,b)
    • 吸收 —〉不透明度(α)
  • 梯度矢量

    • $I(x,y,z)$的一阶导数为

体积分 (光学积分)

  • 重点:一个像素点i只受到他前面的i-1个像素的影响,所以公式为

规则三维标量场的直接体绘制

  • 根据合成顺序的不同,体绘制方法分为
    • 图像空间扫描的体绘制方法(屏幕)
    • 物体空间扫描的体绘制方法(数据)
  • 图像空间方法

    • X光绘制、最大值投影、等值面绘制、半透明绘制(即上面的体光照模型)
  • 数据空间方法(掷雪球法)

  • 以三维空间数据场为处理对象,从数据控件出发向图像平面传递数据信息,累积光亮度贡献

  • 总结

空间向量场数据可视化

时空数据场

  • 多维度
    • 一维、二维、三维。。。(零维)
  • 多变量
    • 变量和属性的数目
    • 三维气象数据的(气压、温度、湿度)
  • 向量和张量场数据

空间向量场数据可视化

  • 向量场可视化主要目标
    • 展示场的导向趋势信息
    • 表达场中的模式
    • 识别关键特征

图标法

  • 采用的图标主要有:线条、箭头、方向标志符。
    • 经典方法:hedge hogs(刺猬)
      • 用带方向线段来表示矢量场的一个点图标
  • 采用复杂的图标可以提供向量场的其他信息
  • 优点:实现简单、直观、灵活。
  • 缺点
    • 可视混乱
    • 无法揭示出数据的内在连续性
    • 难以表达特征结构如涡流等
  • 质量提升方法
    • 最优的标记放置
    • 降低可视混乱,可自适应采样

几何法(全局)

  • 定义:几何法指采用不同类型的几何元素,如线、面、体模拟向量场的特征。

流线(stream line)

  • 适用:稳定的向量场 or 不稳定的某一时刻
  • 变种:流带
  • 注意:流线的路径是虚拟出来的走的方向

迹线(path line)

  • 适用:不稳定的向量场
  • 注意:迹线为动态流场中某一个粒子随时间推移而移动的轨迹,是真正的轨迹曲线

脉线(streak line)

  • 适用:不稳定的向量场
  • 注意:描述向量场在某一段时间的变化情况,为动态流场中某点持续释放的粒子在某时间点上的位置

  • Eg:抽烟的线/飞机的拉烟 日常生活中很容易看到

==对比==

扩展

  • 曲线法扩展
    • 面向稳定向量场
      • 流面(streamsurface)、流球(streamball)、流形箭头(stream-arrow)
    • 面向不稳定/时变向量场
      • 脉面(streaksurface)

纹理法(全局+高密度)

点噪音法(spot noise)

  • 按照局部流场方向对圆点变形

线积分卷积 (line integral convolution, LIC)

纹理平流(texture advection) (好像不用掌握)

  • IBFV(Image Based Flow Visualization)法
    • 将【之前的若干帧图像】和一系列【经过滤波的噪声背景图像】作为输入, 经过卷积生成下一帧图像
  • UFLIC(Unsteady Flow LIC)方法

优缺点

  • 纹理法的优点
    • 致密地表征整个流场
    • 特定的纹理特征
    • 适合表征动态矢量场
    • 无种子点问题(随机性)
  • 纹理法的缺点
    • 计算强度大
    • 特征表达不是非常直观

拓扑法 (好像不用掌握)

  • 任意向量场的拓扑结构由【临界点】和【连接临界点的曲线或曲面】组成

空间张量场数据可视化

基本概念

  • 张量

    • 张量是矢量的推广:标量可看作0阶张量,向量可看作1阶张量。
    • 一般我们只研究2阶,尤其是
  • 在某空间每个点处都有一个张量,该空间确定了一个张量场(tensor field)

    • 弥散加权成像的各向异性数据分布可简化成一个二阶对称张量,然后求特征值
    • 根据特征值之间的关系可将张量分为线性模型(Dl)、扁 平状模型( Dp)、球形(Ds)。
  • 弥散张量评价参数 (常用FA)

    • FA为0时接近球形 FA为1时接近线性模型 (像水沿着管道的时候速度最快)
    • 目的:用于衡量扩散过程(各向异性/扩散速度)
    • 平均扩散度

可视化方法 (类似于向量场可视化)

几何 (图标:纤维追踪)

  • 几何图标法
    • 椭球体、长方体、圆柱体、超二次图标等
      • 超二次图元在一定程度上能减轻视角影像
  • 几何:纤维追踪法
    • 概括:将张量场简化(与向量场相关)、只关注主要向量(即最大特征值对应的特征向量)
    • 主要思想:由于特征值最大的方向往往传达了最重要的变化趋势,所以不断跟踪特征值最大的特征向量,像追踪纤维一样可视化
    • 缺点:丢失细节信息、对参数敏感 (种子点放置的位置、积分的步长等)

纹理法

  • 体可视化
    • 对原始张量场数据进行噪声过滤后,选取部分属性值作为直接体可视化的域变量
  • 渲染FA值 (不用知道公式 要知道怎么用)
    • 以FA作为不透明度设计的体等值面
  • DTI数据可视化
  • 线积分卷积法
    • 核心思路:将张量场简化为向量场,进而采用线积分法、点噪声等方法显示
  • 基于噪声纹理的方法
    • 基本思路
      • 点集,作为噪声纹理输入
      • 类似线积分卷积的形式,对噪声纹理进行滤波

拓扑 (与向量场一样 跳过)

  • 退化点:张量场中各向同性(特征值相同)的点
    • 经典向量场拓扑可视化方法中的临界点/奇异点(如:鞍点、入点、出点)等都可以统一称为退化点
    • 张量场存在一类特殊的退化点类型:三分点
  • 步骤
    • 计算退化点的位置
    • 张量场中连接退化点的积分曲线或曲面计算

多变量空间数据场可视化 (概念性)

  • 区分:多维度和多变量
    • 变量维度:属性的数目
    • eg. 气象数据(气压、温度、湿度)三维变量
  • 数据分析与表达
    • 可视化基本手段(数据分析和特征抽取)
    • 统计分析
    • 降维
    • 对于特定的应用,必须根据数据自身的特点为其选择和设计适用的特征抽取方法和可视化表达方式。

时间属性数据和流数据可视化

时间属性的可视化

线性和周期时间可视化

  • 单轴序列图(折线图)——缺点:难以表达时间的周期性
  • 径向布局(螺旋形)——选择正确的排列周期,更加清晰的揭示数据的周期性
  • 多变量——考虑气泡图

日历时间可视化

  • 螺旋形日历
  • 日期day和时间hour可以堪称两个维度,第三个维度用于表示数据

分支和多角度时间可视化

  • 线性多角度时间可视化——多层次甘特图
  • 流状分支时间主线可视化——展现随时间流动、合并、分叉、消失的效果

多变量时变形数据的可视化

流数据的可视化

高维非空间数据可视化

数据维度

  • 增加视觉通道以表达更多的属性信息
    • E.g. 散点的形状、填充形式、颜色、大小等
  • 多视图协调关联

高纬数据可视化

数据变换 (降维)

  • 定义:
    • 使用线性或非线性变换把高维数据投影到低维空间
    • 投影保留重要的关系(无信息损失;保持数据区分等)
  • 形式化描述:
  • 方法:
  • 主成分分析(PCA)
    • 最大化投影后的方差
    • 最小化投影后的损失

数据呈现

  • 基于的方法——散点矩阵、径向布局
  • 基于线的方法——线图、平行坐标、径向轴
    • 线图:
      • 为单变量可视化方法
      • 可以通过多子图、多线条等方法延伸到表示高维数据
      • 可以通过不同的视觉通道编码不同的数据属性
  • 基于区域的方法——柱状图、表格显示、像素图、维度 堆叠、马赛克图
  • 基于样本的方法——切尔诺夫脸谱图、邮票图

数据交互

期末考试

  • 题型

    • 选择 10题

    • 填空 不确定多少题
    • 作答题 4题
    • 算法题
      • 不要放空白啊!
      • 理解了的话专业术语忘了也可以用通俗的话说出来嘛
      • 字不要太潦草!重点是抓住要点
  • 内容
    • 数据(基本概念)+不同数据类型的分类/归一化等等 需要理解和掌握
      • 数据预处理 数据清理整合操作 数据格式存储 这些不需要记 但是应该自然而然就能知道???
    • 感知认知、颜色和视觉编码
      • 视觉感知的加工过程【视觉感知->可视信息->编码->形成认知+交互->解决方案】
      • 高阶低阶【高阶:对物体识别和分类/ 低阶:针对看到的物体的物理信息(颜色、边缘信息等)】
      • 记住例子 格式塔理论 八个原则等理解即可 不会要求默写
      • 颜色在做图的时候很重要 涉及到色阶、亮度等 结合颜色、形状、布局来整体呈现一个图
      • 色彩空间 rgb cmyk等 应该理解和知道这些概念
      • 视觉通道 需要理解要素 要懂得表现力 不同视觉通道哪个表现力更高 定性定量的表现力不同
      • 视觉通道的特点特性等
      • 美学因素等
      • 直方图算法!作业!
    • 统计可视化、技巧、设计原则、基本要素
      • 统计图的七个要素??怎样才算是专业又美观的可视化图
    • 地图投影和性质(实践能力)
      • 怎么用python作图 这边主要是实践能力
      • 投影的概念、投影算法、不同投影的特点等
    • 数字图像、物理属性、算法
      • 数字图像的概念 包括怎么构建、模拟、对比度什么意思等等
      • 数据的物理性质 医学图像的理解上的一些物理属性 比如像素的物理意义 坐标系的转换
      • 算法!!!n多算法!!梯度、插值、灰度值、滤波器等等等!超多知识点和算法!!
    • 等值面、光线投影体渲染(关键步骤)、算法
      • 等值面作业算法!理解!
      • 奇异性的判断???在等值面的计算中比较花时间!
      • 体渲染的话东西比较多 理解光线投影体渲染算法 体采样体分类体光照模型体积分这四个步骤
      • 自己设计算法 重点是思路????我在记些什么?
    • 向量张量可视化方法
      • 图标法、几何法
      • 流线迹线脉线,脉线的“抽烟”线
      • 张量主要就是今天讲的这几个balabala
  • 其他

    • 只考课堂上讲过的 ppt上没有书上有的就不会考

    • 以课堂内容为主 不以课本为主


Similar Posts

Comments