词云

词云的简介

词云,又称文字云,是文本数据的视觉表示,由词汇组成类似云的彩色图形,用于展示大量文本数据。通常用于描述网站上的关键字元数据(标签),或可视化自由格式文本。 每个词的重要性以字体大小或颜色显示。 词云的作用:

  • 快速感知最突出的文字
  • 快速定位按字母顺序排列的文字中相对突出的部分

词云的本质是点图,是在相应坐标点绘制具有特定样式的文字的结果

英文名:Word Cloud

词云的构成

图表类型词云
适合的数据两个代表坐标的连续数据字段(自动计算)、一个代表文字内容的分类数据字段、多个代表文字样式的分类数据字段如颜色、大小、旋转角度等(可选)
功能对比文字的重要程度
数据与图形的映射两个连续数据字段映射到横轴和纵轴的位置、代表文字内容的分类数据字段映射到文字图形、多个代表文字样式的分类数据字段分别映射到文字图形的样式
适合的数据条数超过 30 条数据

词云的应用场景

适合的场景

例子1: 对比大量文本 下图是根据某段时间内使用 G2 类库的网站对 G2 类库的请求量数据绘制的词云,从图中可以一眼看出访问量最大的网站。

sitepv
localhost27,50
g2.alipay.com2339
......

说明:

  • 文本的坐标由词云布局工具自动计算
  • 文本颜色和旋转角度由词云布局工具随机生成
  • site 字段通过文字处理后映射到文本形状
  • pv 映射到文本大小。

例子2: 使用图片做边界限制 结合图片可以绘制出特定形状的词云

不适合的场景

例子1:数据区分度不大 当数据的区分度不大时使用词云起不到突出的效果

例子2: 数据太少 数据太少时很难布局出好看的词云,推荐使用柱状图

词云与其他图表的对比

词云和柱状图

  • 词云适合大量数据,柱状图适合少量数据
  • 词云展示文字更为直观,柱状图需要借助坐标轴和刻度表示文字的分类和数据
  • 词云可以映射更多分类字段在在文字样式上,柱状图只能映射一个分类字段在颜色上

标签