数据可视化领域发展报告-基于期刊 IEEE TVCG

数据可视化

可视化,把数据转换为图形、图像的方式,帮助人们理解大量的和复杂的数据。

可视化,也可以看作是一种翻译,即将数据(语言)翻译成图形图像(语言)。

本文通过对可视化领域内的一本顶级期刊 IEEE TVCG 进行抽丝剥茧的分析,从而建立起对可视化领域发展的全局认知。

IEEE Transactions on Visualization and Computer Graphics (缩写:IEEE TVCG),创立于 1995年,属于 IEEE computer society 旗下的子期刊。 TVCG 每月出版(2010年及以前是双月刊),发表与计算机图形学、信息和科学可视化、视觉分析、虚拟和增强现实有关的论文,重点关注这些领域的理论、算法、方法学、人机交互技术、系统、软件、硬件和应用。

TVCG 1995年创立时,填补了当时没有涵盖可视化和计算机图形技术、系统、软件、硬件和用户界面问题等所有领域的档案级期刊的真空,具有较高的影响力。

目前学科公认可视化有三个主要研究方向:科学可视化、信息可视化、可视分析学。

为何如此划分? 一方面,与 IEEE VIS 可视化学科会议的子主题相关,另一方面,也是随着学科研究主题的演化逐步形成的。

科学可视化,主要研究如何可视化科学研究中产生的大量数据,比如流体动力学模拟产生的数据,医学图像如CT/MRI 数据,向量场和张量场等。这些数据本身往往包含在真实世界中存在的几何结构。

信息可视化,主要研究的是抽象数据如文本、图像、网络、股票、社交媒体等。这些数据本身并没有看得见摸得着的几何结构。人们只是把它们转换为图形图像的方式便于理解。

可视分析学 visual analytics 是一门以可视交互界面为基础的分析推理科学。它综合了三大板块的交叉研究:

  • 数据分析:数据获取、数据处理、数据挖掘
  • 人加工信息的方式:模式识别、视觉感知
  • 可视化:计算机图形学、科学可视化、信息可视化

其中,不容易变化的是:人脑处理视觉感知的系统、计算机图形学。变化较快的是:数据类型多元化,数据量增长飞速,计算机数据处理技术。

可视化不仅仅是辅助分析推理,也是一种表达和传播。

近年来,随着数据科学、深度学习、神经网络等等这些学科的发展,可视化领域也更多呈现出使用新技术的趋势。

未来可预见的是,Visual Analytics 可视分析学研究与新技术的结合,创造出更加符合人脑智能与机器智能的产品,让人们更便捷地使用可视化辅助分析、推理与决策。 人和机器各有所长。计算机在数据存储和数值计算远超人类,技术的发展,使得机器也初步具有分析、预测能力;而人类在复杂事物认知、常识和创意的能力机器尚无法实现。通过设计好的可视化作为界面,把人和机器结合起来,可以大大提高人类的知识认知能力。

我们从 Web of Science 下载了 1998-2022 年的论文数据资源,筛选文章类型,仅保留:论文、综述论文,剩下4285篇文献。以此为基础,展开研究主题分和关键学者分析。

研究主题分析

主题演化

整体来看,早期研究主题:点渲染、纹理贴图、三角测量、等值曲面等,更偏向于计算图形学和几何学; 中期主题:立体渲染、信息可视化、图形绘制、可视分析、医学可视化、gpu等; 近几年,三维显示、虚拟现实体现出可视化开始研究虚拟场景的应用。

20230315-001

近三年 2020-2022 年的主题集群:

  • 红色:任务分析、数据可视化、可视分析学
  • 蓝色:三维显示、渲染(计算图形学)、计算机建模、特征提取、深度学习、优化
  • 绿色:虚拟现实、虚拟环境

20230315-002

研究集群

按 Historiograph 分析方法,可分为3个学者群:

(一)绿色集群:研究多维关系数据库的可视化。细看又可以分为几条线

  • 以 stolte c 2002 为起点
    1. stolte c 2002年发表文献《Polaris:一个用于查询、分析和可视化多维关系数据库的系统》,如今可视化软件领头羊 Tableau 是 Polaris 系统的商业版本。
    2. Mackinlay 2007年发表文献《Show Me:视觉分析的自动呈现》,介绍了Show Me,一套集成的用户界面命令和默认值,它将自动呈现纳入一个名为 Tableau 的商业可视化分析系统。Tableau 的一个关键方面是 VizQL,这是一种用于指定视图的语言,Show Me 使用这种语言将自动演示扩展到视图表(通常称为小型多显示器)的生成。
    3. Munzner t 2009年发表文献《一个嵌套模型:用于可视化设计和验证》,提出了一个可视化设计和验证的嵌套模型,包括四个层次:用问题领域的词汇表来描述任务和数据,抽象为操作和数据类型,设计可视化编码和交互技术,以及创建算法来有效地执行技术。上面一层的输出是对下面一层的输入,使人们注意到设计上的挑战,即上游的错误不可避免地会串联到所有下游的层次。
    4. Sedlmair m 2012年发表《信息可视化的实证研究:七种场景》,做出了两个贡献。第一,概括了目前信息可视化研究界的做法;第二,提供了一种不同的方法来决定什么是对特定信息可视化最有效的评估。
  • 以 heer j 2007 为起点
    1. heer j 2007 发表文献《可视化的图形化历史:支持分析、交流和评估》,研究了信息可视化的历史机制的设计。我们提出了一个关于架构和界面问题的设计空间分析,确定了设计决策和相关的权衡。基于这个分析,我们为Tableau(一个数据库可视化系统)的图形化历史工具提供了设计研究。这些工具记录和可视化了交互历史,支持数据分析和交流结果,并为展示、管理和输出历史贡献了新的机制。此外,我们还分析了历史会话的集合,以评估Tableau的使用。我们描述了分析用户历史记录的其他工具,以及如何应用它们来研究Tableau的使用模式。Jeffrey Heer 与迈克 · 博斯托克一起研究 Protovis 和 D3.js 系统。与学生和合作者一起开发 Vega 和 Vega-Lite 可视化语法。与乔 · 赫勒斯坦和肖恩 · 坎德尔一起开发了用于数据转换的交互式工具 Data Wrangler 。
    2. Bostock m 2011 发表文献《D-3: 数据驱动的文件》,数据驱动文档(D3)是一种新颖的透明的网络可视化方法。D3不是将底层的场景图隐藏在一个特定的工具包的抽象中,而是能够直接检查和操作一个本地的表示:标准的文档对象模型(DOM)。本期刊高被引第一名。Michael Bostock 是一个 JavaScript 库D3.js (用于生成动态的、交互式的在线数据可视化)的核心开发人员之一。是斯坦福大学的博士生,由杰弗里 · 希尔(Jeffrey Heer)指导。
    3. Wongsuphasawat 2016 发表文献《Voyager: 通过可视化建议的分面浏览进行探索性分析》,一般的可视化工具通常需要手动指定视图:分析师必须选择数据变量,然后选择应用哪些转换和可视化编码。这些决定往往涉及到领域和可视化设计的专业知识,并可能造成繁琐的规范过程,阻碍了探索。在本文中,我们试图通过对自动生成的可视化图库的交互式导航来补充手工构建图表。
    4. Satyanarayan 2017 发表文献《Vega-Lite: 交互式图形的语法》,获得了最佳论文奖。提出了Vega-Lite,一个能够快速规范互动数据可视化的高级语法。
  • 以 Viegan fb 2007 为起点
    1. Viegan fb 2007 发表文献《Many Eyes:一个互联网规模的可视化网站》,一个公共网站,用户可以上传数据,创建互动的可视化,并进行讨论。该网站的目标是支持大规模的可视化合作,促进社会风格的数据分析,其中可视化不仅是个人的发现工具,也是刺激用户之间讨论的媒介。
    2. Segel e 2010 发表文献《叙事可视化:用数据讲故事》,通过对新闻媒体和可视化研究的案例研究,我们确定了叙事性可视化的不同类型。我们将这些设计差异与交互性和信息传递一起,从作者意图的叙事流程和读者的故事发现之间的平衡来描述。

(二)蓝色集群:研究信息可视化中的主题图

  1. havre s 2002年发表文献《ThemeRiver:大型文件集的主题变化 可视化》,描述了大型文档集合中随时间变化的主题。主题变化在时间线和相应的外部事件的背景下显示。
  2. Cui ww 2011年发表文献《文本流:实现对文本中不断发展的主题的更好理解》,理解文本数据中的主题如何演变是一项重要而具有挑战性的任务。尽管有很多工作致力于话题分析,但对话题演变的研究在很大程度上局限于单个话题。在本文中,我们介绍了TextFlow,一个可视化和话题挖掘技术的无缝整合,用于分析多个话题出现的各种演变模式。我们首先扩展了现有的分析技术,以提取三个层次的特征:话题演化趋势、关键事件和关键词的相关性。然后,我们设计了一个由三个新的视觉组件组成的连贯的视觉化,以表达它们之间的复杂关系。
  3. Liu mc 2017年发表文献《一种对深度卷积神经网络的视觉分析方法》,深度卷积神经网络(CNN)在许多模式识别任务中取得了突破性的表现,如图像分类。然而,高质量的深度模型的开发通常依赖于大量的试验和错误,因为对深度模型何时和为何工作仍然没有明确的认识。在本文中,我们提出了一种视觉分析方法,以更好地理解、诊断和完善深度 CNN。

(三)红色集群:研究信息可视化中的图形呈现、关系表示

  1. herman i 2000年发表文献《信息可视化中的图形可视化和导航:一个调查》,一份关于图的可视化和导航技术的调查报告,用于信息可视化。
  2. holten d 2006年发表文献《层次化的边缘束:分层数据中相邻关系的可视化》,提出了一种新的方法来实现这种复合图的可视化。

关键学者分析

Top20 高产学者

2020 年以来,近三年发文最多的五位学者及其论文标题关键词,按发文总数从高到低, 分别是:

  • QU HM (屈華民 (Huamin Qu)):香港科技大学教授。可视化和人机交互,重点是城市信息学、社会网络分析、电子学习、文本可视化和可解释人工智能(XAI)。美国石溪大学计算机科学硕士和博士。
  • WANG Y(Wang Yun):微软亚洲研究院高级研究员。automatic generation 自动生成、deep learning 深度学习、visual analytics and storytelling、人工智能促进人类的数据分析工作流程。香港科技大学计算机科学与工程系的博士,QU HM 的博士生。
  • WU YC(巫英才 (Yingcai Wu)):浙江大学教授。视觉分析: 城市信息学,体育分析,社会媒体信息可视化和人机交互。香港科技大学计算机科学与工程系的博士,QU HM 的博士生。
  • CHEN W(陈为 (Wei Chen):大数据分析和人机混合智能。浙江大学博士。
  • MA KL(馬匡六 (Kwanliu Ma)):加利福尼亚大学戴维斯分校教授。大数据可视化、视觉分析、视觉叙事、科学可视化、智能系统、沉浸式可视化。犹他大学计算机科学博士。

高被引学者

期刊内部互相引用,前 20 位高被引学者:

前 10 位高被引学者中,有五位:HEER J(Jeffrey Michael Heer)、MUNZNER T(Tamara Macushla Munzner)、SEDLMAIR M、HAUSER H、CARPENDALE S 未出现在前 20 大高产学者名单中。

期刊内部影响力指标 h-index:

MA KL、QU HM、PFISTER H 、PASCUCCI V 均是在前五大高产学者列,第四名 SHEN HW 高产作者中排名第七,但内部影响力排名第四,值得关注。

他是Hanwei Shen ,俄亥俄州立大学计算机科学与工程教授,从1996年到1999年在美国宇航局美国国家航空航天局埃姆斯研究中心工作。在1998年获得了科学计算与成像犹他大学的博士学位,在石溪大学获得了理学硕士学位,在台湾大学获得了理学学士学位。

高产机构

最高产的机构前三,分别是犹他大学、浙江大学、加利福尼亚大学戴维斯分校。

犹他大学

  • 代表学者:Alexander Lex
  • 犹他大学计算机学院副教授,从事教学,同时研究可视化方法和系统,以帮助解决当今生物医学领域的数据分析问题。公司 datavisyn 的联合创始人,该公司为制药业开发可视化分析解决方案。在奥地利格拉茨工业大学获得博士学位。
  • 他和他的实验室发表了许多开源软件包,包括 UpSetLineUPLoontrrack
  • 研究兴趣:交互式数据可视化,生物信息学,生物医学的可视化,科学家和专家的数据分析方法,可视化分析,人机交互,数据科学。
  • 实验室:Visualization Design Lab

浙江大学

  • 代表学者:陈为 (Wei Chen)、周昆 (Kun Zhou)、巫英才 (Yingcai Wu)
  • 实验室: State Key Lab of CAD & CG 国家计算机辅助设计与制图重点实验室

加利福尼亚大学戴维斯分校

  • 代表学者:馬匡六 (Kwanliu Ma),1993年获犹他大学计算机科学博士学位,1999年加入加州大学戴维斯分校。现任加州大学戴维斯分校可视化中心主任。
  • 他的研究旨在使可视化成为大数据分析和发现的有利工具。随着商业、医疗和保健、工程设计和科学研究等几乎所有领域都变得越来越由数据驱动,可视化显然是人类用户访问、分析和解释大数据的最佳界面。
  • 实验室:VIDI Labs

高被引论文

  • 第一篇高被引论文是2011年发表的 D3 Data-Driven Documents,一个研究数据与文档绑定的框架,网站:https://d3js.org/
  • 第二篇2014年发表的 UpSet: Visualization of Intersecting Sets;一个研究集合之间关系的框架;网站:https://upset.app/

未来展望与行动

可视化是一个跨学科交叉领域,涉及的知识非常杂,仅通过一本期刊想要全面了解它的发展历程和关键知识,还不足够。还需要广泛结合认知科学、数据科学等等其他领域的研究,一并探索。

行动:

  • IEEE VIS 会议论文研究和定期追踪。因为 VIS 是可视化领域最重要的会议,每年只有其中一部分最佳论文收录在TVCG,其中还有很多值得了解的信息。
  • IEEE/CVF Conference on Computer Vision and Pattern Recognition 定期追踪。因为可视化领域会随着技术变迁、数据处理等而发展,因此也需要关注计算机领域最重要的期刊。

宝藏资源分享

  • 智谱 AI: https://www.aminer.cn/ , 旨在为学术社交网络的搜索和挖掘提供最好的服务
  • 计算机科学领域-学术排行榜:https://csrankings.org/
  • 计算机科学-数据库:https://dblp.org/
  • IEEE 学术会议数据库:https://www.computer.org/csdl/proceedings
  • WikiCFP,一个论文查询数据库,基于semantic scholar:http://www.wikicfp.com/cfp/
  • Visual analytics 相关的资源网站:https://www.vismaster.eu/related/
  • 学术常用短语手册:https://www.phrasebank.manchester.ac.uk/introducing-work/
  • 一个免费的分发服务和一个开放存取的档案馆,数字开放存取的先驱,存放8个领域:物理学、数学、计算机科学、定量生物学、量化金融、统计学、电气工程和系统科学以及经济学领域的200多万篇学术论文。https://arxiv.org/
  • CVonline 是计算机视觉、机器视觉、图像分析以及一些视觉心理物理学和视觉神经生理学的资源:https://homepages.inf.ed.ac.uk/rbf/CVonline/

ChangeLog

  • 郑嘻嘻 创建于2023年3月,信息来源于 WOS。完整报告可联系作者。

标签:

分类:

更新时间: