上一篇对专利数据分析进行了一个概览,其中也提到很多分析过程实际上也是跟专利可视化相联系的,专利分析可视化主要强调的是将专利分析的结论以吸引人的展示方式让受众得以愉悦地接受。确实对于枯燥的数据分析来说,很少有人能提起兴趣,尤其是专利数据分析这么小众的领域,因此,通过可视化的方式来表达观点和吸引眼球就显得尤为重要。
但笔者不得不提醒的是,这又是另一个无底洞!当我们去搜索关于可视化的开源工具时,会发现多得惊人,这本身就是一个特殊学科方向,混杂着美学、设计艺术、计算机艺术,甚至包括心理学在内的多个学科。我们经常发现有些报告里面的专利分析图表非常高大上,令人羡慕不已,其中有些不乏是可视化原创高手,但是,以笔者的经验,大部分都是要工具来实现的,通过合理使用工具,可以让可视化小白迅速伪装成可视化高手。下面将通过设计师派、数据分析师派、程序员派来介绍可用于专利分析可视化领域的开源可视化工具。
1.设计师派
可视化本质上是一种平面设计,属于平面设计师的工作范畴。说到平面设计,就必须懂一些平面设计的基础知识,比如说色彩理论,包括色彩的饱和度、明度、对比度等,还包括字体选择,比如说现在大行其道的微软雅黑,当然更重要的还是设计师的审美。对于专利分析中,目前比较受欢迎的是采用信息图表(Infographic)的方式来表达专利分析的结论,这就是典型的设计师派,通过对图表元素的形状,色彩,比例以及版面进行设计,来美观地表达出专利分析形成观点。如果要原创地设计信息图表需要有一定的设计功底,而且要花费一定的时间,因此,最好的方法就是直接上工具。而涉及在线信息图表的工具也非常多,常见的包括包括Visual.Ly,Venngage,piktochart.com,更为详细的信息可参见这篇文章。
Piktochart.com
2.数据分析师派
设计师派要解决的问题是可视化中比较浅层的问题,就是为了让受众比较愉悦。而要展示出数据内在复杂关系时,设计师派往往就无能为力了,因为这种可视化依赖的更多的是数据分析。在这方面比较典型的例子是网络分析和词云分析,网络分析所用的重要开源分析工具就是前一篇提到的Gephi,这是一款专业的网络分析工具,从数据源,到网络空间的形成一直到网络图形的渲染,都提供了很多功能。在本系列文章开头提到的动物基因报告就是大量采用了Gephi形成的高大上网络分析图。另一个比较重要的网络化分析工具就是python工具包networkx,通过自定义的脚本,可以形成更加灵活的网络图,但是其形成的网络无法进行设计层次的调整,即无法像Gephi一样进行艺术渲染,视觉冲击力打了一定的折扣。在可视化领域比较重要的开源工具还有R,首先R作为一款专业的开源数据分析工具,一直都是专业数据分析师的选择,其在图形可视化方面有著名的ggplot2工具包提供了一种非常灵活的图表设计语言,有兴趣的读者可以进行深入研究,这款可视化工具包也是计算机与艺术的完美结合。
Gephi
3.程序员派
设计师派和数据分析派能够解决传统平面设计层次的可视化,可是当上升到交互式的可视化时,就显得力不从心了。涉及交互式的可视化设计的开源工具包也是层出不穷,但是如果需要调用这些可视化工具包需要具备一定的编程基础。国内比较著名的开源可视化工具包是百度推出的Echarts,这个工具包提供了一系列图表类型丰富、配色美观的交互式图表插件,可以通过常用的编程语言进行调用。此外,国外也有很多优秀的可视化工具包,比如plot.ly等。通过这些可视化工具包,可以对可视化的元素进行更灵活的调整,并嵌入到其他成熟的信息化产品中。 Echarts
迁徙图
上述对可视化的几种派别以及可用的开源工具进行了介绍,可见,一个完美的专利可视化专家需要具备专利信息专业知识,还要兼具设计师,数据分析师和程序员的综合气质。