采访/何晓华
黄志敏,前财新传媒CTO,财新数据可视化实验室创始人,被业界誉为“中国数据新闻第一人”,于2016年离职财新并创立“数据工场”,现专注于大数据与可视化。
从财新到数据工场
新闻实验室(以下简称实验室):你于1994年毕业于华南理工大学电子材料专业。请问你是怎么走上数据可视化这条道路上来的?
黄志敏:我一直对数据很敏感,也从事了多年互联网工作,2013年因为偶然的机会看到麻省理工媒体实验室的协和队演示数据可视化,被它的魅力打动,从此进入数据新闻和可视化这个领域,一发不可收拾。
实验室:当初你在财新领导数据可视化团队的时候,最大的困难是什么?是怎么解决的?这对你现在建立自己的团队有什么启发?
黄志敏:最大的困难应该是资源不足。新生事物前期都需要一定的投入,财务上要亏损一段时间,同时作为非核心业务,又不能让它拖累整个财新的财务报表。但如果不做较大投入,势必在竞争中落伍。其次,媒体的性质决定了它首先要为媒体服务,要重点做数据新闻,难免错过一些商业机会。
如何克服人手不足的问题呢?整个团队中,专门做数据新闻的人只有三四个,我组织了一个虚拟实验室,将不同部门的人组织起来,加上实习生,凑了十几个人的团队,因为每个人都很优秀,所以能做出一些不错的作品。自己创业后自由多了,可以尝试灵活的管理方式。以前看到好的人才,没法法高薪招进来,因为企业内部要顾及各种影响。现在招人不拘一格,薪水该给多一点就多给一点,我的目标是:招优秀的人,付两倍的薪水,做三倍的工作,大家都满意。
实验室:你说过,数据新闻的制作投入大产出少,因此非常需要资本的投入。那么离开财新,建立数据工场,会让你的团队生产变得艰难吗?建立数据工场最大的目标或者愿望是什么?
黄志敏:离开财新我的资源并没有减少,反而增加了。因为作为非核心业务,数据新闻团队在财新能获得的资源是有限的,在数据工场,所有的人力物力都投在数据可视化上,资源自然更丰富。不仅跟财新比,即使跟一些上市公司比,投入也更大。
建立数据工场,是为了满足市场对数据可视化和数据新闻的需求。过去几年,我办过上百次讲座,跟超过一万人有过面对面的交流,非常了解客户的表面需求和潜在需求,我也知道怎么去满足这些需求,现在要做的,就是去满足需求、降低成本、降低门槛。
实验室:数据工场团队的核心成员有多少人?业务主要分为哪些板块?在数据分析、挖掘等外包的业务上,是否和现在市场上十分活跃的、基于大数据报告的咨询公司一样呢?
黄志敏:我们团队的核心成员有十几个,分布在北京、南京、香港和美国,人才在哪,办公室就在哪。我们讨论项目主要是在线上,当然也得益于各类发达的协助工具。团队成员分布在不同半球的一个好处是:项目可以24小时无缝进行。有时中国同事下班,美国同事接手。
优秀的人才有个好处,就是主动性强,不需要你管理和督促。作为管理者,我要做的就是组建团队,协调资源,帮助大家发挥最大的价值。
数据工场主要有大数据、可视化和数据新闻等业务,我们一边研发产品,一边承接数据新闻外包和商业可视化项目。同时,我一直在做市场培养和行业普及,我举办各种公益性的培训、讲座、会议、比赛等,都不以盈利为目标。我相信行业发展了,需求会增加,企业也会获得更多的机会。
和咨询公司不同的是,我们专注在数据可视化领域,这也是我们的独特优势。现在很多数据公司集中在数据搜集和分析方面,但可视化模块并不突出,我们会帮一些大数据公司开发或改进可视化模块,建立紧密的合作。
不看好众包的生产模式
实验室:数据新闻的一个基础问题,也是很有挑战性的问题是:数据从哪里来。此前你所带领的团队做出来的数据新闻作品,其数据源主要是来自哪里呢?
黄志敏:可靠数据源包括政府和机构官网、官方媒体、彭博、万得等,不可靠的数据不能得出让人信服的结果。数据工场正在做一件事情,就是从数据源头下功夫,以帮助客户获得丰富、可靠、低成本的数据。
实验室:你之前在采访中说过,由于数据新闻的生产周期比较长,因此选题大多数集中在对时效性要求不太高的事实上。但时效性不高的事实往往缺乏权威、完善的数据,那么这个时候该怎么办呢?
黄志敏:数据的获取、分析、加工和呈现都需要花费时间,这导致数据新闻生产周期长成本高。我正在努力降低这个门槛,让客户节省下这个时间成本,这样应用场景会大大增加。
实验室:国内已有的数据新闻作品,题材大多局限在财经类、环境类等,为什么会这样?是市场导向还是技术局限?
黄志敏:三个原因吧:第一,数据可视化的表现形式,用来讲故事没有明显优势,更适合做数据分析和挖掘,所以一般社会题材不适合;第二,财经、环境等领域,数据更丰富;第三,有些领域虽然数据丰富,但跟个人关系不密切,或者专业性太强,而财经类、环境类等题材大家接受度更高。
实验室:你会期待数据众包的模式吗?例如鼓励用户自发完善数据库的行为。这样的可行性有多大呢?操作时需要注意什么?
黄志敏:我非常不看好用户众包的模式。数据可靠最重要,你又没法校验。如果十万行数据里被故意污染了几百条,你怎么发现?数据的提供者必须为数据的可靠性背书,个人用户背书没价值。
编程并不可怕
实验室:在使用体验上,PC端对于专业的数据可视化操作具有便捷性;但随着移动市场的白热化,数据可视化还是要克服技术上的难题,还要努迎合移动端市场的特点。未来,数据新闻在移动端和PC端的呈现将会有何不同?
黄志敏:电脑和手机除了屏幕大小不同,设备接口和使用时间等也不同,这要求在电脑和手机上有不同的设计形式。国外的数据新闻更多照顾电脑屏幕,而国内从传播考虑,更喜欢为手机订制作品。但数据新闻最重要的是新闻价值,没有新闻价值,再华丽也没有意义。
实验室:据不少用户的试用体验,以Echarts为代表的国内开源平台,要求用户要有基础的编程能力。这会不会打击大部分想要接触、认识数据可视化的用户的热情?
黄志敏:Echarts已经是相当简单的。目前国内的一个很大的认知误区是:编程是很可怕的。但其实这只是一门语言,掌握了其中的规则,便非常容易上手。这可能也跟国内高校教育不太重视计算机语言教学的普及有关吧。
实验室:数据工场有打算开发自己的前端产品吗?
黄志敏:正在研发,不只是前端产品,有一个完整的从数据到可视化的解决方案。
实验室:你曾说,数据可视化不应该是一个把事实或者文本复杂化,而应该让受众更直接去读取最核心的信息;但我从你之前的描述得知,数据可视化背后的设计、构思、逻辑都是十分精巧的,像传统的二维图形或者单变量图形也许算不上真正意义上的数据可视化。这样一来,将不可避免地导致它最终输出的产品复杂化,会给普通用户带来一定程度的认知困难。你是怎么看待的?
黄志敏:数据可视化最终极的目的是化繁为简,传递信息本质。如果设计者让受众在阅读图表后反而困惑了,那么这是个失败的作品,还不如不做。但这恰恰是数据可视化发展的最初阶段,设计者最容易陷入的误区。数据可视化的目的是降低数据分析和传递的困难,填平知识鸿沟。
数据新闻应该怎么教?
实验室:人们崇尚数据新闻,可能由于数据本身直观,并且认为数据有说服力。但也正由于这一点,在国内,数据屡屡被“震惊体”类的标题党,尤其是养生类谣言所利用。例如“外国研究表明熬夜将增加19%患心脏病几率”。你怎么看这种现象?
黄志敏:这就是涉及到人们是否能正确看待数据,也即是我们所说的数据素养。
今天我看到一篇署名“国家中医药官理局国际中心”的公号文章,里头有这么一段话:“在发生不良反应的药品中,化学药占81.2%,中药占17.3%。与西药相比,中药注射液的不良反应率并不高”,如果这句话成立,那我也可以说:“中国人90%以上死在床上,只有不足1%死于枪下,所以床比枪要危险得多”。这不荒谬吗?
数据只是一种客观存在,如果被别有居心的人利用,并且面向数据素养较低的群体,将会产生无法估量的危害。因此最根本的是提升全民的数据素养。这靠我和团队的力量解决不了,叫给学校和社会去解决吧。
实验室:根据你近一两年走访国内高校观察,你觉得我国高校数据新闻类课程的设置如何?
黄志敏:国内现在还是有不少高校开设数据新闻的课程,这点让人欣慰。但是课程的内容偏浅显,一个学期30多个课时下来,学生们可能也就获得“蜻蜓点水”的学习效果。
实验室:那你觉得比较完善(或者你理想中的)的培养计划应该包含哪些课程?
黄志敏:数据新闻是数据、内容、技术和艺术四个方法的接合,需要具备丰富的技能和知识,可以参考这张图:
实验室:数据工场主办的公益培训已经举办了第几期了?已经发展出的培训都有什么类型呢?
黄志敏:过去三年,我办了九十多场讲座,与一万人做了面对面交流。我主办和参加了十几次数据新闻工作坊,既有面向记者和学生的工作坊,还有两次专门面向数据新闻教师的工作坊。我还主持了两届高校数据新闻比赛,举办三次分享会。最近一次分享会,除了现场四百个观众,有一万四千名观众通过腾讯视频观看了直播。
实验室:最新一期的公益培训要求报名者“40天全脱产”参与。这个项目的最终成果是要达到什么效果呢?相比于上一次培训(寒假5天),这次面向的对象从教师群体扩展到学生、企业人士,但对他们的英语水平有较高要求。除了考虑到本次授课由外籍教师,是否也暗示了未来数据可视化人才也需要拥有一定的外语水平?
黄志敏:这个培训,我参考哥大新闻学院的LEDE课程,教媒介工作者或新闻学生玩数据写代码做设计。我从国外邀请一流学者,从国内邀请一流业界人士,给学员做指导。我希望通过培训的学员,不仅学到理论知识,还要掌握熟练的实操技能。这次培训为期五周办,前五周周一到周五上午上课,下午练习,晚上做作业,周六请业界讲师做实践指导,最后还有毕业设计。培养出来的学员不仅能做数据新闻,也可以在数字营销、整合传播、数据分析领域发挥作用。有人想参加又嫌时间长影响工作,但如果不做这样的安排,学不扎实,最后反而浪费至于对学员英语能力有要求,是为了跟国外讲师更好的交流,避免因为翻译浪费时间。
实验室:在此前的采访里,你一直都表示很难招到理想的团队伙伴,是指哪方面的人才?数据分析、图表设计、脚本撰写、选题策划?
黄志敏:最难找的是复合型人才。虽然讲求团队合作和角色分工,但复合型人才可以降低沟通合作,提高工作效率。
(添加时请备注姓名和单位)