大数据可视化做为科技与艺术的交叉点,研究他可以更好的为业务和发展带来持续的推进力。而通过具体的案例,可以更深入的理解和使用大数据可视化。大数据可视化中数据处理、流程、工具等要点都可以在案例中得到一个很好的研究和学习。我们在收集大量数据分析比较后,确定使用成都地铁三号线流量数据做为案例的数据源。
成都地铁三号线流量数据拿到时的数据是一个二维表格,记录了各个站点在不同时间点的流量。但直接来看这个数据表格的话,还有以下问题:
数据过多,难以阅读和理解
数据之间对应关系无法直接看到
无法与现有地铁站直接对应
在分析数据后,我们发现,他是随时间而变化的连续数据,所以使用折线图非常适用。折线图可以很方便显示在相等时间间隔下数据的趋势。先直接使用 Excel 的图表功能来生成一下。
从上图来看,会比之前的数据要容易理解。但从大数据可视化设计角度来看,还有以下不足:
为解决以上问题,经过大家脑暴决定引入真实地铁地图,在地铁线路上来动态展示流量变化。然后我们按这套方案设计出交互稿与视觉稿。引入地铁地图后我们解决了辨识度不够的问题,每个站点都会有对应的光圈和线条来展示流量,这些数据与真实站点的关联性也更强。专业视觉设计过后地图效果在视觉冲击力也可以给人一个惊艳的感觉。再通过H5技术增加了各种动效,让整个效果更大生动和有交互性,产生更佳的用户体验。
(交互稿)
(视觉稿)
因为时间关系,制作案例的时间比较紧,在对业内开源地图的相关项目比较后,我们确定基于百度地图 API 和 Mapv (地理信息可视化开源库)来实现整个大数据可视化的设计思想。
在分析数据源、视觉稿和基本框架后,在实现上分为以下三层来实现。
其中,动态图表展示层的线条、圆圈动态效果,是开发的中重点和难点。
首先,线条数据是只能通过站点的流量来影射,但每一条的线条的路径数据我们目前并没有。所以只能先做一个小工具来手工绘制线条路径。
(折线生成器)
折线生成器主要记录生成线条数据的折点,但 Mapv 还不能创建补间点,在拼命唤醒各种三角函数知识后,写出以下函数来生成相关补间点。
function getPoint(p1, p2) {
var f = 0.0001;
var arr = [];
var Xz = p2[0] - p1[0];
var Yz = p2[1] - p1[1];
var Ca = Math.atan(Math.abs(Xz / Yz));
var Z = Xz / Math.sin(Ca);
var Xn = f * Math.sin(Ca);
var Yn = f * Math.cos(Ca);
var nums = parseInt(Math.abs(Z / f));
if (Xz < 0) {
Xn = -Xn;
} if (Yz < 0) {
Yn = -Yn;
} for (var i = 1; i <= nums; i++) {
arr.push([(p1[0] + (Xn * i)), (p1[1] + (Yn * i))]);
} return arr;
}
通过这种方式来生成从站点流出的线条,可以更直观的表现流量情况,但因为 Mapv 的限制,不能控制单个线条的显示隐藏,所以线条数量还未能与流量做成映射关系。
定时器
而圆圈的大小则可以与流量做到映射关系。但这里还要与时间轴关联起来,所以要使用定时器。以前定时器都是使用 setInterval() 来实现,现在可以用 requestAnimationFrame() 来实现,但还要对他做一改功能加强,来实现每秒循环次数的可配置。
var fps = 4;var now;var then = Date.now();var interval = 1000 / fps;var delta;function tick() {
requestAnimationFrame(tick);
now = Date.now();
delta = now - then; if (delta > interval) {
then = now - (delta % interval);
draw();
}
}
另外,文字数据展示层的数据变化也对应到定时器中。
最后,背景展示层的地图直接使用百度地图底图编辑工具实现即可。只要编辑好地图样式,然后获取样式 JSON ,然后调用 JSAPI 的 setMapStyle 方法。
当然还遇到了不少坑,走了不少弯路。主要遇到以下几个坑:
Mapv 开发文档不全,作者只给了些 Demo ,具体应用只能自己摸索。
Mapv 只能把所有线条生成到一个图层中,无法精确控制线条,如果分不同图层显示线条,电脑内存立马就不够用了。
Mapv 画不出内部渐变的圆圈,只能用模糊边缘来模拟。
数据可视化的定义在不同人眼中是不一样的。我们通过这次成都地铁三号线流量数据案例的演练,对整个流程中数据挖掘、提取、表现、动效等都有了进一步的研究和学习。
同时我们也在思考,有没有可能在单个案例之上,做出一个通用的数据可视化工具,而不只是专门为单独的案例做开发。而集合数据处理、流程、工具、展示的整体可视化工具,就是我们的下一下努力方向,敬请期待。
End
为了让大家能有更多的好文章可以阅读,36大数据联合华章图书共同推出「祈文奖励计划」,该计划将奖励每个月对大数据行业贡献(翻译or投稿)最多的用户中选出最前面的10名小伙伴,统一送出华章图书邮递最新计算机图书一本。投稿邮箱:[email protected]
点击查看:你投稿,我送书,「祈文奖励计划」活动详情>>>
如果有人质疑大数据?不妨把这两个视频转给他
视频:大数据到底是什么 都说干大数据挣钱 1分钟告诉你都在干什么
人人都需要知道 关于大数据最常见的10个问题
从底层到应用,那些数据人的必备技能
如何高效地学好 R?
一个程序员怎样才算精通Python?
排名前50的开源Web爬虫用于数据挖掘
33款可用来抓数据的开源爬虫软件工具
在中国我们如何收集数据?全球数据收集大教程
PPT:数据可视化,到底该用什么软件来展示数据?
干货|电信运营商数据价值跨行业运营的现状与思考
大数据分析的集中化之路 建设银行大数据应用实践PPT
【实战PPT】看工商银行如何利用大数据洞察客户心声?
六步,让你用Excel做出强大漂亮的数据地图
数据商业的崛起 解密中国大数据第一股——国双
双11剁手幕后的阿里“黑科技” OceanBase/金融云架构/ODPS/dataV
金融行业大数据用户画像实践
“讲述大数据在金融、电信、工业、商业、电子商务、网络游戏、移动互联网等多个领域的应用,以中立、客观、专业、可信赖的态度,多层次、多维度地影响着最广泛的大数据人群
搜索「36大数据」或输入36dsj.com查看更多内容。
投稿/商务/合作:[email protected]