专栏名称: 清华同衡规划播报
专业视角的规划资讯传播平台
目录
相关文章推荐
医学影像沙龙  ·  每天阅片500+,你的眼睛正在“拉警报”! ·  昨天  
丁香园  ·  年薪 69 ... ·  2 天前  
Clinic門诊新视野  ·  探索|JACC:合并多支病变STEMI的完全 ... ·  3 天前  
51好读  ›  专栏  ›  清华同衡规划播报

同衡视点 | 李栋:城市规划与管理中的数据分析和信息化建设

清华同衡规划播报  · 公众号  ·  · 2018-03-01 16:37

正文

本文为 北京清华同衡规划设计研究院技术创新中心常务副主任 李栋博士 所作同名主题报告,通过近几年的城市和数据工作,总结了数据在城市的应用及对未来发展的展望。


— 引子 —


大数据分析算不算是规划信息化?


对这个问题的理解我们自己也在不断变化中,最早在2013年刚开始组织北京城市实验室BCL时,我们更偏向认为大数据分析不是规划信息化。 4、5年过去了,我发现在概念的认识上还是有很多误区。


首先是对“规划信息化”的理解太狭隘 ,过去的概念仅只是给规划管理部门做一些成果管理或展示平台; 其次数据分析其实是密切依赖于各类信息化工作的 ,二者密切关联、相辅相成。这也是贯穿我近几年围绕城市和数据工作的最大反思。


来回顾当下数据发展的几个大趋势。


首先,全社会数据可用性极大增加。 当前全球超30亿人、约170亿设备联网在线,这些设备无时无刻不在产生数据。据统计,人类从直立行走到2003年所创造数据量总计5艾字节,到2007年短短几年间数据量已超了300艾字节;而到了2015年,全球网络流量接连翻番,数据量达到接近1000艾字节;预测到2025年,全球数据总量将增长至现在的200倍到170,000艾字节。可以说展望未来, 大数据时代其实还没有真正来临,数据发展将呈现更加富集的趋势。


其次,计算能力和算法挖掘手段全面提升。 计算能力得到飞速强化,强大的计算机通过网络连接,大量数据的并行处理成为可能,硬件方面也有很大的提升。现在的手机计算能力已经远远超过了早期的电脑,而且所使用的算法获得了全面的更新。十余年机器学习发展基础上,可以将这些庞大的数据和算力用于算法的训练,开发新规则来执行日益复杂的任务。以深度学习为代表的新手段得到持续优化,启发新服务,刺激了对AI领域各方面的投资和研究。 数据、设备、算法几个方面快速的发展,终将整个人类社会信息化的趋势逐渐推向一个又一个高潮。


1


— 信息化的两种场景 —


数据分析只是广义信息化的一个环节,我们可以简单做下分类。

类是 流程信息化(狭义信息化) ,指在既有机制下对业务的信息化改造,如政府委办局的办公OA等,流程和机制是预先规定好的。

另一类是 决策智能化(广义信息化) ,比如说我们要对城市发展的信息化做整合,而城市管理的规则和机制是开放的、不断发展和变化的,我们的挑战是如何运用信息化的手段处理这种挑战。利用信息化对开放系统进行综合决策,需要采集整理决策所需信息、设计多种决策方案、对方案开展模拟与预评估、对方案进行比选优化,对方案实施开展周期性监控、方案实施后评估等等,这是一个值得开展长期探索的方向,也是数据应用高附加值所在之处。


流程信息化,规则相对清晰、条件相对封闭、目标相对明确;而决策智能化规则相对模糊、条件相对开放、目标不够明确,依赖更多、更复杂、非标准化信息输入作为基础。 当面对决策智能化的时候,作为规划师会往往会感到信息焦虑以及对工具的渴求,会怀疑自己是不是遗漏了什么关键信息、从而对项目造成一些决定性影响,这是所有咨询者、决策者共同面对的一个很大挑战。


以规划编制为例,即使是同一个地区,即使是遵循相同的规划编制技术要求等规则,但由于每一次规划编制的背景不同、规划目标和实施手段也大相径庭,因此对规划内容本身(即待决策的方案)的评判标准也会存在很大的差异,更毋论如何对规划方案进行优化和持续改进了。

如果从一个更大的、数据的视角来看待这个问题, 流程信息化指利用自有数据解决自己的问题 ,比如财务报销自动化等,而 决策智能化则意味着要综合使用自有数据和他类数据 (alternative data),一起来解决自己的问题。

他类数据是指全社会其他部门数字化、信息化之后的积累 ,例如原本用于运营商计费和网优的手机信令数据,原本用于公交系统计费的市政一卡通刷卡数据,原本用于网站和APP经营的移动互联网流量内容数据等等。我们现在之所以能够在城市规划中利用这些大数据,其实都要感谢早年其他部门所做的信息化基础工作,虽然这些数据出现的动机并非是服务规划师。推广而言,所以 若想解决城市这类开放系统的决策智能化问题,就需要全社会每个部门都把自己的信息化工作做好。


2


— 建立基础“认知闭环” —


规划师扮演的是决策咨询的角色,为决策者出谋划策。 因此,我们自己首先要建立一个逻辑闭环,按照了解、认识、见解、行动的顺序。一般规划师往往更关注感知、认知与决策这三个环节,但对于“行动”,或者说“实施”,则是规划或者咨询业者不太擅长的。 规划信息化的工作其实在另一个层面就是在做“行动”或“实施”,在不断地修补、完善信息化系统。 所以我也特别希望规划从业者能够再多走一步,将分析出来的好方案亲手实现出来,建立起完整的数据思维闭环。


数据思维体现为对数据应用的工作流程(workflow)。

一是感知: 数据的清洗收集,对现实了解得更精细;

二是测度: 数据的分析评价,对状况判断得更合理;

三是挖掘: 数据的综合解读,对原因理解得更深入;


1、数据感知:对现实的精细了解

用精细化的数据感知来满足规划师对于信息渴求的状态。 例如,去年做朝阳区人口统计时,数据分析的目的不仅想了解朝阳区的总人口规模,还想知道人口分布的具体位置、根据每个位置人口活动的24小时规律进行分类等等。


再进一步细化 ,比如了解CBD片区每个小建筑里面大致人口分布的多少,工作日与非工作日的变化。甚至包括对每一个网格,都想去了解人口构成的结构与信息等等。


多源数据耦合、交叉检验。 当数据源不同时需要做一些检验,例如对一个地区的移动信令数据、滴滴出行数据、互联网定位数据做交叉对比,判断出哪个数据相对更合理。


2、数据测度:分析与评价

通过设计评价指标体系来联系物理世界与信息世界。 将信息空间和物理空间联系起来就是信息—物理系统(Cyber-Physical System),二者通过指标体系相互反馈、调控。


通过算法工具对状况的合理判断。 数据评价包括许多内容,包括评价方式。单纯把收集的数据落在图上,很难直观看出规律,需要模型、算法、工具来帮助形成一定的结构化指标,从而可得到诸如聚类、分析等结论。例如,右图中的方块是共享自行车骑行轨迹的时空热点,在相同时间空间,可以识别出哪里是骑行行为相对比较聚集的区域,并进一步分析聚集的原因和影响等。

自行车骑行轨迹热点时空分析


此外, 还需要把非结构化数据(如街景图片)变成可计算的结构化指标 ,这是大数据很关键的核心问题,需要借助专门的工具或一些技术手段来实现。

街景图像的计算机视觉分析


数据评价:对状况的合理判断。 在充分感知数据、分析评价数据之后,就加入结论判断环节了。例如我们可以根据骑行轨迹、街道状况等要素,对骑行环境做出综合评判。将结构化与非结构化数据叠合后,形成关键指标,根据问题和目标进行打分,最后得出好中差的观点。

基于街景图像数据的道路环节评价

围绕需求设计多源数据的关键评价指标体系

评价指标结果:某时段骑行热度空间分布(左);评价指标结果:某道路骑行热度时间曲线(右)


叠合分析的应用示例。 比如,在对北京危险品运输风险的大数据分析工作中,通过将危险品车辆GPS和同一时段人口分布进行重叠,识别出重叠率高的危险路段。左边是进城的路段中重合较高的部分、右边是危险品有大量聚集并停留较长时间的区域,把这些路段与片区识别出来,可以较好地预防一些危险品的泄露、爆炸等事故,避免不必要的生命财产损失。

危险品车辆出入城时段高重叠区(左); 危险品车集中地(右)


在设施评估案例里,我们对朝阳区32个2、3级医院开展了就诊人群分析,用医院的到访人口来源与分布情况,观测京内京外比重,看哪些医院是受外地人欢迎。

千人床位指标推算的理论覆盖范围(左); 手机数据表示的实际覆盖范围(右)


传统医院的配给指标是以一个区域的千人床位数来确定的,那我们可以根据这个指标反推出一个医院的理论覆盖范围,如左上图;但用人流数据可以更直观的看到一个医院的实际覆盖范围,如右上图。


通过对比,我们可以得到一些初步结论: 一是4环以外的人口聚集区缺乏医疗设施的覆盖;二是医院的就诊来源主要但不限于医院周边;三是某些外围的卫生设施如地坛医院存在覆盖范围重叠浪费的情况。


结合人口的本外地属性,可以看到,中国医学院肿瘤医院的外地患者最多,占到了44%,而其他的医院则逐次下降。


3、数据挖掘:现象背后的机制和规律

除通过数据分析了解现象本身, 继续探索现象背后发生的原因规律及内在机制,在大量评价指标中找出隐藏的规律 ,简单的方式如线性回归,对于城市这样非线性的复杂系统,最基础但有效的包括随机森林等。


以骑行行为挖掘为例 ,随机森林模型展示了影响骑行轨迹分布权重较大的因素,主要包括道路长度、功能兴趣点POI 总数、道路适宜度水平、公交车站300 米覆盖路段长等。


以上海城市人口结构挖掘为例 ,随机森林模型所示,影响上海年轻人分布权重较大的因素主要包括外地人口比重、最近轨道站点距离等。

主要影响因素及其权重


最后, 将利用仿真、模拟为主要手段,反向使用前述数据挖掘得到的结果,应用所获得的规律。 通过改变某些指标(对应城市规划或管理措施),使得决策树的走向发生变化,也即开展了一次政策预演,反复试算,使得我们可以基于隐含的规律对城市发展进行大量的沙箱模拟,寻求政策工具的最佳组合。

因此,自然而然地会观察到, 围绕数据流开展的这些工作,无论是处理非结构化数据还是剖析非线性关系时,我们都在严重的依赖算法作为工具。 在数据时代,算法的价值怎么重视都不为过。


全社会广义信息化需求将越来越旺盛。如果把上述数据流过程拓展到整个社会来观察,会发现他们是相辅相成的, 不同行业之间需要互相依赖彼此对数据的感知、测度、挖掘,最终实现整个社会的信息化和智能化。


3


— 城市规划与运行管理信息化 —


1、建设信息化系统

建设信息化系统体现为解决问题的创造性、实践性策略,主要强调三个原则:







请到「今天看啥」查看全文