转载来源:数据挖掘与大数据分析
近期,由上海万科与多家高校及城市数据团合作搭建的专属于万科的大数据分析平台正式上线了。这是万科在推动房地产行业的大数据化、引领地产行业转型潮流上踏出的重要一步。
该平台以清晰易用的可视化交互方式,将复杂的大数据技术聚焦在房地产行业的实际业务当中,从
『动态监测』『信息查询』『数据分析』
三种不同层级,满足公司员工各业务端口的工作需求。
更
清晰全面
的
了解
城市
每一块土地
的
真实情况
及
价值潜能
更
细致客观
的分析
市场走向
追踪
一二手房
真实成交
情况
更
深层直观
的
洞察人群
通勤方向、潜在需求及购买行为
据了解,此次万科大数据平台整合了多家
先进的数据源
,通过建立
先进的分析模型
,对已知客观事实用
先进的分析维度
进行验证,同时对未知的市场及客群进行分析研究。
参与此次万科大数据平台搭建的优质数据资源方多为各行业领先企业,提供除了传统市场数据外更多维度的:
● 城市级大数据 ——
包括人口、经济、交通、基础设施等;
● 人口移动数据 ——
包括全市地铁通勤、专车及出租车通勤等;
● 通过线上线下实时监测所获得的活跃购房客户特征数据 ——
包括人口消费习惯 、人口行为特征等。
据介绍,万科此次搭建大数据平台的初衷,就是希望能够颠覆传统开发商所采用的分析方式与路径,通过运用先进的分析模型,对大量复杂抽象的数据进行整合分析,从而反映本质事实,揭示内部规律,辅助各项决策。
在进行如人口密度、基础设施密度、客流密度来源等要素密度进行分析时,万科大数据平台采用了核密度分析模型。该模型通过采集待分析标的要素的信息,设置分析半径范围,通过算法计算要素在其周围邻域中的密度。
在对某要素分布空间范围进行分析及预测时,万科大数据平台采用了空间插值模型。
研发人员首先假设空间位置上接近的对象具有相似的特征,于是通过自然邻域插值法,找到距查询点最近的输入样本子集,并基于区域大小按比例对这些样本应用权重进行插值,进而对区域所有位置进行预测。
▲
模型分析实例:上海成交新房按单价及总价的不同空间分布
在分析如城市或区域人口通勤方向及发展趋势时,则采用了OD/PA分析模型。该模型以千万级的智能移动设备大数据为基础,对全市人口出行进行拟合计算,可以了解要素流动情况。
▲ 模型分析实例:市民出行OD图(左)、现居地与搜索房屋距离PA图(右)
在研究要素关系网络、城市群相互联系时,万科大数据平台的研发人员采用力导向布局分析模型。
该模型将每个要素表现为一个点,要素间的联系表现为边,通过计算各要素间的关联度,绘制出拓扑关系网络图,表现要素间的聚集度和紧密度。
▲ 力导向布局模型示意图(左);模型分析实例(右):长三角城市群联系度力导向布局图
通过对轨道交通站点客流出行方向和数量的分析,从而对断面客流量进行评估和趋势判断。
城市存在空间聚集效应,要素将受到本空间单元和临近空间单元的共同影响。因此在对某特定研究对象进行要素影响分析时,平台研发人员运用空间计量模型使结果趋于客观精确。
在进行目标板块价值评估模块设计时,研发人员将万科传统的PIE模型与板块评价体系所涉及的多维度数据进行基于计量经济学模型的系统化整合,将他们分为6个大类和19项重点指标,构建板块价值计量模型。并以此为基础,通过数据预处理、回归及相关性分析后,对被解释变量进行评估及预测。
数据源往往存在缺陷,如对人群的抽样存在偏差、年代不够新、数据维度较少等。因此,万科认为,需使用不同数据源对同一个问题进行研究,以此能够相互印证的结论才更具说服力。
如通过多维比较常住人口数据、新房销量地均密度数据和人口通勤数据,分析近十余年来上海人口转移方向。
传统分析方法往往以板块和地块作为分析单元,但在日常工作中,待分析对象则需要根据研究目的进行调整。因此万科大数据平台创建了自定义分析单元,以此拓展分析方向,发散思维,提高决策判断的准确性。
如对商业物业的选址进行决策时,会将现有商圈的势力范围作为分析单元进行研究。
如对地铁上盖物业产品类型进行选择决策时,会对各地铁站早高峰客流进出占比进行研究,了解地铁站产业或居住属性特征。
在对特定人群进行更细化的研究时,传统路径是采用客户调研的方法,但样本基数及回答真实性都会影响研究结果。万科大数据平台则可以根据用户的线上线下行为,利用机器学习算法,对其个人属性、职住地点、兴趣爱好等进行判断,进行多角度画像。
只有了解客户、接近客户,才能提供让客户满意的产品与服务。
值得一提的是,万科此次将智能设备采集的数据与优质合作方提供的资源进行整合,以大数据机器学习算法对全市范围内的典型活跃客户及项目到访客户数据进行深加工,对细分市场上不同消费群体的特征及分布进行了解与研究。
此外对采集到的原始标签数据进行补全计算或赋予布尔值、类型值。再加入房地产行业客户分析逻辑,在家庭结构、置业需求、购房能力、还贷能力方面,将原始标签合并成新的标签进行计算,最后得到客户的多维度画像、存储和输出。
正因为有了清晰的客户画像,万科才能更好的进行产品及项目的设计定位,进而为客户提供满足他们真正需求的更好的产品与服务。