作者 | 余沛浩,江颖
大数据文摘欢迎各类优质稿件
请联系[email protected]
几年前有一首叫做《风生水起》的歌,小小地火过一阵子,如今如日中天的麦玲玲风水运程大师,被农夫组合直接唱到歌词里,虽有几分戏谑,但确实借由此歌走进大众视野——
风生水起
农夫组合
玲玲出嚟又睇掌喇
睇掌睇掌睇相
急急如律令
一命二运三风水
究竟点解
佢出世嗰时含住条金锁匙
究竟为什么
他出生的时候就含着金钥匙
又点解
我成间屋仲细过佢个坐厕
又为什么
我整间屋子比他的坐厕还要小
又点解
我次次买六合彩时中得一个字
又为什么
我每次买六合彩只中一个字
都说投胎是个技术活,为什么有人含着金汤匙天生的宝玉良缘,为什么有人坎坷一生蹉跎半世。
同样的,做生意是一件很奇怪的事情,有人赚有人亏。有些店铺装修堂皇,地段人流量大,但就是赚不了钱,做什么亏什么,但有的人天生一副“大发”命,一路旺旺旺,这究竟是为什么呢?
简单一句话——店铺风水很重要。
谁不想发,那就让大数据来帮你分析论道,到底如何才能精准选址,找到最好的风水宝地:
过去由于数据和技术的局限性,大部分企业在商业选址中仅仅考虑局部的因素(人口、交通便捷性),而随着DT时代的到来,考虑的因素将变得更为全面。
比如,星巴克在过去的门店选址中,通常只考虑门店周边的客流量和交通便捷性,但现在不仅增加对商圈环境、人口密度的考虑,还会运用GIS技术分析周边人群教育水平和高收入群占比。
可见,大数据+商业选址将会是重要的发展方向。下面就以原力大数据将一个大型房地产商业选址为例,揭秘大数据如何帮助企业挑选一个稳赚一个亿的“风水宝地”!
某公司计划建设集休闲娱乐于一体的商圈,候选区域为广东东莞的万荟时代、长盛广场、远大城市广场、环球贸易城,目标是挑选出可获得最大利润的最佳区域。
▲候选区域分布图
根据整分合原则,逐步分解目标:
▲目标拆分思路
要找好地头,关键要看区域有效人流量、平均消费额、区域土地成本和运营成本。
1.圈定候选区域客户群:只对长期在本区居住、生活的人群进行分析,保证数据代表性;
2.描绘区域客户特征画像:为洞察需求、识别有效人流做准备;
3.识别与对比区域有效人流:根据需求筛选有效人流,判断潜在客户量;
4.区域收入与成本预估:看平均消费额及有效人流量来预估收入;算地块租金、历史运营数据来预估成本;
5.对比分析最佳区域:综合收入和成本,找出企业可获利润最大的区域。
一、圈定候选区域客户群
并不是所有人都是客户,要排除偶尔路过、游客等不常出没于附近区域的人群。因此,需要通过区域基站采集到的个人手机号码、记录时间、逗留时长等数据,圈定候选区域中的客户群。
1.整理候选区域内的基站信息:根据基站的经纬信息,判断基站是否位于候选区域内,整理各候选区域的基站列表;
2.提取区域中的基站数据:以个人手机号码为主键,提取候选区域的基站数据(包括了记录时间、停留时长等)
3.圈定区域中的客户群:基站记录的数据中,并非所有记录都能代表区域的人流特征(如的士司机、公交乘客等的记录),因此要对数据进行初步筛选:
记录周期:为保证数据实时准确,一般取近三个月内的数据;
逗留时长:为剔除部分记录的影响(的士司机、公交乘客),需要提出在区域
内停逗留时长小于30分钟的记录(同一区域内不同基站的合计);
最终圈定出的客户数量如下(以号码数统计):
▲圈定客户数量
二、区域客户画像分析
画像数据来源:以客户手机号码为主键,通过与运营商大数据进行拼接,获得多维度的客户数据,作为区域画像分析的基础。
下面以长盛广场为例,展开区域客户画像分析:
基础属性——性别年龄决定消费档次和爱好
★以年轻男性用户为主:长盛广场的人群结构呈中间宽两端窄形态,为缓慢增长型,年轻客户占比较高,且区域中的男性占比高达65%。
与年龄交叉分析发现,长盛广场中29~48岁的男性群体比全市高5.9%,19~38岁的女性群体比全市高7%;
▲长盛广场性别年龄交叉分析表
身份特征——揭秘区域客户长什么样
★ 外来人口聚集地:在可识别人群类别的目标用户中,客户以外来人口群体为主,占比达40.1%。
▲长盛广场客户身份组成
★ 长盛广场客户主要居住在大朗镇(四个候选区域均在大朗):长盛广场出现的客户主要以大朗镇为主,占比42.1%,其次8.4%住在常平镇,3.8%住在寮步镇;
▲长盛广场客户居住地分布
行为偏好分析——洞察需求,投其所好
★ 甜品、素食、火锅、酒店、电影是用户所关注的信息;
▲长盛广场客户关键字搜索图
三、区域有效人流分析
得出所有候选区域的用户特征后,根据企业需求和目标,制定有效客户识别规则:
基础属性:男性29-48岁,女性18-48岁;
身份特征:以个体户和商务人士为主,居住在本地即可;
行为偏好:关注的信息是电影、美食等;
根据规则筛选候选区域的有效客户,并分析各个区域的有效人流变化及分布情况,从而了解哪个区域的有效用户最多:
区域有效人流分析——潜在客户越多,潜在收入越多
★ 万荟时代由于地处镇中心,潜在目标客户最多:万荟时代包含住宅与购物中心,周末平均人流量较其它区域高至少30%,比第二高的长盛广场高出47%;
▲候选区域有效人流量对比图
★ 中午是人流高峰,突破业绩的好时候:不同区域的最大有效人流量均出现在13时。同时,在各个时段中万荟时代的有效人流均最多。
▲候选区域各时段有效人流量对比图
区域有效人流分布——人流集中更有利于聚人气
★ 长盛广场有效客户较为集中:在四个候选区域中,长盛广场区域的有效客户最为集中。主要集中在长富西路,长富南路一带,均是较为成熟的区域。其余区域的用户大多较为分散。
▲候选区域有效人流量分布图
四、区域收入与成本预估
区域月平均消费值分析——客户消费高,收入才会多
★ 长盛广场与万荟时代平均消费额最高:以全市均值为参照,各个区域的客户平均消费值均高于全市均值,其中长盛广场和万荟时代分别高出77%和66%,远多于其余两个区域。
▲区域有效客户平均消费额对比图
★ 长盛广场与万荟时代高消费用户占比最高:在全市有效客户中,高消费用户占比为8%,而长盛广场和万荟时代中的高消费有效用户占比高达44%、40%,远高于全市均值,说明两个区域的有效人流消费能力很强。
▲区域高端有效客户占比对比图
区域地块成本估计——成本低,利润高
由于地方的租金是随时间变化的,因此现有的资料无法支持成本的计算。所以需要借助网络爬虫技术,从网上抓取区域实时的租金数据等信息。
★ 长盛广场的租金成本最低、万荟时代租金成本最高:万荟时代租金最高,高达300元/m²·月,长盛广场租金最低,低至30元/m²·月。
▲区域租金信息对比图
五、对比分析最佳区域
结合收入与成本选定最佳区域
根据前文结论可知,最终比较的是长盛广场与万荟时代,其中:
有效人流量:万荟时代的区域有效人流量高出长盛广场47%,但长盛广场的有效人流比万荟时代更集中;
平均消费额:长盛广场有效人流月均消费额比万荟时代高出7%;
运营成本:长盛广场的最高租金仅仅是万荟时代的最低值,所以万荟时代的成本要远高出长盛广场;
区域发展定位:长盛广场更符合公司休闲娱乐与一体的商圈定位;
结论:万荟时代能为企业带来的收入要略高于长盛广场,但长盛广场成本要远低于万荟时代,因此推荐企业选取长盛广场建立商圈。
大数据不但能获得过去难以获得的情报,如客户画像、收入与消费水平等,还能用量化的方式客观有效地进行分析,帮助企业精确地进行判断,从而帮助企业摆脱过去模糊粗糙的经营方式,创造更高的价值。
本文作者简介
帷策智能大数据事业部副总监,曾带领团队负责多个大数据深度挖掘、建模分析项目,在大数据商业选址、位置大数据应用、精准营销、潜在用户识别等方面拥有丰富的实践经验。
帷策智能、原力大数据创始人兼CEO,大数据应用领域资深专家,中国大数据商业实践先行者。武汉大学管理学硕士,具有计算机与经济学跨专业培养的良好教育背景,13年大数据研究及应用实践经历,曾任中国移动资深大数据分析专家,对通信运营商、移动互联网、广告、金融、教育科研等多个行业都有深厚的理论与实践经验,积累了大量大数据行业经验和研究成果。
大数据小说 | 如何用一小时看透一个初识的姑娘