摘 要
企业自有数据仍为大数据应用的主流数据源,数据流通及共享将带来价值升级;
中国网络媒体以流量+广告服务为起点,推进数据生态形成,数据产品向“面向用户端”与“面向商业端”分化,接下来的发展将趋向于根据业务模式和应用场景对系统内部角色进行细分;
资源聚集的条件下,行业联盟、第三方数据机构、行业巨头将推动行业形成数据归属和数据资产定价的标准;
大数据基础设施、视频分析技术、智能算法、垂直领域BI将成为技术产业链上的机会点。
内容综述
聚焦网络媒体大数据,研究其体系架构及相关产品
产业链:数据来源
企业自有数据是主流数据源,数据的流通和共享将成趋势
产业链:数据管理
数据挖掘与可视化成行业热点,数据管理向垂直行业分化
产业链:数据分析
文本、图像、语音分析相对成熟,视频分析存在探索空间
产业链:数据应用
从独立数据产品向完整行业解决方案发展,定制化将成趋势
根据中国信息通信研究所统计,2014年中国大数据市场规模约为84亿元,预计2015年中国大数据市场规模将达到115.9亿元,增速达38%,2016至2018年中国大数据市场规模还将维持40%左右的高速增长。
海外数据驱动型网络媒体的大数据奠基
企业技术探索先行,政策推动产业发展进程
中国数据驱动型网络媒体的大数据战略
大媒体以流量+广告服务为起点,推进数据生态形成
中国数据驱动型网络媒体的大数据战略
数据生态系统雏形已成,多维度输出大数据能力
网络媒体的大数据业务正处于初级阶段,但与整个互联网行业的大数据应用情况相比,其应用相对较为成熟,发展速度极快。目前各家数据生态系统的基本雏形已然形成,数据产品向“面向用户端”与“面向商业端”分化,接下来的发展将趋向于根据业务模式和应用场景对系统内部角色进行细分。网络媒体属性增强了企业获取大数据的能力,未来还将继续探寻数据资产的商业化出口。
艾瑞分析认为,目前国内数据驱动型互联网媒体的大数据输出主要可以分为技术能力输出与数据服务输出两种类型,其中,技术能力以“大数据工具/产品”形式输出,而数据服务的输出则主要可以划分为“提升内容质量”和“提升内容触达效率”两个主体方向,其中,前者通过内容积淀实现,而后者则通过用户洞察和精准投放实现,同时,后者还成为了大数据在网络媒体中应用的主要形式。国内网络媒体的大数据输出目前主要服务于自有业务,包括指导产品优化和实现个性化推荐(含精准营销)等,主要客户来自互联网化程度较高、数据敏感度较高的行业,如电商、金融等。
中国数据驱动型网络媒体的大数据战略
中国网络媒体大数据应用地图
案例综述
选取月度覆盖量2亿以上的部分企业进行案例分析
百度拥有的数据类型主要是搜索数据,通过全面复杂的产品矩阵,百度能够获取以搜索数据为核心、来源广泛且维度丰富的海量数据,并实现广告主CRM、广告主自有ID、到店/站数据、注册数据以及统计监测/Cookie等的数据接入,形成完善的数据体系。结合第一方数据和第三方数据,百度通过其严谨统一的指标体系对数据进行分析,从数据产权、底层数据标准和应用标准三个方面进行定义,支持各数据产品的运营和发展。百度商业生态大数据输出主要可分为百度投放产品和对外提供产品及服务两类,助力百度生态圈(包括其客户、合作方及百度联盟等)高速发展,一方面优化用户和客户的使用体验,增加用户粘性及百度的品牌影响力,另一方面,提升产品运营效率,巩固生态圈,促进数据价值的商业化实现。
百度思维是百度营销数据产品体系的总称,与营销相关的百度大数据产品主要包括营销决策指导(包括市场趋势洞察,品牌竞争分析,营销活动规划) 、受众管理和评估分析三类,其代表产品分别为灵犀、方物和精益,它们共同构成营销过程数据解决方案。贯通了百度指数、营销过程数据解决方案、数据管理平台以及数据服务接口API,百度思维分别从营销决策指导、受众管理和评估分析三个维度支持营销产业链的各角色如广告主、广告代理公司的营销过程。
百度启动了以营销数据产品驱动的品牌营销生态战略,通过百度思维深耕营销领域,攻关技术难题,累积行业经验,未来还将在此基础上继续向其他领域拓展,将营销领域的经验结合其他行业特点复刻到金融、生活服务等各个行业,实现各行各业的商业赋能。
作为日接入数据量1.8PB,日扫描数据量16.5PB的数据驱动型企业,腾讯具有强大的数据处理能力,其大数据体系主要由数据源、底层大数据系统、DMP、旗下各产品与服务共同组成,一方面,通过丰富多元的产品体系收集数据,另一方面,又将海量数据的分析处理结果应用到产品决策中,促进用户端产品与商业端应用的发展。除了支持内部业务发展,腾讯的对外数据合作目前主要通过提供DMP产品和数据对接(商业端应用)两种方式进行。
腾讯DMP作为腾讯的智慧数据管理平台,能够实现全量而非抽样的数据接入,为全面、深度洞察消费者带来基础数据支撑;其次,通过可衡量的消费者洞察、可实时监测的投放效果,将推动企业即时调整投放模式;最后,依托跨媒体、跨终端、跨平台、跨场景等多维、立体的数据分析与管理,能够还原用户的消费行为及决策链条,助力精准传播。
腾讯打造的ACE腾讯广告开放平台,致力于在腾讯完善数据生态和优质媒体资源的基础上,依托腾讯的全系产品生态圈,通过不同类型产品满足不同类型客户的不同需求,主要包括四款营销产品:1)基于QQ空间、QQ、微信公众号、微信朋友圈等优质广告资源,跨平台,跨终端的效果广告平台腾讯社交广告,2)基于腾讯新闻、腾讯视频、天天快报等优质媒体资源,跨平台、跨屏幕媒体的品牌广告自助营销平台智赢销,3)助力区域客户实现品效合一的营销服务产品智汇推, 4)满足品牌客户区域化需求和区域客户品牌化需求的营销产品智汇通。其中,腾讯社交广告和智汇推为效果广告产品,智赢销和智汇通为品牌广告产品。
应用层方面,主要可以把360的大数据产品分为用户产品与企业级产品两类。用户产品的目标群体是普通网民,主要通过个性化推荐以提升用户体验,除用户行为数据外,还能根据用户画像进行关联推荐。企业级大数据产品主要包括360商易、360DMP和360分析,它们分别涵括了从投放前的决策支持到精准投放,最后进行投放效果监测评估的过程,形成了精准营销的闭环。未来360还将通过数据联动进行数据相关性挖掘,不断提升大数据服务能力以满足更深入的客户需求。
新浪
用户与内容双管齐下,大数据洞察系统驱动业务发展
面对4T的日数据量,新浪通过人口统计学算法优化数据结构,以UID为核心维度,与超过4000个标签进行分级匹配,形成最底层数据系统。在底层数据系统的基础上,同源数据基于不同的维度进行挖掘形成了两套大数据系统,分别是用户洞察系统和内容洞察系统,其中,用户洞察系统包括用户画像、粉丝经济等子系统,内容洞察系统包括语义挖掘、舆情分析等子系统,它们共同服务于各类新浪系产品,如门户广告系统(龙渊、扶翼、轩辕)、微指数等,此外,新浪也在对外逐步开放API共享机制,逐步实现数据的商业化变现,用户与内容双管齐下,共同驱动业务发展。
通过对大数据业务化应用的思考,结合自身多年大数据经验,网易开发了通用型大数据处理与分析平台,为行业内外更多的业务人员提供数据工具,以克服技术障碍,充分发挥其对于业务的洞察力,挖掘数据规律,实现商业价值。其中,网易猛犸大数据平台承担着数据集成、治理、计算的工作,网易有数敏捷数据分析平台则帮助业务人员高效率低成本地实现敏捷流畅的数据分析。未来网易还将通过网易云的搭载扩大其大数据服务的覆盖范围。
凤凰大数据系统由凤凰统计平台与凤眼系统共同构成。凤凰统计平台是凤凰的全量大数据平台,涵括了凤凰网底层海量数据,通过站内统计,能将统计维度细分到每秒在某些位置的点击率、每个页面的每一帧的点击率等,并为凤眼系统提供底层数据支持,是凤凰进行内容评估和广告投放的基础。
凤眼系统作为凤凰网解决用户信息的方案,能够通过将长期累积的人口信息用cookie或者IMEI号与用户行为进行对接,持续追踪这些行为,洞悉不同内容背后的人群,从而逆推实现精准推荐。此外,凤眼还能通过与海量样本追踪的结合,将样本数据通过后台算法、加权方案等,按照用户累积得到的人群结构进行匹配,实现合理映射。凤眼后续还将支持凤凰自有DSP平台凤羽系统的DMP建设,并在有效地指导广告投放的基础上,继续探索商业化。
大数据的发展趋势
产业:隐私界限、数据归属及定价标准将形成统一行业标准
我国大数据交易刚刚起步,数据的商品化引起了行业关于用户数据的隐私界限、数据归属及数据资产定价标准的思考,但暂未形成统一的行业标准,不利于数据资产的商业化探索以及行业的长远发展。
各种场景聚集,数据维度、密度增加,在数据安全事故频发的情况下,用户对于安全隐私问题尤为关心,同时,数据资产的价值保护越来越受到重视。艾瑞分析认为,在需求驱动下,未来国家将出台相关法律法规,明确用户数据的隐私界限,以及数据在不同情境下的归属权,提高违法成本;同时,在资源聚集的条件下,行业联盟、第三方数据机构、行业巨头等将带头推动行业形成数据归属的界定和数据资产的定价标准。
此外,目前已出现了黑盒对接、差分隐私等技术,能够在一定程度上规避隐私问题,未来将在数据管理全环节的基础上,产生划分标准更合理、稳定性更高的技术手段,在不泄露个人隐私信息的情况下,帮助企业获取群体特征。
大数据的发展趋势
产业:技术产业链上还存在较多机会点
大数据的运作效率始终是行业发展的痛点之一,制约了其发展的速度,但伴随着人们对音乐、影视等多媒体内容的需求逐渐增大,互联网媒体的呈现形式越发多元,产生了大量非结构化数据,既提高了对大数据处理效率的要求,又对海量视频进行高精度搜索和多维度分析的技术形成了尤为迫切的需求。
在现有的机器算法固有缺陷(如完全依靠用户历史行为数据的精准推荐范围越来越窄等)的驱动下,已经涌现出了协同过滤、混合智能算法等更加贴合用户需求的算法类型,未来可采集的数据维度将会越来越丰富,需通过要基于大数据的数据挖掘、机器学习和人工智能技术进行理解、学习、预测和适应,以满足产业发展的需要。但各行业数字化程度不均匀,针对具体行业特征进行洞察与决策的智能产品还存在较大缺口。在需求驱动之下,新入企业还有较多机会点,涉及大数据基础设施、视频分析技术、智能算法、垂直领域BI等各方面。
大数据的发展趋势
企业:智能终端成布局一环,多端布局使数据入口更加广泛
大数据时代,数据资产的价值越发凸显,拥有大数据能力的互联网企业在整合内部数据资源之余,还通过企业并购、数据交易和企业合作等方式,积极扩充数据源。
在企业层面的数据扩张之余,未来互联网企业还将继续布局其他层次的数据链条,以采集更丰富立体的用户行为数据,联动数据生态。除了基本的电脑、手机、平板电脑外,可穿戴设备、智能家电等智能终端也将成为数据入口,一方面,通过应用软件跟踪(软件)和智能模块内置(硬件)等方式实现数据回传,结合其触网行为数据,运用大数据系统进行多维度综合分析和关联应用;另一方面,判断其使用习惯,利用算法为用户提供智能产品的个性化体验及后续增值服务。
大数据的发展趋势
企业:从单一广告服务向多元方向拓展,服务出口更加全面
网络媒体通过提供广告服务变现已成为一种成熟的商业模式,在此基础上,大数据的出现使广告投放效果更加精准,针对市场分布、受众属性、触网行为、媒体策略等具体投放环节的服务更加精细化,并且能够在投后进行多指标的投放效果监测评估,形成了定制化的全案广告服务。
在继续深耕广告服务的同时,基于广泛用户数据的网络媒体大数据产品,还将在提升内容质量和内容触达效率的基础上,进一步进行拓展:1)从应用形式来看,产品与服务的结合将更加紧密,产品应用形式将更加灵活;2)从业务类型来看,应用方向将向指导产品优化、支持运营决策等方面拓展,探索更多数据价值实现形式,也为数据变现提供更多想象空间;3)从输出范围来看,在服务于自有业务之余,正在逐步探索大数据能力的对外输出,向其他行业渗透,同时赋能海外,助力数据应用水平相对落后国家的数字化发展。
大数据的发展趋势
终端:用户体验和企业运营效率将进一步提高
在大数据技术与服务的发展过程中,可视化产品/服务极大地推动了大数据应用产品/服务的普及,降低了其使用门槛,同时也促进了数据挖掘维度的丰富化,催生了更多大数据的应用类型。基于云端多年积累的海量基础数据,通过与数据挖掘、机器学习和人工智能算法的结合,在多种表现形式共同作用的条件下,将为产业智能赋能,解放一部分人的工作,并使用户与场景的交互方式发生变化,使用户使用的服务变得更加贴合偏好、更加方便智能,从而改善用户在应用使用中的体验,增加浏览、点击、支付等操作行为的频率和转化效率,进而提高企业的整体运营效率。
★ 点击文末 “阅读原文” 获取完整报告!