人工智能(AI)经以雷霆万钧之势从学术界潜入产业界的每一个角落,AI 已经不是科技公司创新创业的专属武器,因其价值之大,也成为了传统行业变革求新、提高效益的利器。AI 掘金志致力于传统行业 AI 应用的解读,帮助从业人士寻找最有价值的模式与落地路径,记录 AI 浪潮之巅的时代变迁。
未来,我们还将举办相关培训训练营,以及行业首创的 “首席数据官峰会”,搭建起数据科学家与首席数据官之间的桥梁。
AI 掘金志本周关键词:精细营销、未来医疗、智能金融
在智能投顾领域,国内传统金融机构是怎样开疆拓土的?
雷锋网消息,智能投顾正处于是垂髫之年,行业和产品还在成长期,不过诸多机构、个人都对其寄予厚望。花旗集团预计在未来十年时间里,智能投顾平台资产管理总额将达 5 万亿美元,呈现出指数级增长势头。据 HCR 慧辰资讯预测,2020 年中国智能投顾资产规模将超 5 万亿,按 0.2% 管理费计算,行业整体收入规模约在 104 亿。
有业内人士称现在是金融与科技的第三次大碰撞阶段,在借人工智能这次东风上,Fintech 公司似乎比传统金融机构借势得更及时。在智能投顾领域也是如此,盘点起智投平台,互金、智能金融服务公司十占八席,但事实上,不少传统金融机构也已经坐上席位。这一次,雷锋网着重描述传统金融机构的智能投顾版图,并简析产品差异。详情请戳 “阅读原文”。
去年还说坚决不设直销银行的招商银行,今为何迅速转舵?
2 月 17 日晚间,招商银行公告称,招商银行拟出资 20 亿元人民币,全资发起设立独立法人直销银行,初始注册资本拟定为 20 亿元人民币,招商银行持股比例 100%。在适当时机,根据业务发展的需要并在监管批准的前提下,可转让不超过 30% 的股权,以引进战略投资者。
招商银行说这是对 “未来银行” 的探索。所谓直销银行,是几乎不设立实体业务网点,而是通过网上银行、电话银行、ATM、电子邮件、移动终端等远程手段来与终端客户直接进行业务往来。
根据麦肯锡 2016 年 12 月发布的报告《中国银行业的明天在哪里》,2014 年,全球银行业的净资产收益率(ROE)延续了 2008 年金融危机后缓慢回升的态势,稳定在 9.5%。但是,过去一年股东回报率的回升却无法掩盖整个行业毛利下滑的现实。2013—2014 年,包含银行利差和手续费利润率的毛利水平拖累 ROE 达 185 个基点,银行不得不通过大幅度削减成本(贡献 169 个基点)来保持 ROE 的稳定。
所以这次拟设立直销银行的公告中,招商银行表示,设立独立法人直销银行是该公司把握创新驱动发展趋势、积极探索普惠金融和未来银行形态的重要举措,可有效降低银行运营成本,对现有业务模式和客群进行差异化补充,并可通过风险隔离将创新风险限制在可控范围。设立独立法人直销银行符合监管政策导向,符合国内外银行业创新发展趋势,也符合本公司自身业务发展水平。
事实上,招行设立直销银行的背后,是其对直销银行的基础技术——AI 的全面探索的成果,包括人脸识别、大数据挖掘、深度学习等等。
王维嘉:深藏在硅谷人工智能产业背后的机遇与陷阱
信中利美国创投创始管理合伙人王维嘉,本文是王维嘉博士做客 2 月 17 日江湖沙龙的分享,谈及他对 AI 在传统行业中的应用发展的看法,本文由雷锋网整理编辑。
王博士,怎么看一个应用公司的竞争优势呢?核心就是他能不能垄断行业的数据。如果不能垄断数据,这公司是没有技术的,绝大部分应用公司是没有自己的核心技术。
比如说美国有一个 VKP 我一天上四五次,每个月要定期捐款,中国有几个百科做得非常烂,原因是没有社区贡献的文化,美国这个社会是从一个小镇五月花,联邦 13 州从底到上建立起来的,有一大批自己出钱处理搞公益的人,整个社会是这样的风气,开源这件事情一定要有这样的文化。
中国大部分人说,我又不赚钱,给别人写了别人用,对我有什么好?这个问题的出现,导致于这次人工智能的开源框架一定是美国领导。
值得注意的是,未来这些开源框架就像今天的安卓一样,会在上面长出很厚的生态系统,会做出各种各样的库,所以说最后你已经没法和它匹敌了。
今天开源这件事仍然是一个在竞争,各个大公司为什么要开元呢,都想把所有开发的资源聚集在自己的生态上面。
现在的情况仍然是 Google,Google 上面的开发人员加起来是其他所有人加起来的 10 倍——其他所有人是 Facebook 这几家公司。其实就在这几家竞争。开源领域除了这几家公司以外,百度也出了这样一个东西,每个大学都有一些开源的东西。
IBM 一口气公布了 2 项合作,这是 Watson 将塑造的未来医疗吗?
2 月 24 日凌晨,IBM 中国官方微信告诉大家它将要做两件事:
与 CNYCC 合作
与 Atrius Health 合作
据雷锋网所知,这两家机构均为非盈利医疗机构,是提供价值型医疗服务的行动者。
人口健康平台:提供患者信息全景图
与 CNYCC(Central New York Care Collaborative,护理协作纽约中心)的这次合作将创建一个认知人口健康平台,用于连接纽约州中部 6 县的 2,000 多家医疗和社区服务提供商。
该认知人口健康平台上集成了 IBM 的多项看家本领。
IBM Watson Health 集成 CNYCC 的人口健康管理 (PHM) 系统中的多种数据:治疗场景 - 初诊治疗、急性后期护理、行为健康、社区和急性护理 - 以及超过 75 个电子健康记录系统、健康信息交流平台以及其他数据来源,聚合多样化数据,形成对患者病况的整体把握,包含临床病例、社会决定因素和行为健康。
Watson Care Manager 结合护理管理最佳实践与执行工作流,使护理工作者有能力创建个性化护理计划,兼顾各种健康相关因素,并让个人联合参与提高健康水平。
WatsonHealth Cloud 中大量的健康数据,帮助临床医生找出类似患者的潜在风险因素。
并且,该人口健康平台将提供患者互动功能,打通从患者发现病情到医患互动、再到开展治疗的完整医疗流程。
互动护理系统:摆出临床证据,医患一起决策
雷锋网了解到,AtriusHealth 为 675000 多位成人和儿科患者提供了一个互动护理系统,以提供患者高质量、以患者为中心、协同式的护理。
据 Health Affairs 之前发表的文章,共同决策(即医生及其患者根据临床证据一起做出医疗决策)对患者、临床医生和医疗保健体系均益处多,例如提高患者对疾病的认知、缓解治疗过程中的焦虑、减少无根据的护理和成本浪费等。
尽管存在诸多好处,许多医生仍然表明很难将共同决策融合到他们与患者的直接互动中。这种设想的难点在于:将临床证据清晰明确地摆在医生与患者面前。
有一种解决方案可以解决这个问题:总结出影响患者健康状况的关键点(关键词),整合相似的患者人群,描述这些人在不同治疗选择下的转归结果。
这个工作 Watson 可以胜任,其有能力处理医患互动过程中生成的海量数字化信息。
不放过任何蛛丝马迹,IBM Watson 将利用医学影像诊断心脏病
要治疗心脏疾病,就必须有一个精准的诊断,但对医生来说,长期坐在那里听听诊器或看心电图又有些不切实际,因此有时他们会漏掉一些不起眼的小问题,而这些小问题可能是治疗心脏疾病最棒的突破口。
IBM 认为它们能通过人工智能帮医生解决这个小烦恼。对,你没猜错,它们旗下著名的 Watson 又掌握新技能了。
诊断心脏疾病是 Watson 健康医学影像项目的一部分,全球参与该项目的医疗组织已达 24 家。
诊断心脏疾病对 Watson 来说是个完全不同的挑战,因为这是它首次查看复杂的医疗数据,其中包括超声波图像、X 光图像和其他不同类型的医学影像。Watson 将首次坐上主治医生之位,判断到底那个病人患有主动脉瓣狭窄,此类病人术后依然需要随访护理。
即使忽略它在癌症研究上的贡献,这也不是 Watson 首次涉足医疗行业了。这个明星 AI 平台此前不但发现了与渐冻人症(ALS)有关的基因,还在研发新药上颇有建树。当然,Watson 在成长为大医生的路上并非一帆风顺,最近它在 MD 安德森癌症中心参与研究时就犯了处置失当的错误。
对心脏病专家来说,主动脉狭窄是最难诊断的病症,但该病症会阻碍血液流动,对病人来说是最为致命的。
在某些情况下,医学影像非常具有 “欺骗性”,稍不注意,医生的判断可能就会被干扰,而 Watson 的 “慧眼” 并不会,它会成为一个精确的翻译器,将医学影像中展现的问题清楚准确的列举出来。
Sentara Healthcare 的心脏病专家 Jaime Murillo 表示:“借助 Watson,我们希望能将诊视过程标准化,这样就能提高诊断的准确率,而病人是最大的受益者。”
Watson 影像部门副主席 Anne Le Grand 称,临床影像检查是 IBM 首次提供认知影像,此前它们钻研该技术已经超过 10 年时间。
“我们所做的主要工作就是对医疗数据的回顾性分析,IBM 能帮助临床医生回到过去,找到那些曾让医生感到遗憾的典型病例。”Le Grand 说道。
Watson 将大量阅读心脏病专家的医疗报告,通过与其数据库中数据的对比,对病人的心脏影像进行分析。在一项初步研究中,IBM 对这项技术进行过测试,虽然它们拒绝透露详细数据,但它们认为 Watson 的加入确实让心脏疾病诊断有了巨大的飞跃。
除了判断到底哪些病人需要随访护理,Watson 还会对患者群体进行集体扫描,找到那些同样需要接受随访护理的人群(这些病人的医学影像可能并未经过 Watson 的筛查)。随后,通过 AI 的分析,Watson 会为病人提供预见性护理,将病人面临的风险降到最低。
Le Grand 表示:“Watson 的功效是双重的,它不但能提升诊断的质量,还能保证诊断的一致性。”
未来,Watson 在医学影像上的技术积累不但能用到心脏病上,还能推广至乳腺癌、肺部、眼部和脑部疾病上。在不久的将来,IBM 计划让 Watson 涉足除主动脉狭窄外其他九种心脏疾病的诊断。
今年晚些时候,该技术将成为美国大部分保健医生的标配。
硬创公开课 | 如何用云计算模式,实现生物信息分析
雷锋网按:当基因检测变得越来越普及,所得数据越来越多,对数据解读的需求也由此诞生,而这就是生物信息技术的作用。本文整理自华点云技术总监于伟文在雷锋网硬创公开课上的演讲,主题为如何用云计算模式实现生物信息分析。
于伟文,高级工程师,上海华点云生物科技有限公司技术总监。是北京航空航天大学国家示范学科——“移动云计算” 专业的首批毕业生。拥有十余年 IT 领域从业经验,主要关注于临床、生物、金融等领域。作为课题负责人,曾主持过国家 “十一五” 重大专项子课题;参与多项国家自然科学基金、国家重点实验室专项信息化建设项目。在 Nature 子刊、SCI 等权威刊物上发表学术论文 10 余篇。
公开课视频如下:
今日头条的引擎是怎么样工作的?
把媒体内容分发给用户,“你关心的才是头条”,对于今日头条这个产品,相信大家都不陌生。那么,你是否好奇过,今日头条是如何做到,向每个读者推送不一样的、据称是符合读者每个人不同兴趣的内容的呢?每个人产生的阅读数据,还有哪些效益呢?今日头条算数中心执行总监刘志毅在日前于深圳北京大学汇丰商学院举行的 “数据之美” 论坛上做了介绍。
首先,数据从哪里来?
虽然对于头条来讲,其用户量、用户的粘性时间已经足够大了,但是,要怎么样精细,怎么样的数据才是可信赖的,怎么样的数据是可复用的?
对于数据所产生和获取的流程,今日头条算数中心执行总监刘志毅抛出一道小问题来介绍:
现在面前有很多颗糖果,然后有两个人要把这个糖果的数量数清楚,有一个人他会加减乘除地来数,3 颗 3 颗数,5 颗 5 颗地;还有一个人就很笨,只会一颗一颗,永远一颗一颗地数,那问一下,是哪一个人能够先把这一大堆糖果数清楚啊?
事实上,按正常的逻辑确实应该回答 “第一个” 的,“但是在互联网公司,答案是第二个,因为虽然是一颗一颗地数,但他一秒种可以数一万个,所以他更直接更快速。” 这是机器学习发展到今天的成果,机器分发的效率一定大于人工分发。在 2016 年的年终,易观发布的第三方数据显示,如今机器分发的比例已经超过了人工分发。
分发糖果与分发内容逻辑是一样的。那么,这背后,头条具体的引擎是怎么样工作的?这时候需要把文章和用户两端的数据连接起来。
据刘志毅解释,
首先文章进入机器引擎后,头条需要机器识别它们的关键词,识别其涉及到的内容领域,用户对它们的反应,然后把结果放到一个特征向量空间中。
与此同时,用户端也发生了同样的变化。
“然后我们去看这两个向量,怎么样匹配度最高,然后就推送给他。”
具体来说,这些用以匹配的数据变量可能包括几个大方面的特征:
首先,这个用户,他的性别兴趣,年龄地域用的手机是什么?
家乡是哪里?关注什么东西?会点什么样的广告?
然后他目前处在什么样的环境?今天有没有下雨?用 WiFi 还是用 3G,4G,2G?
这个文章本身是一分钟之内的快消息,还是几年之内看都不算失效的消息?用户的反馈对他们是什么样?
这个文章有什么样的关键词…… 等等
这些数据将产生一个百亿级别的特征,今日头条最终根据特征判断用户的需求,把内容呈现到每一个人不同的手机屏幕上。
但是,这还不是最技术范的地方。数据部门真正做的事情是,“从刚刚所描述的这个过程中积累出来一些东西,然后让他去发挥价值,” 刘志毅说道,这才是数据挖掘的价值所在。
“这只是我所想要表达的数据维度的 1%,”
用户点击什么文章?没有点击什么文章?
点赞还是点踩?
阅读速度快不快?完成多少比例?
对某一个话题产生了持续性的还是短暂的影响?读完之后有没有讲到什么评论?
那他用的是什么样的手机在读你的东西?是什么样的手机的什么型号?去年用这个型号,今年是不是还用这个型号?
……
刘志毅称,“这样的信息都会作为这个用户的组合特征的一部分,然后我们去提取这一部分来把它作为数据的样本进行分析。”
数据到哪里去?
知道了数据怎么来之后,数据要到哪里去,产生怎样的价值?这又是一场好戏了。
据雷锋网了解,今日头条曾推出了 “今日头条媒体实验室”,这个实验室的作用,相当于差异化内容创作的 “参谋”。就是说,其将通过每一篇文章的传播数据去告诉不同的内容的写作者创作者,假如想要影响某一个特定的人群,需要怎么样创作内容,并且在什么样的平台上,以什么样的方式在什么样的时间点发布是效率最大化的。
刘志毅举了这样一个例子:以美国总统选举为例,在中国希拉里一直热度是领先,但是跟美国人投票不一样。最后希拉里败选,但是她败选之后,在头条平台上面的热度也降得非常快,这个可能跟中国人对美国时政事件的关心规律有关系,那么,媒体则会依据这个来进行内容创作。
另外一个是,数据也许可以呈现出人类作者意想不到的角度:在今日头条与南方周末的合作中,大家都关心学区房房价的问题,但数据显示——在这些事实之外,跟学区房同时出现的概率最高的词中间,“离婚” 排在前 3 位。
这就是计算机辅助报道的一种方式,也是大数据、AI 带给传统行业的变革。
AI 带给商业市场更多机会
除了反哺媒体创作,阅读数据还有哪些想象力呢?
透视市场潜力
雷锋网此前报道,在一些数据密集型的产业,都成为了 AI 产业应用孵化的首选之地。接下来看了 OPPO 和 vivo 的案例,你就不会奇怪了。
众所周知,去年,手机市场一个关注度颇高的话题是:大家发现主流手机品牌不那么景气了,包括苹果,但是有两家厂商非常受关注——OPPO 和 Vivo。
“OPPO 跟 Vivo 做了一件很有意思的事情,他们在 345 线城市的用户很多,但是他们请了很多跟一二线城市的口味更匹配的代言人来作为宣传他们品牌的代言人。这是他们根据通过阅读数据产生的决定。他们充分把握住了 345 线城市对于手机的需求。”
雷锋网了解到,根据头条阅读的数据发现,345 线城市对于手机的具体参数、性价比方面表现得不那么敏感,但对于手机的体验的介绍,却是阅读量远高于一二线城市的。“所以当 OPPO 没有把大部分的推广和宣传经费放到线下的渠道去影响 345 线城市的时候,他后面的成功,也是在阅读数据上能够发现的奇妙的地方。”
总的来说,刘志毅表示,AI 之所以影响人类各行各业,是因为,“阅读其实是一种人们对于自我归类的一种方式,所以头条上面阅读数据其实是人在不同的组别中间自我归类的一些信息,这些规律的信息产生了我刚才所说到的所有的价值。”