专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
爱可可-爱生活  ·  【AI世界接口:为AI代理设计的模拟操作系统 ... ·  16 小时前  
爱可可-爱生活  ·  RoboPrompt ... ·  5 天前  
爱可可-爱生活  ·  今日推介(第1562期):通过捷径模型实现一 ... ·  5 天前  
宝玉xp  ·  Z这得去看看-20241018040000 ·  5 天前  
51好读  ›  专栏  ›  机器学习研究会

你不得不看的六篇好文:企业搭建机器学习平台的要点

机器学习研究会  · 公众号  · AI  · 2017-08-01 21:47

正文

第四范式是国际领先的人工智能技术与服务提供商。2016 年 12 月,第四范式成为史上第一家荣获“吴文俊人工智能科学技术奖”创新奖一等奖的企业,该奖被誉为”中国人工智能界最高奖“。2017 年 5 月,第四范式入选"Gartner 2017 Cool Vendor” , 是国内唯一入榜的通用平台型人工智能公司。第四范式自主研发的“第四范式•先知平台”是国内首个成熟商用的人工智能应用者开发平台,工程师甚至是企业业务人员基于先知平台,能够在 1 人月内开发出适用于本行业的人工智能应用。目前,先知平台已经应用于精准营销、个性化推荐、差异化定价、风险管控、智能投顾等多项业务中,为金融、电信、互联网等领域 100 多家企业成功打造人工智能应用。


缘起  


2016 年年中时期,正是 Spark 火热的时候,我在浏览知乎的时候,发现了这么一个问题:第四范式的人工智能平台 Prophet 有可能替代 Spark 么(https://www.zhihu.com/question/48743915)?看到这个问题,心里马上充满了疑惑,为什么有了 Spark 和 TensorFlow,他们还要去研发一个自己的人工智能平台。当然,当时的人工智能也没有今年这么火。但是我对这个平台充满了好奇。我开始留意第四范式的一切资料,不过在很长一段时间里,我并没有成功的接触到任何一位范式科学家。但是接触和了解这家公司依然一直放在我的任务清单里。也终于在半年后,我有幸找到了胡时伟老师,向他表达了我强烈的想报道“先知”平台的决心,于是,我们有了这么一篇内容:

为什么已有 TensorFlow 和 Spark,第四范式还要开发“先知”平台?

在这篇文章里,胡时伟和涂威威两位老师,给大家介绍了为什么人工智能系统需要高维大规模机器学习模型,以及“先知”产品的架构实践和模型算法工程优化经验。

这次的分享里,总结了一个完整的机器学习系统需要的部分:

  • 数据引入和预处理

  • 特征工程

  • 模型训练算法(支持参数灵活调整和二次开发)

  • 模型评估

  • 模型上线(批量预估、实时 API 调用、线上特征实时计算)

以及“先知”的整体架构:

(整体架构图)

另外,涂威威讲了大规模分布式机器学习框架 GDBT,除去计算之外,一个机器学习平台还需考虑的其他因素,比如:通讯、存储、灾备和效率的权衡,还有机器算法框架的语言选择问题。总体来说,这是一次很干货很完整的机器学习平台的技术科普。


范式主题月  


今年人工智能开始大火,各大媒体都开始去主动报道第四范式的技术了,也开始看到各种范式科学家的采访文章。随着这些报道,我们也更清楚这家公司的技术实力。而且第四范式也开始注重技术培训,他们发起了“范式大学”的项目,致力于成为“数据科学家”的黄埔军校,校长为第四范式首席科学家,华人界首个国际人工智能协会 AAAI Fellow、唯一的 AAAI 华人执委杨强教授。我由此也再次找到了第四范式,要求他们在 InfoQ 的社群当中组织一次“范式主题月”,给大家更多的讲讲机器学习相关技术。于是有了以下文章。


第四范式联合创始人,产品负责人田枫:机器学习的最小可用产品 


想用机器学习提升业务价值,在搭建平台、处理数据、训练算法之前,真正要做的第一步应该是什么?

  1. 机器学习是不是万能良药?我们首先需要想清楚, 机器学习作为特别牛的技术, 它能解决什么样的问题。

  2. 一个业务问题,可能有各种千奇百怪的坑,假设我们初步判定可以通过机器学习来解决他,那么应该通过怎样的转化,避开这些坑,把业务问题变成机器学习的问题。

  3. 如果有一个好的可以转化成机器学习的问题,我怎么去设计机器学习的开发节奏,估算它的投入产出比,如何分阶段去推动问题的建模和应用。

这次分享,基于第四范式在机器学习工业应用方面的大量成功案例和经验,不涉及算法,不涉及平台,但是却是机器学习产生价值过程中最关键的步骤之一。

机器学习的最小可用产品:人工智能应用的敏捷开发



转自:大数据杂谈