第四范式是国际领先的人工智能技术与服务提供商。2016 年 12 月,第四范式成为史上第一家荣获“吴文俊人工智能科学技术奖”创新奖一等奖的企业,该奖被誉为”中国人工智能界最高奖“。2017 年 5 月,第四范式入选"Gartner 2017 Cool Vendor” , 是国内唯一入榜的通用平台型人工智能公司。第四范式自主研发的“第四范式•先知平台”是国内首个成熟商用的人工智能应用者开发平台,工程师甚至是企业业务人员基于先知平台,能够在 1 人月内开发出适用于本行业的人工智能应用。目前,先知平台已经应用于精准营销、个性化推荐、差异化定价、风险管控、智能投顾等多项业务中,为金融、电信、互联网等领域 100 多家企业成功打造人工智能应用。
2016 年年中时期,正是 Spark 火热的时候,我在浏览知乎的时候,发现了这么一个问题:第四范式的人工智能平台 Prophet 有可能替代 Spark 么(https://www.zhihu.com/question/48743915)?看到这个问题,心里马上充满了疑惑,为什么有了 Spark 和 TensorFlow,他们还要去研发一个自己的人工智能平台。当然,当时的人工智能也没有今年这么火。但是我对这个平台充满了好奇。我开始留意第四范式的一切资料,不过在很长一段时间里,我并没有成功的接触到任何一位范式科学家。但是接触和了解这家公司依然一直放在我的任务清单里。也终于在半年后,我有幸找到了胡时伟老师,向他表达了我强烈的想报道“先知”平台的决心,于是,我们有了这么一篇内容:
为什么已有 TensorFlow 和 Spark,第四范式还要开发“先知”平台?
在这篇文章里,胡时伟和涂威威两位老师,给大家介绍了为什么人工智能系统需要高维大规模机器学习模型,以及“先知”产品的架构实践和模型算法工程优化经验。
这次的分享里,总结了一个完整的机器学习系统需要的部分:
以及“先知”的整体架构:
(整体架构图)
另外,涂威威讲了大规模分布式机器学习框架 GDBT,除去计算之外,一个机器学习平台还需考虑的其他因素,比如:通讯、存储、灾备和效率的权衡,还有机器算法框架的语言选择问题。总体来说,这是一次很干货很完整的机器学习平台的技术科普。
今年人工智能开始大火,各大媒体都开始去主动报道第四范式的技术了,也开始看到各种范式科学家的采访文章。随着这些报道,我们也更清楚这家公司的技术实力。而且第四范式也开始注重技术培训,他们发起了“范式大学”的项目,致力于成为“数据科学家”的黄埔军校,校长为第四范式首席科学家,华人界首个国际人工智能协会 AAAI Fellow、唯一的 AAAI 华人执委杨强教授。我由此也再次找到了第四范式,要求他们在 InfoQ 的社群当中组织一次“范式主题月”,给大家更多的讲讲机器学习相关技术。于是有了以下文章。
第四范式联合创始人,产品负责人田枫:机器学习的最小可用产品
想用机器学习提升业务价值,在搭建平台、处理数据、训练算法之前,真正要做的第一步应该是什么?
机器学习是不是万能良药?我们首先需要想清楚, 机器学习作为特别牛的技术, 它能解决什么样的问题。
一个业务问题,可能有各种千奇百怪的坑,假设我们初步判定可以通过机器学习来解决他,那么应该通过怎样的转化,避开这些坑,把业务问题变成机器学习的问题。
如果有一个好的可以转化成机器学习的问题,我怎么去设计机器学习的开发节奏,估算它的投入产出比,如何分阶段去推动问题的建模和应用。
这次分享,基于第四范式在机器学习工业应用方面的大量成功案例和经验,不涉及算法,不涉及平台,但是却是机器学习产生价值过程中最关键的步骤之一。
机器学习的最小可用产品:人工智能应用的敏捷开发
转自:大数据杂谈