专栏名称: 星海情报局
关注“中国制造”的星辰大海
目录
相关文章推荐
中国社会科学网  ·  常青松 ... ·  昨天  
科技阿水  ·  无限制可用的DeepSeek-R1满血版,享 ... ·  昨天  
科技阿水  ·  无限制可用的DeepSeek-R1满血版,享 ... ·  昨天  
资质体系认证中心  ·  【重要通知】信息技术服务标准(ITSS)运行 ... ·  2 天前  
资质体系认证中心  ·  【重要通知】信息技术服务标准(ITSS)运行 ... ·  2 天前  
51好读  ›  专栏  ›  星海情报局

如何降低AI在决策中的风险?

星海情报局  · 公众号  · 科技自媒体  · 2024-11-05 20:37

主要观点总结

本文回顾了人工智能的发展历史,介绍了早期的人工智能、第一波技术发展浪潮、第二波技术发展浪潮和第三波技术发展浪潮的特点和区别。文章还讨论了深度学习的历史,以及人工智能商业时代所需要的资源和挑战。

关键观点总结

关键观点1: 人工智能的发展历史

人工智能自古就被人们梦想制造出来,经历了早期发展、第一波技术发展浪潮、第二波技术发展浪潮和第三波技术发展浪潮的不同阶段。

关键观点2: 第一波技术发展浪潮的特点

基于人类专家知识的提取,通过逻辑推理来解决问题,有明确的规则和条件,执行明确的任务,但缺乏自我训练和提高的能力。

关键观点3: 第二波技术发展浪潮的特点

基于统计模型,能够进行精准分类和预测,认知和学习能力有了长足进步,但丧失了第一波技术的推理能力,个体样例可靠性欠缺。

关键观点4: 第三波技术发展浪潮的特点

逐渐建造出“有意义”的模型用以描绘现实世界的现象,具备语境适应能力,但技术实现和成本方面仍有大量挑战需要克服。

关键观点5: 深度学习的历史

深度学习经历了漫长而丰富的历史,其技术体系基于大量线性代数、概率、博弈理论以及数字优化。如今的科学对大脑的认识依然非常有限,远不能给人工智能提供足够的信息来进行模拟。

关键观点6: 人工智能商业时代的挑战

商业时代需要企业家们理解人工智能的价值和局限性,并贯彻到企业的策略中。企业需要重视数据和人才的建设,以应对人工智能的挑战和机遇。


正文




撰 文 | 黑爪


人类自古就在梦想,要制造出会思考的机器。这个愿望至少可以追溯到古希腊时代,传说中的皮格马利翁、代达洛斯、赫菲斯托斯都被赋予了传奇发明家的形象,经他们之手而诞生的葛拉蒂雅、塔罗斯、潘多拉,也许便是出现在人类叙述中最早的人工智能。


今天,人工智能已经真实地活跃在众多的应用和研究领域。但它不是魔术,也不创造奇迹。让我们透过喧嚣,回顾一下人工智能的前世今生,借此看清它究竟是什么,现在能作什么,未来能作什么。


早期的人工智能,迅捷地攻占了一些对人类大脑而言相对困难,而对计算机来说则显得直截了当的问题,换句话说,那些可以用一系列数学规则所描述的问题。


但人工智能所面临的真正挑战却恰恰相反。我们希望它能替代我们的,有更多的是人类很容易执行,却非常难以用规则来描述的任务,那些我们通过直觉来解决的问题。例如,听懂别人说话,或者在一幅图片里找到人脸。




第一波浪潮:

难以理解现实的专家系统


人工智能的第一次技术发展,是基于人类专家知识的人工智能。人工智能专家提取特定领域的知识,将其转换成可输入计算机的规则,以及遵循不同规则带来的不同后果。计算机继而运用逻辑推理来“懂得”这些采用正规语言所描述的说明。


这个技术可以用于日程安排,棋类游戏 (例如IBM战胜国际象棋大师卡斯帕罗夫的超级计算机深蓝) ,或者替人报税等,有非常明确而具体的条件,执行明确的任务。对现实世界进行认知,则是第一波人工智能的短板。此外,它不具备自我训练和提高的能力,这恰恰又是作为智能体的一个要素。那期间有个著名的项目叫作Cyc,由推理引擎加数据库组成。人们希望这样的一套系统,可以利用足够的复杂度,来精确地描述现实世界。然而Cyc让人失望了。例如,它试图去读一个故事,故事里有个人叫弗雷德,每天早上会刮胡子。然而它的推理引擎检测到了故事中有一处前后矛盾:它知道人的身上没有电动部件,可是每当弗雷德剃须时手里拿着电动剃须刀,于是它相信这个“剃须时的弗雷德”身上包含了电动部件,因此它问,弗雷德剃须时还是不是人。


这是仰仗硬编码知识的智能系统,也就是第一波人工智能所面临的一个经典困难。它说明人工智能系统需要具备通过从元数据中提取规律来自主获取知识的能力,这就是我们今天说的机器学习。


但这并不意味着第一波技术对于今天毫无意义,去年美国国防高研署 (DARPA) 成功完成了一项数字安全测试,便是基于第一波人工智能技术的应用。孤立的技术,在外部环境 (硬件、数据量、配套技术) 不成熟的情况下,可以作的另一件事,就是等待。




第二波浪潮:

个体精度欠缺的机器学习系统


第二波人工智能出现的最好例子,也出自美国国防高研署。他们在2004到2005年两年间鼓励并组织业界进行了大量的自驾车研究,并推出一个挑战赛,看谁的自驾车能在加利福尼亚和内华达的沙漠里跑150英里。结果,2004年那一届,没有一辆车跑完,事实上没有一辆车跑过了8英里。原因是这些自驾车的视觉系统分辨不出远处的黑色物体,究竟是阴影还是石块,“我”是应该避开呢,还是应该碾过去。因此它们大多在这个问题上翻了船。到了2005年这一届,情况一下子大不一样,有5辆车跑完了全程。


造成这个差别的原因,正是他们大多开始使用机器学习的技术,运用概率方法来处理信息。这就是人工智能技术的第二波。


这一波的特点是统计学习。它在语音识别,人脸识别等应用领域作得非常成功。人们常常会说,计算机“就是”会学习啊。但事实真的不是你以为的那样“就是”,若没有背后强大的,将现实问题用统计数学模型来描述的支撑,它便“就是”不会学习。


我们现在看见的、谈论的,并且真正应用到商业领域的,大多是此处描述的第二波人工智能技术。撇开它铺天盖地的舆论影响,真正被有效利用的类型极其有限。近来几乎所有的人工智能进展都只是一种,那就是输入数据 (A) ,迅速产生简单响应 (B) ,如表 1所示。


就这么简单地输入A,输出B,已经足够改变许多行业了。然而“A→B”与科幻小说向我们许诺的有感知的机器人,毕竟相去甚远,人类的智力更是远非“A→B ”所能相比。为什么这么说?例如有一张拿着牙刷的小男孩图片,被人工智能识别为,一个拿着棒球棍的小男孩。


这让我们发笑,因为我们人类绝不会这样说。从这个例子可以看出,第二波技术在大量的工作中一次又一次地让我们叹服,但也会忽然间爆出这种笑料来。它所反映出来的一个结论则是,第二波人工智能在统计学范畴表现出色,但个体样例不可靠。而这种个案的不可靠,若是发生在金融领域,就是灾难性的。


将“A→B”放到具体的商业环境下意味着什么?前百度首席科学家吴恩达教授用这样一句话来解释:一个正常普通人能够用少于一秒钟的思考所完成的任务,都可以通过人工智能来实现。




第三波浪潮:

初现成效的语境适应系统


借用美国国防高研署对第三波的定义,那就是“语境适应”。第三波的系统,会逐渐建造出“有意义”的模型用以描绘现实世界的现象。


举个例子,让第二波系统来甄别一张猫的图片不是问题,但如果你问它,为什么你认为它是一只猫呢?它的答案肯定是:“经过大量的计算,结果显示猫位居榜首。”这个答案显然并不能令人满意,我们希望它说,当然是猫了,你看它有耳朵,有爪子,有毛,以及各种把猫与其他东西区分开来的特征呢。具备了这种知道“为什么”的能力的第三波系统,便绝不会在把前面提到的图片标注为“拿棒球棍的小男孩”。


第二波系统对数据的依赖,几乎达到“丧心病狂”的地步,这也是吴恩达为什么说,当今的人工智能企业要成功,最重要的一是数据,二是人才。比如你要教会一个系统识别一个手写的数字,大概需要交给它5万甚至10万个例子,才能保证基本不出错,设想如果你教一个小孩识字,每一个字要教5万到10万次是什么情景。


因此,第三波基于“语境”模型系统的到来便成为一件自然而然的事。


IBM的辩论机器人从海量的辩论文本中学习提取有说服力的论点,谷歌刚刚推出的“观点接口”用以在社交媒体上辨别恶意评论,都是较为成功的应用尝试。从前面的分析可以看出,第一波人工智能,基于严格的问题定义 (硬编码) 而获得了较强的推理能力,略有认知,却完全欠缺学习和抽象能力。第二波人工智能建立在统计模型基础上,能够进行精准分类和预测,其认知和学习能力有了长足进步,却丧失了第一波技术的推理能力,同时抽象能力依然十分不足。第三波人工智能,理论上可以粗略理解为前两波的取长补短,然而并非把二者相加那样简单。基于统计模型的学习和基于严格问题定义的专家系统,同时存在于同一个智能系统这个目标,还有大量需要克服的技术实现以及成本问题。越仰仗人类直觉、感知的问题,对机器的挑战越大。去年圣诞期间,一辆优步无人车在旧金山当代艺术博物馆门前闯红灯的事故,就是一例。




是不是泡沫?


答案很坚决,不是。那怎样解释反复出现的涨潮退潮呢?又得回头看历史,这一次我们单独回顾一下目前最主流的“深度学习”技术的历史。


深度学习的变迁  深度学习经历了漫长而丰富的历史,跌宕起伏的热度,也被叫过不同的名字,每一个名字都反映了特定年代下的视角和观点。


今天深度学习在很多人眼里是一个令人振奋的新技术,而事实上,它的历史可以回溯到20世纪40年代。它之所以看上去新,仅仅是因为它在近几年的这股热潮之前不被人看好,也因为它经历了许多不同的名字,直到最近,才定下来被叫作“深度学习”。


最早的学习算法很多是生物学习的计算模型,所以它曾经叫作人工神经网络 (Artificial Neural Networks,ANNs) ,是实实在在基于生物大脑的启发为基础的学习系统。所以那个阶段的“学习”概念比今天的更宽泛。







请到「今天看啥」查看全文