从语言到物理,从文科到理科,跨越学科的视角下,
AI
的当下和未来呈现怎样的图景?
5
月
30
日,
首钢基金
CANPLUS
美国
AI
游学三期
走进斯坦福大学,来自中美两国的重量级专家展开精彩思辨和解读。
斯坦福大学语言学系主任、教授Christopher
Potts横跨语言和人工智能技术,从核心要素剖析AI发展范式。知名科学作家、“万维钢·精英日课”主理人万维钢重新审视了人类智能的极限和AGI降临预期。
Christopher
Potts:参数可以做到10万亿,但数据不够用
自然语言理解(NLP)是当今AI技术的重要基础。Christopher教授从一个侧面展示了语言学习的热度:2000年前,他所在的斯坦福语言学专业录取人数仅为两位数,2016年开始就超过了1000人并一直保持。
斯坦福大学语言学系主任、教授Christopher Potts
学习语言是人类天生的能力,而对于计算机来说却需要重新解构认知。语言模型的预测能力是通过大量数据学习得来的。他认为,在硬件、数据、参数等影响模型质量的因素中,数据是最重要的。也因此,2018年的GPT参数还是1亿,2020年GPT-3达到1750亿,GPT-4已经接近1万亿,短短5年,模型规模增长达5000倍。
不过,Christopher教授也指出,互联网上的数据量是有限的,达到万亿参数后,数据训练也遇到了瓶颈。“我们完全有可能打造出10万亿模型,但没有更好的数据”。
语言模型会带来哪些风险?Christopher表示,AI会给出谬误的回答,甚至错误率非常高。在现实中,加拿大航空旨在提升客户服务的AI聊天机器人因为误传了程序信息,导致向客户赔付。数据质量也是隐患,Chris指出,互联网80%以上的数据都是垃圾,无益于模型训练。
对于AI引起的社会效应,Christopher教授认为,AI会带来劳动力内部结构的深刻变化,作家可能会变成编辑,程序员会变成软件设计和测试员,数据科学家则会从数据中解放出来、专注科学研究,“工作并不会消失,但是人的职能会改变,整体是利大于弊的”。
有时候几十年里什么都没发生,有时候几星期就发生了几十年的大事——万维钢借用列宁的话表达了AI爆发时代的世界变化。
与Christopher教授的观点共通,万维钢提出了Tacit Knowledge(默会知识)的概念,“每个人都有一个女性母亲”这样的常识,机器却并不具备。但是,只要模型足够大、训练足够多,就能从语法中上升到语义概念,并掌握新的技能,“算力就是王道”。
知名科学作家、“万维钢·精英日课”主理人万维钢
著名计算机科学家Stephen Wolfram认为,GPT带来了三个重大发现,一是不需要教自然语言处理规则就能掌握一门语言,二是强烈的自组织能力,自动长出新功能,三是用同一个神经网络就能解决不同的任务。而与此相比,人的智能其实非常有限。
智能的本质是什么?世间万事万物都是在做计算,智能不过是计算的精巧度。因此,智能是对世界有损的压缩。人的情绪、直觉都是神经计算,数学和计算机程序则是形式逻辑计算。万维钢总结认为,AI=基于经验+使用直觉+进行预测。
万维钢对于AI持欢迎和乐观姿态,他列举了AI在药物开发、解读古文字、早期癌症诊断等领域的成功运用,认为所有科研领域都值得用AI更新,“我们的世界不是多了一个机器助手,而是多了一个生物”
。
万维钢表示:我最期待的是AGI(一个模型在所有领域达到人的最高水平)的出现;最担心的是AI出现智能极限,世界因此变得无趣;最满意的是它很有用,我每天都在用。