《通用人工智能》是由田杰华、易欢欢所著,中译出版社出版的一本关于通用人工智能的图书。
田杰华:曾先后任职于交通银行、银河证券、新时代证券、浙商证券等机构,多年计算机行业投资研究经历。中国人民大学财政金融学院专硕校外兼职导师。
易欢欢:易股天下集团董事长、华建函数CEO、北京大学金融校友联合会副会长,担任上市公司亚联发展董事,汉威科技独立董事、中国金融科技博物馆理事、北京互联网金融协会研究院主任、中国互联网金融博物馆理事、中国青年企业家协会理事,还是盘古智库发起创始人,《元宇宙》《元宇宙通证》《元宇宙大投资》作者 。
第一章 人类正迈向通用人工智能时代:介绍了通用人工智能(AGI)的背景和当前的发展状况,探讨了ChatGPT的出现及其对人工智能发展的影响,分析了全球大模型的发展趋势和多模态、具身智能的兴起。
对比信息交互的历史,新的AI生态将重塑人机交互的方式。在信息匮乏的年代,信息通过如雅虎(Yahoo)、新浪、腾讯、网易等门户网站进行分发;随着信息量的增加到信息爆炸,搜索技术崛起,可以通过简单的搜索输入框查询想要的信息,百度和谷歌是这个时代中英文搜索引擎的代表;随之进入AI10时代,大量信息过载,通过内容分发到各个App,通过人物画像和偏好特征等构件,信息精准地推送给需要的人;随着ChatGPT的出世进人 AI2.0时代,信息交互的模式变成了AI交互行为,通过提示词输入,AI返回需要的结果。互联网时代,流量的底层逻辑在于连接,连接提供选择,凭借精确性、高效性、标准化、通用性通过用户习惯和价值供给产生黏性。人工智能时代,流量的底层逻辑在于连接之上的“认知、了解、知道”,是更高维度的“降维打击”,AI懂你需要什么、适合什么,并直接给出你想要的答案提高用户价值,获得效益、效率,降低信息和价值获取的时间和成本。
-
通用人工智能与人类文明进程:回顾了人类文明的发展历程,探讨了人工智能在其中的作用和影响,分析了人工智能的科技历史文化思想源头,以及人类发展进入智能文明新阶段的特征。
第三章 通用人工智能的技术演变脉络:详细介绍了人工智能技术的发展历程,从符号主义到深度学习的技术探索,从Transformer到BERT、GPT大模型的发展,以及从多模态到具身智能的技术融合升级。
注意力机制主要分为自注意力、软注意力(soattention)、硬注意力(hard-attention)。自注意力是 Transformer多大型语言模型的核心组成部分。注意力模型中注意力是完全基于特征向量计算的,每个输人入项分配的权重取决于输人项之间的相互作用;软注意力就是对每个输入分配的权重系数在0-1之间关注的信息有些多一点有些少一点,程度不同;而硬注意力就是要么关注要么不关注,好处是可以集中算力和时间在重点关注的信息上面,坏处是这种“非黑即白”的方式可能导致本来应该关注的信息却被舍弃掉了。
在Transfommer 算法模型出现之前,大部分自然语言处理都是用R和构建的。CNN在图像处理领域很有效,可以比较好地把握图像局部特征。RNN对于处理顺序特性的信息很有效例如在语音处理领域将每一帧的信号作为一个序列;在自然语言处理领域将每个词或句作为一个序列;在时间序列方面将气温变化作为一个序列。传统人工神经网络通过RNN在语音识别、机器翻译等领域有很大的进展和应用。
从另一个维度来看,注意力机制是利用数字来表达词与词之间的相关程度,数值越大表示相关性越高。在句子中,语言模型需要计算词语之间的相关系数,用注意力分数来表达它们之间的联系。
-
通用人工智能的产业生态布局:探讨了通用人工智能的产业生态布局,包括大模型的分类、趋势演变和商业模式,算力层的发展,数据层的重要性,以及应用层从AIGC走向通用人工智能的路径。
-
通用人工智能的全球竞争态势:分析了通用人工智能在全球范围内的竞争态势,包括全球科技周期视角下的通用人工智能发展,大模型的全球竞争,以及通用人工智能对中国的机遇和意义。
第一种情况,在通用计算领域,大模型会形成走向集中,形成少数几家寡头垄断的局面。这是大模型的技术、场景数据等内在联系的逻辑和要素所决定的。通用大模型的集中是数字经济规律的必然,在数字经济中,产品和服务通常具有高固定成本和低边际成本的特点,甚至有些产品的边际成本趋近于零这是由于数字产品和服务的开发和生产过程中存在高额的固定投人,而每次复制或使用的成本相对较低。这种经济规律确实有可能导致垄断或高度集中的市场结构。通用大模型很明显符合上述特征。在行业的初期,各路资本和企业纷纷涌人做大模型,希望在这个大赛当中能够脱颖而出。行业初期竞争格局分化还不是很明显,但一旦大模型技术出现突破,模型的准确度、智能度出现明显优势,行业需求会迅速向行业第一集中,从而形成一家或者少数几家寡头垄断的局面。大模型作为一种服务对外开放使用。未来无论中外,大模型只要不需要私有化部署、不涉及敏感数据可以直接连接提供模型服务的大厂使用。这将会比互联网时代的龙头资源垄断效应会更加明显,必将是赢者通吃,其他公司很难构建起真正的大模型护城河,大模型的规模效应将显现,单位边际成本降低,将带动大模型实现普惠化。