专栏名称: Dance with GenAI
关于生成式人工智能AIGC的一切
目录
相关文章推荐
北美留学生观察  ·  日本县城高中,挤满中国中产娃... ·  5 小时前  
北美留学生观察  ·  藤校进入9万美元时代!扩招、涨价、割中产娃韭菜… ·  2 天前  
BioArt  ·  Cell | ... ·  3 天前  
51好读  ›  专栏  ›  Dance with GenAI

AI图书推荐:大模型时代-ChatGPT开启通用人工智能浪潮

Dance with GenAI  · 公众号  ·  · 2024-10-30 20:35

正文

本书《大模型时代:ChatGPT开启通用人工智能浪潮》由龙志勇和黄雯撰写,深入探讨了大模型时代的到来及其对人工智能浪潮的影响。

作者简介

龙志勇:曾任阿里巴巴资深产品专家兼事业部副总经理、阿里元境资深AI专家、硅谷AI创业公司云脑科技(定制人工智能解决方案)联合创始人兼首席运营官,获GMIC“AI Startup Top10”等荣誉,在人工智能、云计算、互联网行业深耕20余年。曾撰文《从到AI的冬天》,并有多本畅销译著:《如何创造可信的AI》《稀缺》《超级合作者》《需求》等。

黄雯:互联网大厂高级AI产品经理,曾就职于腾讯和AI创业公司,积累了丰富的AI产业互联网、自然语言处理和大模型应用经验。

全书分为4个篇章。

第一篇:技术篇,科普了ChatGPT和大模型背后的技术原理,浅显易懂,小白也很容易理解。

第1章:我是一个传话筒

本章通过拟人化的手法,介绍了ChatGPT对话机器人“小二”与大模型“老莫”之间的互动,阐释了ChatGPT在接收用户输入和生成响应过程中的工作原理。

第2章:我是一个大模型

本章继续以对话形式,揭示了大模型“老莫”如何通过预测下一个最可能的字或词来生成连贯的文本,以及大模型在训练和推理阶段的工作原理。

第3章:ChatGPT是怎样炼成的

探讨了ChatGPT的训练过程,包括预训练、监督学习和强化学习等阶段,以及这些训练如何赋予ChatGPT强大的语言理解和生成能力。

生成式预训练方法的重要性直到2022年才显现,主要因为早期算力不足和数据稀缺,且符号主义主导了AI研究。杰弗里·辛顿在1986年提出自监督学习模型,但受限于资源。2017年,Transformer架构的出现推动了大语言模型的发展,OpenAI的GPT选择生成式训练,而谷歌的BERT则采用双向编码。尽管GPT在初期表现不佳,但通过不断增加算力和数据,GPT-2和GPT-3逐渐展现出通用智能的潜力,最终获得业界认可。伊利亚·萨特斯基弗强调,除了技术和资源,信念也是关键。GPT的成功证明了坚持和信念在AI发展中的重要性。

第4章:大模型的未解之谜

讨论了大模型中的“涌现”现象,即模型在达到一定规模后表现出的新能力,以及这些能力的出现往往是不可预测和不可控的。

第2篇:变革篇,这波生成式AI对于编程、劳动力市场、人类认知等方面的带来的巨大变革。

第5章:大机器时代的启示

通过历史视角,比较了大模型时代与工业革命时期的技术变革,探讨了新技术对劳动力市场的影响和可能的社会变革。

第6章:大模型与智力革命

分析了大模型如何改变人类的认知过程,提高知识处理的效率,并可能引发一场智力革命。

第7章:自然语言编程与脑机协作

讨论了大模型如何通过自然语言编程和交互,促进人与机器之间的协作,以及这种协作如何影响知识工作。

第8章:变革时代的韵脚

探讨了大模型对劳动力市场的影响,以及新技术如何可能创造新的就业机会和引发社会结构的变化。

卢德主义者反对机器,因其导致失业和收入不均。工业革命初期,技术进步主要体现为取代人力,导致“恩格斯式停顿”,工人生活水平停滞。然而,随着技术发展,新岗位如经理、工程师等出现,提高了对技术工人的需求和工资。新技术不仅降低产品成本,还创造了新市场和产品,如蒸汽机车、汽车和智能手机,扩大了市场规模。生产率提升也增加了闲暇时间,促进了消费市场扩大。1840年后,工业革命进入良性循环,工人实际工资上涨。新技术使能效应的关键在于生产体系和人力教育的适应,确保新岗位的增加能抵消旧岗位的损失。

第3篇:应用篇,讲解了AI在各个场景的应用情况。

第9章:大模型应用的两种创新

分析了大模型在行业中可能引发的渐进式创新和颠覆性创新,以及企业如何利用大模型进行创新。

蒸汽机时代催生了工厂制,工人集中于工厂,生产分工专业化,整体效率提升。电气化初期,工厂仅替换中央动力源的蒸汽机,未改变集中驱动架构,效果不佳。经济史学家小沃伦·迪瓦恩指出,问题在于未充分利用电动机的灵活性。若每台机器配备独立电机,摆脱传动轴,可大幅提高灵活性,优化生产流水线布局,减少动力故障影响,提高生产率。1929年,电动机提供全美工厂80%机械动力,被视为“第二次工业革命”的催化剂。

第10章:知识工作型应用

探讨了大模型在知识密集型产业中的应用,如教育、法律和政府工作等领域。

第11章:企业业务型应用

讨论了大模型在企业业务流程中的应用,如市场营销、客户服务和产品设计等。

第12章:创意娱乐型应用

分析了大模型在创意产业中的应用,如内容创作、娱乐和个人IP打造等。

第13章:大模型应用的三重境界

提出了大模型应用的三个层次:个人效率提升、业务流程优化和全新业务模式的创造。

第一重是个人使用,提高工作效率,探索应用成熟度,注意数据保密。

第二重是嵌入业务流程,调整流程和岗位,进行质量审核,可与供应商签订服务等级协议,评估应用成熟度和优先级。

第三重是重新设计业务,进入新市场,创建新模式,适合初创企业或独立团队,追求颠覆式创新和市场增量。

整体效益最大化需考虑业务环节的信息量和容错率。

第4四篇:产业篇,介绍了AI大模型的产业链,投资机会。

第14章:大模型产业拆解

详细拆解了大模型产业的四个层次:硬件基础设施、软件基础设施、模型MaaS层和应用层。

第15章:关于大模型产业的对话:第1集

通过对话形式,讨论了大模型的商业化、技术挑战和社会影响。

V姐认为国内GPU在推理场景有优势,未来需求量大。老A指出推理GPU是边际服务成本,类似互联网视频初期的带宽成本。V姐预测推理成本会下降,甚至可能转移到用户终端。小柯提到LLaMA-13B推理成本已降低,但仍需优化算力效率。老A强调模型推理成本应低于替代人时的价值,选择高价值应用场景才能盈利。V姐总结模型推理成本应低于替代人时的价值,选择高价值应用场景才能盈利。







请到「今天看啥」查看全文