0、中国工程院发布 2024 全球十大工程成就
12 月 18 日,中国工程院院刊《Engineering》官方公布了由该刊评选的「2024 全球十大工程成就」。「2024 全球十大工程成就」经由全球征集提名、专家遴选推荐、公众问卷调查、评选委员会审议确定,包括:CAR-T 细胞疗法、嫦娥六号、低轨通信卫星星座、柔性显示、高温气冷堆核电站、智能工厂、无人驾驶汽车、手术机器人、文生视频大模型 Sora、超大型风力发电装备。
1、基于 AI 架构和技术选型的几条原则
我觉得基于 AI 架构和技术选型的几条原则:
第一条:选 AI 训练语料多的、AI 生成质量好的语言和框架,比如 Web 开发选 TailwinCSS;
第二条:要有良好的测试覆盖,AI 生成的代码,必须辅助大量的测试代码保证质量,当然这个测试代码也应该主要由 AI 辅助生成;
第三条:尽可能不自己造轮子做复杂框架,因为 AI 不擅长学习你发明的私有框架,而是让 AI 基于流行框架对模块生成独立的代码
第四条:减少模块之间的耦合度,让模块尽可能独立和原子化,不必追求代码的抽象和复用,方便 AI 不需要学习太多上下文就可以对模块进行开发和维护( 微博 宝玉 xp)
2、豆包视觉理解大模型正式发布,比行业平均价格便宜85%,字节跳动再掀大模型价格战
12 月 18 日,在举行的火山引擎 Force原动力大会上,豆包视觉理解大模型正式发布。该模型允许用户同时输入文本与图像数据,并迅速提供精准回应。它的亮点在于强大的内容识别技术、深度的理解及推理能力以及细腻入微的视觉表述技巧。同时火山引擎总裁谭待宣布该模型价格为 0.003 元/千 tokens,比行业价格低 85%,相当于一元钱就可处理284张720P的图片,视觉理解模型进入「厘时代」。这意味着,字节跳动在多模态大模型领域再次复制其在通用大模型领域大幅降价的打法。今年5月,该公司正式对外发布豆包大模型,并把价格降低了一个数量级,引发了阿里、百度等多家厂商大模型的降价潮。火山引擎总裁谭待此前表示,降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。(界面新闻)3、OpenAI 重磅推出电话服务
北京时间今天凌晨,在 OpenAI 第十场发布会上 ,重磅推出电话服务。据官方介绍,即日起,美国用户可将 ChatGPT 添加到电话通讯录,然后用智能手机/座机/老人机拨打 1-800-242-8478,它就能回应你提出的问题,比如景点导览亦或者语言翻译等。并且OpenAI 将向美国用户提供 15 分钟的免费通话时间。直播中,OpenAI 首席产品官 Kevin Weil 表示:「我们的使命是让通用人工智能造福全人类,部分目标就是尽可能让它向更多人开放。今天,我们迈出了下一步,把 ChatGPT 带到你的电话中。」与此同时,ChatGPT 也正式「入驻」WhatsApp。届时,GPT-4o mini 将为 WhatsApp 用户提供基础对话服务。虽然无需注册即可使用,但受限于使用额度,建议你还是转向 App 或网页版获取完整体验。OpenAI 表示,正在为 WhatsApp 开发图像分析和网页搜索等更多功能,但暂未公布这些功能的上线时间。另外,微软搜索主管 Jordi Ribas 于今日凌晨宣布 DALL·E 3 更新了一个新型号 DALL-E 3(PR16),不仅图片生成速度提升一倍,同时质量也有所提高。4、爱诗科技完成近 3 亿元 A+ 轮融资
12 月 18 日,爱诗科技宣布完成 A2 至 A4 轮融资,总金额近 3 亿元人民币。此前,A2 轮融资由蚂蚁集团投资,近期 A3、A4 轮融资由北京市人工智能产业投资基金、国科投资及光源资本投资。据官方介绍,融资将主要用于提升技术研发能力、扩展算力资源以及建设人才团队,加速产品功能迭代与市场覆盖,持续推动 AI 视频生成技术的普惠。截至目前,爱诗科技的核心 AI 视频生成产品 PixVerse 全球用户数超 1200 万,月活跃用户数近 600 万。自 2024 年 10 月 PixVerse V3 版本发布后,「毒液变身」等创意特效功能席卷海内外社交媒体,为亿万用户提供了前所未有的 AI 视频生成体验。