专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
相关文章推荐
新浪科技  ·  【#特斯拉上海工厂原厂长宋钢入职远景# ... ·  4 天前  
新浪科技  ·  【工信部:截至11月末#我国5G用户数突破1 ... ·  4 天前  
虎嗅APP  ·  从年薪百万到月入三千,柜姐被中产抛弃 ·  5 天前  
51好读  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20241226

腾讯研究院  · 公众号  · 科技媒体  · 2024-12-26 00:01

主要观点总结

本文报道了关于生成式AI的多个相关新闻,包括OpenAI重启机器人研发、Sakana AI推出ASAL系统、ControlNet作者张吕敏发布图像打光新项目LuminaBrush、Hume AI推出OCTAVE文本与语音引擎、Freed AI病历助手的应用、模拟生命体研究、科学计算基座大模型BBT-Neutron的开源、a16z合伙人关于软件变革的对话以及微软、IDC联合发布的关于企业级生成式AI的调研成果等。

关键观点总结

关键观点1: OpenAI重启机器人研发,并投资多家机器人公司,展示其最新旗舰模型o3在实体机器人开发中的技术优势。

OpenAI重新启动机器人团队并提供GPT模型支持,实体机器人领域竞争加剧,引发公众对机器人与人类关系的担忧。

关键观点2: Sakana AI推出ASAL系统,基于基础模型自动搜索和发现人工生命形式。

ASAL系统通过三种方法发现新的模拟生命,为人工生命和AI发展提供新视角,探索核心原理,可能加速AI系统的进化。

关键观点3: ControlNet作者张吕敏发布图像打光新项目LuminaBrush,基于Flux模型构建,提供更精细的光照控制。

LuminaBrush采用两阶段方法,通过用户涂鸦生成光照,具有更高的交互性。

关键观点4: Hume AI推出OCTAVE文本与语音引擎,赋予AI情感表达力。

OCTAVE能生成具个性和角色的声音,模拟不同角色间互动,在心理健康、教育和娱乐等领域有广泛应用。

关键观点5: Freed AI通过AI转录技术帮助医生自动生成病历记录,减少文书工作时间。

Freed AI已吸引1万名付费医生使用,年收入达1000万美元,采用简单的订阅模式帮助医生提升效率并降低成本。

关键观点6: 智源研究院发布BAAIWorm天宝,实现秀丽线虫神经系统、身体与环境的闭环仿真。

该系统推动具身智能和AGI的研究,通过精确建模推动人工智能与生物智能的融合研究。

关键观点7: 首个科学计算基座大模型BBT-Neutron开源,突破大科学装置数据分析瓶颈。

BBT-Neutron采用二进制分词方法,实现多模态数据的统一处理,在粒子喷注识别任务上性能与专业模型持平。

关键观点8: a16z合伙人讨论软件变革,AI重塑劳动力市场的方式。

AI改变软件的应用方式,逐步取代繁琐的人工工作流程,影响软件市场和定价模式,企业可能通过AI降低劳动力成本并提升效益。

关键观点9: 微软、IDC联合发布调研成果,揭示企业级生成式AI的5大应用趋势。

生成式AI商业化进程加速,企业投资回报率高,各行业应用扩展,尤其在金融、医疗、制造等领域。


正文

生成式AI

一、  OpenAI重启机器人研发,投资N家机器人公司后亲自下场

1. OpenAI重新启动机器人团队,投资Figure AI、1X和Physical Intelligence,并提供GPT模型支持;

2. 最新旗舰模型o3在推理和AGI测试中超越人类,展示其在实体机器人开发中的技术优势;

3. 实体机器人领域竞争加剧,公众担忧机器人与人类可能发生冲突,类似《终结者》场景;

https://mp.weixin.qq.com/s/3AzJ6Q3vhtJ5O_pTJal6cg

二、  做出AI科学家的Sakana AI又放大招,自动搜索人工生命

1. Sakana AI推出ASAL系统,基于基础模型自动搜索和发现人工生命形式;

2. ASAL通过三种方法(监督式目标、开放式、阐明)发现新的模拟生命,扩展了涌现行为和生命形式的边界;

3. 该研究为人工生命和AI发展提供新视角,探索自我复制、进化及智能的核心原理,可能加速AI系统的进化。

https://mp.weixin.qq.com/s/CVADIa03U2EqpirGbzklrQ

三、  ControlNet作者张吕敏发布图像打光新项目LuminaBrush

1. 张吕敏发布新项目LuminaBrush,旨在通过交互式涂鸦在图像上绘制光照效果;

2. 项目采用两阶段方法,首先将图像转换为均匀光照效果,然后通过用户涂鸦生成光照;

3. 基于Flux模型构建,LuminaBrush提供更精细的光照控制,相比此前的打光项目IC-Light具有更高的交互性。

https://mp.weixin.qq.com/s/nfk2TVrRRLfNOqt8GXjKFg

四、  Hume AI 推出OCTAVE文本与语音引擎,情感AI播客来了

1. Hume AI发布OCTAVE,赋予AI情感表达力,使其不仅能模仿人类语言,还能通过声音传达情感;

2. OCTAVE可以生成具有个性和角色的声音,并在实时对话中模拟不同角色间的互动;

3. OCTAVE在心理健康、教育和娱乐等领域有广泛应用,未来可能带来更具温度的AI陪伴体验。

https://mp.weixin.qq.com/s/GVowIADwAnUyTqbPtjjNOA

五、  Freed AI病历助手,创立1年1万付费医生,千万美金ARR

1. Freed AI通过AI转录技术帮助医生自动生成病历记录,减少文书工作时间达73%;

2. 公司成立不到2年,已吸引1万名付费医生使用,年收入达1000万美元;

3. 采用简单的99美元/月订阅模式,帮助医生提升效率并降低成本。

https://mp.weixin.qq.com/s/vV1R_scAfHJZLLmk58TUmQ

前沿科技

六、  模拟生命体,智源线虫登上Nature子刊封面,探索AGI新路径

1. 智源研究院发布BAAIWorm天宝,首次实现秀丽线虫神经系统、身体与环境的闭环仿真;

2. 该系统为研究大脑与行为之间的神经机制提供新平台,并推动具身智能和AGI的研究;

3. 通过精确建模神经网络与生物力学,BAAIWorm为模拟复杂行为提供了创新的实验工具,推动人工智能与生物智能的融合研究。

https://mp.weixin.qq.com/s/dVZokaecmoYglg1paoejWA

七、  科学计算基座大模型BBT-Neutron开源!专注科学装置数据分析

1. 首个科学计算基座大模型BBT-Neutron开源,突破大科学装置数据分析瓶颈;

2. 采用二进制分词方法,实现数值、文本和图像等多模态数据的统一处理;

3. 在粒子喷注识别任务上性能与专业模型持平,并展示出涌现现象,验证模型的高可扩展性。

https://mp.weixin.qq.com/s/Kkydfy54Shy6N1L7TpnF7g

报告观点

八、  a16z合伙人对谈软件变革:AI以何种方式重塑劳动力市场?

1. AI 正在改变软件的应用方式,让软件不仅存储数据,还能执行实际操作。

2. 技术进步通过降低成本,开辟了新的市场机会,逐步取代繁琐的人工工作流程,形成新的劳动力替代模式。

3. AI 新时代不仅影响软件市场,还深刻改变定价模式,企业可能通过AI技术降低劳动力成本并提升效益,从而使收入潜力大幅增长。

https://mp.weixin.qq.com/s/ACIVUvcgvtVs5KQU1ce1Xg

九、  微软、IDC联合发布调研成果:企业级生成式AI,5大应用趋势

1. 生成式AI的商业化进程加速,企业每投资1美元能带来3.7倍回报;

2. 企业正向更高级定制化AI解决方案发展,预计在24个月内扩展应用;

3. 生成式AI在各行业应用扩展,尤其在金融、医疗、制造等领域,ROI持续增长。https://mp.weixin.qq.com/s/e28aEH1sAT7MhcIzV5-KFw

👇订阅下方合集,获取每日推送