专栏名称: 我爱计算机视觉
关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net 微博:计算机视觉与机器学习,QQ群:928997753,52CV君个人账号:Your-Word。
目录
相关文章推荐
macrozheng  ·  300 秒到 4 秒,如何将 MySQL ... ·  18 小时前  
数据中心运维管理  ·  探索数据中心的多模光纤距离限制 ·  4 天前  
数据中心运维管理  ·  DeepSeek加速大马数据中心发展 ·  3 天前  
程序员鱼皮  ·  MyBatis 批量操作的 5 ... ·  昨天  
程序员鱼皮  ·  MyBatis 批量操作的 5 ... ·  昨天  
51好读  ›  专栏  ›  我爱计算机视觉

多模态杀疯了,ChatGPT版「Her」炸裂登场

我爱计算机视觉  · 公众号  ·  · 2024-08-06 12:15

正文

上周 ,GPT-4o的Her突然向用户开放 这也意味着 模态在AI拟人互动 发展上已经到下一个高度了 前不久 Open Ai 发布了小模型 GPT-4o mini,直接替代了GPT3.5turbo, 在多模态推理方面,GPT-4o mini 更是大放异彩。


实现这些AI工具共情的基础在于让其 拥有强大的多模态情感识别能力 ,在功能上从单纯的「任务执行者」进化到「满足人类情感需求的陪伴者」, 多模态大模型的落地应用离我们的生活越来越近, 这也让 多模态一跃成为2024的顶会大魔头。


我特意整理了 多模态大模型 技术路线梳理 (论文+代码) + 多模态顶会论文 800篇 + ICML 2024 顶会论文解析 + 学透 多模态大模型系列课 + 多个多模态顶会idea ,免费分享给大家!


扫码回复 “多模态”

领取多模态学习大礼包


视频内容已成为人们日常生活中获取信息和娱乐的主要方式之一。 近年来,在顶会CVPR上,视频理解相关的论文数量有显著增加。

已被ICML 2024录用为Oral paper—— Video-of-Thought ,受思维链的启发,提出从感知到认知的逐步递进方法,加速理解视频。

这次我邀请了 在头部互联网企业研发多模态大模型 Geoff老师 在8月7日晚20:00 给大家 详细解读 Video-of-Thought论文 讲解顶会论文的创新格局和写作方法


扫码回复 “多模态”

预约顶会论文解析公开课


另外我还给大家准备了《11小时吃透多模态大模型系列课程》,含前沿技术+审稿人讲解+顶会idea!


扫码回复 “多模态”

解锁多模态大模型系列课


文末福利









请到「今天看啥」查看全文