专栏名称: AI科技评论
点评学术,服务 AI !
目录
相关文章推荐
51好读  ›  专栏  ›  AI科技评论

曝MiniMax年营收或超7000万美金,旗下应用Talkie爆火;雷军回应AI语音恶搞:很困扰,希望大家别玩了丨AI情报局

AI科技评论  · 公众号  ·  · 2024-10-30 18:05

正文


要闻提示

1.曝MiniMax今年收入预计7千万美元,旗下应用Talkie爆火产生大量广告收入,引发角色陪伴类AI应用复刻热潮

2.雷军 AI 语音被恶搞!雷军首次回应:让自己很困扰,希望大家别玩了

3.美国限制中国 AI 投资新规确定,将于明年 1 月生效,由财政部新部门负责

4.ChatGPT 周活跃用户 2.5 亿,75% 收入来自消费者订阅

5.苹果最新系统更新!支持通话录音,全面支持 AI 写作


今日头条

曝MiniMax今年收入预计7千万美元,旗下应用Talkie爆火产生大量广告收入,引发角色陪伴类AI应用复刻热潮

中国人工智能初创企业正试图打入美国市场,实现收入的快速增长。总部位于上海的MiniMax在过去一年中取得了重要的商业化进展。据媒体报道,MiniMax今年的收入将达到约7000万美元。在一直难以商业化的AI初创公司中,这已是一个很高的预测。据知情人士透露,大部分收入来自MiniMax的虚拟聊天机器人应用程序Talkie,该应用程序在美国青少年中很受欢迎。根据Sensor Tower的监测,自发布以来,Talkie就长居全球陪伴类AI应用下载量的前三。

据两位知情人士透露,MiniMax的国内版Takie星野一直难以盈利。MiniMax的大部分销售额来自Talkie上的广告,但它也提供高级订阅服务,让用户可以与虚拟形象进行更长时间的对话。鉴于需求波动,MiniMax的收入预测可能会发生变化。MiniMax在3月份宣布的一轮融资中估值为25亿美元,最终筹集了6亿美元。

Talkie的成功,在国内引发了一波角色陪伴类AI应用的热潮。但无论是字节跳动的“猫箱”,还是在二次元社区红极一时的“捏 Ta ”,再无一款可以复刻Talkie在全球的增长速度。Talkie成功的难以复制,也让MiniMax在试图使用相同方法论扩张业务时,陷入一种僵局。如今,MiniMax的估值已经超过 200 亿元——为了增强企业的业务壁垒和抗风险能力,它需要更多的Talkie。多名行业人士相关者表示,无论是MiniMax力推的Talkie国内版本“星野”,还是生产力工具“海螺AI ”,MiniMax都想在上面复刻同一套打法:加入陪伴和社交元素。然而,即便是Talkie的缔造者,也没能再造一款Talkie。

与此同时,中国AI公司正试图通过在新加坡、香港或美国等海外设立实体来避免TiKToK在美国面临的问题。相关公司在中国境外的服务器上运行海外应用程序,比如MiniMax使用海外AWS数据中心为其Talkie应用程序运行推理。(Z Finance、智能涌现)


国内资讯

雷军 AI 语音被恶搞!雷军首次回应:让自己很困扰,希望大家别玩了

10 月 29 日,小米 CEO 雷军首次通过视频回应雷军 AI 配音被恶搞。雷军称,最近两年 AI 特别火,技术进步特别快,前段时间在刷视频的时候经常看到很多人在玩“雷军 AI ”,就是“雷军语音包”,有网友跟他投诉,说国庆期间被自己“骂”了整整 7 天。雷军表示:“的确让自己也挺困扰,也挺不舒服的,在这里希望大家不要再玩了,这个事情不太好,不过还是觉得 AI 是很好的技术,也非常实用。”

根据相关法律法规的规定,任何组织或个人未经声音权人同意,不得擅自使用、公开或侵害其声音权益。律师提醒,AI 语音技术的滥用不仅侵犯了个人的声音权,还可能对个人名誉造成损害。

此前,有网友在小米集团公关部总经理王化评论区留言称“把雷军 AI 语音骂人的事情先解决一下吧”对此,王化回复称“已经转给他们(小米法务部)。”(快科技)

一张显卡“看懂”一部电影:智源联合高校开源 Video-XL,打破长视频理解极限

长视频理解是多模态大模型的核心能力之一,也是迈向通用人工智能(AGI)的关键一步。然而,现有的多模态大模型在处理 10 分钟以上的超长视频时,仍然面临性能差和效率低的双重挑战。对此,智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校,推出了小时级的超长视频理解大模型 Video-XL。

Video-XL 借助语言模型(LLM)的原生能力对长视觉序列进行压缩,不仅保留了短视频理解的能力,而且在长视频理解上展现了出色的泛化能力。Video-XL 相较于同等参数规模的模型,在多个主流长视频理解基准评测的多项任务中排名第一。

此外,Video-XL 在效率与性能之间实现了良好的平衡,仅需一块 80G 显存的显卡即可处理 2048 帧输入(对小时级长度视频采样),并在视频「大海捞针」任务中取得了接近 95% 的准确率。未来,Video-XL 有望在电影摘要、视频异常检测、广告植入检测等应用场景中展现出广泛的应用价值,成为得力的长视频理解助手。(IT之家)

有研究称:生成式人工智能带来的电子废弃物垃圾不容忽视

10 月 29 日,中国科学家联合国际同行完成题为“生成式人工智能的电子废弃物挑战”的研究论文,文章指出“如果不采取循环经济的策略,2020 年至 2030 年生成式人工智能带来的电子废弃物将可能增加近 1000 倍,或累积达 120 万至 500 万吨。”

该研究团队创新开发出“算力物质流”模型,并基于生成式人工智能的流行推广情况,以大语言模型为主要关注点,构建了从激进情景(更广泛的应用)到保守情景(更具体的应用)生成式人工智能未来发展 4 种情景,据此计算预测了 2020 年至 2030 年生成式人工智能产生的电子垃圾的潜在生成量和规模。

基于上述情况,该团队提出生成式人工智能循环经济的措施策略,并基于对产业界的技术进展,开展了循环经济措施的潜力评估,研究发现采取循环经济策略,包括延长现有架构的寿命以及在再生产过程中重复利用关键模件和材料,或让人工智能产生的电子废弃物垃圾减少 86%。(中国新闻网)

智源推出全能视觉生成模型 OmniGen 集多项能力于一体

北京智源人工智能研究院(BAAI)推出全新全能视觉生成模型 OmniGen ,标志着图像生成领域重大突破。OmniGen 以统一性、简单性和跨任务知识迁移能力著称,可处理多种图像生成任务,包括文生图、图像编辑、主题驱动生成和视觉条件生成。模型简化架构、用户友好操作,无需插件或复杂步骤,能有效跨任务迁移知识,展示新颖功能。

OmniGen 的基本架构由一个 transformer 模型和一个 VAE 模块组成。它的 transformer 继承于 phi3-mini 模型,图像内部改用双向注意力,以契合图像数据的特性。这种设计使得 OmniGen 在处理图像数据时更加高效、准确。而且,为了实现强大的通用和泛化能力,研究人员还构建了首个大规模且多样化的统一图像生成数据集 x2i。这个数据集就像是 OmniGen 的“营养宝库”,为它提供了丰富的素材和知识,让它能够不断成长和进步。(站长之家、火创科技)

阿里国际站张阔:AI 正在重塑外贸的供需匹配和经营模式

10 月 28 日,阿里国际站总裁张阔在“ 2024 全球浙商跨境嘉年华”现场发布首个全流程 AI(人工智能)。他表示, AI 正在重塑外贸的供需匹配和经营模式。

张阔预测,未来 100% 的商品信息都会被 AI 基于对买家更精准的洞察而重构。在此基础上,未来将有超过一半的线下商机会通过 AI 来服务,而 AI将 能更好地满足买家的实时需求。最终,未来 80% 的新增商业价值更会在 AI 的驱动下被重新分配,掌握 AI 将成为未来外贸企业的基本技能。

“外贸正在走向全面 AI 化。”张阔谈到,AI 助理会像真正专业的外贸助手一样,在各自领域帮外贸人找到更高效的经营方式,实现生意增长。他总结 AI 产品的最大特点在于三个关键词:增量生意、省时省力、更具个性化。

他表示,当前市面上大部分的 AI 产品,还只是一系列提效的小工具,停留在帮人做一些重复性的琐碎工作、提升某个单点环节的效率。AI 应该真正被应用于处理外贸生意的最核心环节:提升转化率、创造增量生意,“因为 AI 能对不同国家、不同文化、不同行业买家的复杂需求理解更精准,能实现对买家市场的实时洞察”。(新京报)

微博 COO 王巍:AI 拓宽了用户对信息的深度需求

10 月 28 日,在新浪新闻 2024 探索大会上,微博 COO 王巍表示,传统的内容消费方式,如阅读、观看和简单的互动(转评赞)已不再满足用户对信息获取的深度需求。AI 技术的应用为内容消费带来了两个主要的新特点:“总结式消费”和“多轮互动式深度信息消费”。

据介绍,“总结式消费”即 AI 自动分析和总结篇幅较长内容,从中提取关键信息或用户可能感兴趣的细节要点。例如,微博智搜,结合大模型+搜索引擎,为用户提供全面的总结式信息消费服务。“多轮互动式深度信息消费”则是允许用户通过与 AI 进行多轮次的交互,深入理解和探讨内容。例如,微软在浏览器 Edge 上推出的 Copilot Vision ,可以理解用户当前浏览的网页内容并根据内容和用户进行互动,该功能还将支持语音对话,让用户直接通过自然语言和 AI 助理进行交互。(北京商报官方)

天桥脑科学研究院 OMNE 长效记忆框架在 GAIA 排行榜中位居榜首

10 月 29 日消息,天桥脑科学研究院(TCCI)的内部 AI  团队在人工智能领域取得突破,其自主研发的OMNE 多智能体框架在 Hugging Face 发布的 GAIA(通用 AI 助手)基准排行榜中占据榜首。OMNE 超越了包括微软研究院在内的一些全球顶尖机构的框架。这一成就建立在 TCCI 多年的脑科学研究基础上,使智能体具备了长效记忆(LTM)能力,从而使该框架能够进行更深入、更缓慢的思考,并增强大语言模型(LLM)在复杂问题解决中的决策能力。

此外,通过引入更高效的逻辑推理,OMNE 不仅提升了单个智能体的智能水平,还通过优化协作机制显著增强了多智能体系统的整体能力。通过加强单一智能体与其他智能体之间的协作,AI 模型可能逐渐产生认知能力的涌现,构建内部表征模型,从而推动系统整体智能的飞跃。(钛媒体AGI)

百图生科发布 xTrimo V3 生命科学基础大模型,全模态突破赋能更多研发场景

百图生科(BioMap)在第三届中国生物计算大会上发布了新一代生命科学基础大模型——xTrimo V3。这款模型参数量达到了2100亿,是目前全球规模最大的全模态生命科学大模型。

“这一版本一举实现了全模态的覆盖,从而能支撑快速发展的生命科学新领域新问题探索需求。”百图生科技术副总裁张晓明介绍,“与 V2 平台相比,V3 不仅巩固了之前在蛋白质领域的基础和继续了在细胞领域的发展,还拓展至基因组学、转录组学、细胞复杂任务、影像分析和文本分析等领域,支持从分子早期研发到生产放大再到后期实验分析的全流程 AI 建模需求。”

2023 年 3 月,百图生科发布了基于 xTrimo 驱动的 AIGP(AI Generated Protein) 平台。利用该平台,即使是不具备编程能力的科研人员也可利用大模型和数十个蛋白质相关任务模型、配套软硬件系统,开展创新蛋白设计研究。而此次,xTrimo V3 平台还发布了专为生命科学AI模型设计的模型工具链 ——包含面向多种数据场景和用户需求的 Model Builder 模块,支持模型管理和组装的 Model Hub 模块,以及加速模型调用和物理计算的 Model Booster 模块等。(BioMap 百图生科)

人工智能有望助力中国乳腺癌防治

媒体从北京协和医院了解到,院乳腺外科科研团队自主研发的基于人工智能的红外热成像体系(AI-IRT),有望应用于乳腺癌临床前筛查,为优化乳腺癌筛查策略和提高患者生存率作出贡献。目前研究成果已在外科学著名期刊《国际外科学杂志》上发表。杂志匿名审稿人表示,这一研究填补了世界范围内乳腺癌临床前筛查研究的部分空白,有望为推动乳腺癌筛查策略的优化和提高患者生存率作出贡献。(新华社)

度小满 CEO 朱光:推理大模型应用金融领域,要深入核心业务

10 月 28 日,2024 年香港金融科技周在香港亚洲国际博览馆开幕。度小满 CEO 朱光在科技周主论坛上指出,“以 o1 推理大模型为代表的新一波生成式 AI 技术在金融领域的应用,将从外围场景深入到核心业务,直接影响金融行业的核心决策质量,在为客户的产品和服务体验上带来巨大突破的同时,将会重塑金融科技行业。”

朱光表示,当前大模型已掌握了风控知识并具备推理能力,“可以像专业审核员一样读征信报告、看账单流水,甚至能解读网络大数据,思考和捕捉数据之间的关联,并生成风险判断的依据和结论,”。同时,他认为大模型在金融领域应用落地还在持续扩大,先拥抱 AI、拥抱大模型,降低 AI 使用门槛,以解决更多实际场景下的复杂问题。(36氪)

国际资讯

美国限制中国 AI 投资新规确定,将于明年 1 月生效,由财政部新部门负责

10 月 28 日,拜登政府宣布,将最终确定对美国在中国人工智能及其他可能威胁国家安全的技术领域投资的限制规则。新规定将于 2025 年 1 月 2 日生效,监管工作将由财政部新设立的全球交易办公室负责。财政部指出,这些技术在下一代军事、网络安全、监控和情报应用中扮演核心角色。

财政部高级官员保罗·罗森(Paul Rosen)补充说,规则将涵盖诸如“尖端破译计算机系统或下一代战斗机”等高端技术。他强调,美国的投资,特别是涉及管理援助和人才网络等无形利益,不应用于支持相关国家在军事、情报和网络能力方面的发展。此次规定是美国更广泛努力的一部分,旨在防止美国的专有技术助力其他国家在尖端技术领域的发展,从而主导全球市场。商务部长吉娜·雷蒙多(Gina Raimondo)曾表示,这些规则对阻止一些国家在军事技术方面的进步至关重要。

新规还包含一项允许美国投资公开交易证券的例外条款,但官员指出,依据之前的行政命令,美国已有权禁止对特定中国公司的证券交易。此外,美国国会众议院中国问题特别委员会曾批评主要指数提供商,认为他们将美国投资者的数十亿美元资金投入了那些被认为促进其他国家军事发展的公司的股票中。(Z Finance)

ChatGPT 周活跃用户 2.5 亿,75% 收入来自消费者订阅

10 月 28 日,OpenAI 首席财务官 Sarah Friar 向电视台表示,该公司的 ChatGPT 每周拥有 2.5 亿活跃用户,5% 至 6% 的免费用户注册了付费产品。OpenAI 于 2023 年 8 月推出了 ChatGPT Enterprise,1 月推出了 ChatGPT Team,5 月推出了 ChatGPT Edu。该业务产品一半以上的付费用户位于美国以外。

与此同时,OpenAI 正在努力争取更多企业客户。弗里尔表示,该公司对那里的潜力感到非常兴奋。该公司在 10 月初筹集到 66 亿美元新资金后,估值几乎翻了一番,达到 1570 亿美元。今年年初,当一些员工出售股票时,该公司的估值曾达到 860 亿美元。据9 月27 日报道,OpenAI 预计其2024 年年销售额将达到 37 亿美元,2025 年将达到 116 亿美元。然而,在支付运营成本、工资和管理费用后,该公司预计今年将亏损约 50 亿美元。(鞭牛士)

谷歌扩展 AI 总结搜索结果功能至全球 100 多个市场,覆盖 10 亿月活用户

10 月 28 日,谷歌公司宣布在全球 100 多个国家和地区扩展 AI Overviews in Search 功能,覆盖全球 10 亿月活跃用户。AI Overviews 的核心目标是帮助用户发现来自出版商、企业和创作者的优质内容,自推出以来,AI Overviews 中增加了更显著的链接展示方式。在桌面版和移动端,用户可以通过右上角的网站图标访问相关网站,此外,新推出的内联链接(in-line link)也直接出现在 AI Overviews 的文本中,测试结果显示,这些更新有效提升了支持网站的流量。

谷歌公司于今年 5 月在美国启动 AI Overviews in Search 功能,并于今年 8 月扩展到部分美国以外的市场,该功能主要用于 AI 总结搜索结果,让用户找到更契合的搜索结果。谷歌还扩展了语言支持,目前支持英语、印地语、印尼语、日语、葡萄牙语和西班牙语等语言。(IT之家)

苹果最新系统更新!支持通话录音,全面支持 AI 写作

10 月 28 日,苹果公司正式推送了 iOS 18.1,该更新包括为 iPhone 16 和 iPhone 15 Pro 开发的人工智能 Apple Intelligence 。同时,苹果公司还发布了配置 M4 芯片和 Apple Intelligence 的新款 iMac ,新款 iMac 起售价为 10999 元人民币,配备 16GB 内存,将于 11 月 8 日上市。

iOS 18.1 的另一大亮点便是支持通话录音。拨打电话后点击左上角的录音按钮将启动录音,并通知所有参与者正在通话被录音。通话将保存到 Notes 应用程序中,并且 Notes 应用程序还能够生成转录。除此之外,Apple Intelligence 将使设备拥有“全系统范围内的 AI 写作助手”,包括邮件、备忘录、信息、Pages ,以及第三方应用。写作工具还会出现在操作系统中任何可以输入文本的地方,包括非苹果的应用程序。

外媒评价此次发布对于苹果来说是一个重要的里程碑,苹果寄希望于该功能的发布来推动新手机 iPhone 16 系列的销售。(潇湘晨报)

Linux 之父怒斥 AI 泡沫:90% 都是营销

在维也纳举行的开源峰会上,Linux 之父林纳斯·托瓦兹(Linus Torvalds)对当前人工智能行业的炒作现象表达了不满。他将 AI 行业的现状总结为“ 90% 是市场营销,只有 10% 是现实”。

Linus Torvalds 认为 AI 是一个有趣的领域,有潜力改变世界,但他对当前的炒作周期感到厌烦“我认为 AI 真的很有意思,它将改变世界。但同时,我非常讨厌这种炒作周期,以至于我真的不想参与其中。”他甚至表示,他目前对 AI 的态度基本上是“忽略它”,因为整个技术行业,尤其是 AI 领域,正处于一个非常糟糕的位置。

Linus Torvalds 还预测:“五年后,情况会有所改变,届时我们将看到 AI 在真实工作负载中的日常应用。”他提到,尽管 AI 在演示中看起来很有前景,如 ChatGPT,但在实际工作中的应用并不普遍,尤其是在图形设计等领域。(快科技)

不止是缺电?摩根大通:AI浪潮可能将带来“缺水”危机

10 月 28 日,摩根大通发布报告称,人工智能浪潮带来的危机可能不只是“缺电”,还有“缺水”,美国正面临严重的供水压力,这有可能损害美国的经济前景,并侵蚀企业估值。

摩根大通和可持续发展咨询公司 ERM发 布了一份题为《美国水资源韧性的未来》(The Future of water Resilience in US)的报告。该报告称,人工智能的蓬勃发展进一步加剧了美国水资源的紧张。这是因为,人工智能产业需要大量的水来冷却数据中心和半导体制造设备:一个大型数据中心每天可以使用多达 500 万加仑的水,这大致相当于一个多达 5 万人的城镇的每日用水量。除此之外,制造半导体芯片还需要数十亿加仑的水。

小摩的研究表明,人工智能的发展与气候变化的现实发生了冲突,其结果是,水资源需求激增与不太可靠的降水模式相冲突,可能会导致水资源短缺。摩根大通全球企业咨询主管、该报告的主要撰稿人拉玛•瓦里安卡瓦尔(Rama Variankaval)写道:“人工智能和数据中心正在加大规模,但也让这个问题受到了关注。”(财联社)

最新研究:生成式 AI 应用普及率上升,投资回报成效显现







请到「今天看啥」查看全文