专栏名称: 人工智能与大数据技术
分享大数据、云计算、人工智能等高科技先进技术
目录
相关文章推荐
玉树芝兰  ·  从笔记到第二大脑:Flowith 2.0 ... ·  4 天前  
CDA数据分析师  ·  【行业分析】2025年,干什么能赚钱? ·  6 天前  
51好读  ›  专栏  ›  人工智能与大数据技术

程序员出身的 AI 短片导演,用三个月拿下国际电影节的金奖;中国 AI 人才缺口将达到 400 万;AI 辅助编程的真相

人工智能与大数据技术  · 公众号  · 大数据  · 2025-01-10 11:30

正文

0、程序员出身的 AI 短片导演,用三个月拿下国际电影节的金奖


这是一个在独立电影界有影响力的国际短片电影节,不是专为 AI 作品而设,所以对 Jim 来说意义非凡,「能让评委忽略 AI 标签,关注故事本身,这让我感到欣慰」。(爱范儿)


1、中国 AI 人才缺口将达到 400 万


近日,麦肯锡发布《生成式人工智能的经济潜力》的研究报告。


报告显示,到 2030 年,中国对 AI 专业人才的需求预计将达到 600 万,而人才缺口可能高达 400 万。


麦肯锡表示,人工智能代理(AI Agents)的广泛应用将成为缓解这一压力的关键。这些智能代理不仅能够承担重复性高、劳动强度大的任务,从而释放人类员工的时间和精力,让他们能够专注于更具创造性和策略性的工作,还将促进职场角色的重新定义和技能的升级。


根据麦肯锡的研究,AI 取代人类工作的时间比此前预测提前了 10 年。报告认为,在 2030 年至 2060 年间(中点为2045年),50% 的职业将逐步被 AI 取代。这一变革将重塑劳动力市场,并对全球经济结构产生深远影响。


此外,全球四大会计事务所之一的普华永道认为,2025 年 AI Agents 能将现有劳动力扩充 1 倍以上。


2、AI 辅助编程的真相


这才是 AI 辅助编程的真相:“作为一名非专业工程师,以下是我对使用 AI 编程的真实感受:


它能帮你完成 70% 的工作,但最后 30% 令人非常沮丧。每前进一步,就会因为新的 bug 和问题而后退两步。如果我知道代码是如何运作的,也许

我自己就能修复这些问题。但由于我不懂,我开始怀疑自己是否真的学到了什么。”(微博 宝玉 xp)


3、CRM系统提供商Salesforce停止招聘工程师,AI提高了30%的生产力


全球知名的客户关系管理系统 (CRM) 提供商赛富时 (Salesforce) 首席执行官马克・贝尼奥夫 (Marc Benioff) 日前在接受采访时透露,该公司不会在 2025 年全年招聘任何新的软件工程师,因为 AI 提高了 30% 的生产力。

CEO 称 AI 技术让工程团队的速度大幅度提升,后续要考虑的是招聘更多销售人员向客户解释该公司 AI 技术实现的确切价值。为此赛富时计划在短期内再招聘 1000~2000 名销售人员。


据悉,2023~2024 年赛富时已经进行过两次裁员。在 2023 年 1 月赛富时裁员 7,000 人,占公司总员工数的 10%;在 2024 年 1 月赛富时裁员 700 人,占公司员工总数的 1%,目前赛富时在全球仍然还有 70,000 名员工。当时赛富时给出的裁员理由是之前招募太多员工,也就是大流行期间企业需求量大幅度增加,而在大流行结束后需求减少赛富时也只能跟着裁员应对。(新浪新闻)


4、通义万相登顶权威榜单,并全面开放



1 月 9 日,阿里云通义万相迎来重磅升级,推出万相 2.1 视频生成模型,在大幅度复杂运动、物理规律遵循、艺术表现等方面全面提升。


根据权威评测榜单 VBench 的信息显示,新版通义万相登上榜首位置,超越混元、海螺 AI、Gen3、Pika 等国内外视频生成模型。具体项目中,通义万相在运动幅度、多对象生成、空间关系等关键能力上拿下最高分,并以总分84.7%的成绩斩获第一。


据官方介绍,通义万相团队采用自研高效的 VAE 和 DiT 架构,有效增强时空上下文关系建模能力,解决了精准理解和模拟物理世界这两大难题。


此外,通义万相在文字视频生成上实现了突破,成为首个支持中文文字生成能力、且同时支持中英文文字特效生成的视频生成模型。


5、微软开源 14B 参数小语言 AI 模型 Phi-4


近日,微软在 Hugging Face 平台上开源小语言模型 Phi-4。


据微软官方称,得益于更优质的训练数据,这款模型相比其前代产品在多个方面都有所提升,尤其在数学问题解决能力上表现出色。据悉,Phi-4 拥有 140 亿参数规模,虽然其参数数量仅为前沿大型语言模型(LLM)的一小部分,但在数学能力基准测试中, Phi-4 的表现却优于参数多五倍的 LLM,这也意味着 Phi-4 的运行成本更低,效率更高。


微软 Phi-4 模型发布于 2024 年 12 月。据官方介绍,除了传统的语言处理外,Phi-4 还擅长数学等领域的复杂推理。同时 Phi-4 也是 Phi 系列小型语言模型的最新成员,官方表示其展示了微软继续探索 SLM 边界的可能性。


目前微软已在 Hugging Face 平台上开源 Phi-4。


6、科学大模型:“上线” 之路还有多远


“科学大模型或许可以引发科研范式和方法上的革命。” 北京智源人工智能研究院(以下简称 “智源研究院”)院长王仲远告诉记者,科学大模型作为一种新兴工具,目前尚未在高校、科研院所以及企业进行大范围应用,除了技术层面的原因,其推广还面临诸多挑战。(科技日报)


7、马斯克旗下Grok将推出无拘束模式,类似“一位仍在学习技艺的业余单口喜剧演员的表现”

去年 4 月,亿万富翁埃隆・马斯克(Elon Musk)曾预告其旗下社交平台 X 的人工智能聊天机器人 Grok 将推出一种神秘的“无拘束模式”(Unhinged Mode)。近一年后,Grok 背后的开发公司 xAI 在其官方网站更新了常见问题解答(FAQ)页面,进一步解释了这一新模式的功能。

根据 FAQ 页面的描述,Grok 在“无拘束模式”下将提供“可能令人反感、不恰当甚至冒犯性”的回答,类似于“一位仍在学习技艺的业余单口喜剧演员的表现”。目前,这一模式似乎尚未正式上线。

“无拘束模式”可能是马斯克为实现 Grok 最初愿景而采取的最新举措。大约两年前,马斯克在宣布推出 Grok 时,将其定位为一款“尖锐、无过滤且反‘觉醒文化’”(anti-woke)的聊天机器人,声称其愿意回答其他 AI 系统回避的争议性问题。马斯克的部分承诺已经得到兑现,例如,当被要求使用粗俗语言时,Grok 会欣然照办,输出一些用户无法在 ChatGPT 中听到的脏话和不文雅的表达。(IT之家)


8、上海推进 “人工智能+” 行动


上海市首批 “模塑申城” 行业应用示范基地,将推动 “人工智能 +” 在金融、制造、教育、医疗、文旅、城市治理等重点行业的应用落地,带动上下游协同创新,共促产业生态发展。(人民日报)


 9、VLC 预览本地 AI 字幕翻译功能


下载量逾 60 亿次的开源多媒体软件 VLC 在 CES 上演示了本地 AI 字幕翻译功能。该功能利用了本地运行的开源大模型,能为任何视频自动生成实时字幕,然后翻译成多种语言,无需联网或使用云端服务。开发 VLC 的非盈利组织 VideoLAN 总裁 Jean-Baptiste Kempf 称,即使在流媒体时代,VLC 的活跃用户数量仍然在增长。

10、马斯克:2026 年将生产 5 万到 10 万台人形机器人

近日,马斯克与 Stagwell 董事会主席 Mark Penn 的直播访谈中,提到 2026 年旗下机器人业务 Optimus 的产量将增加 10 倍。

马斯克在访谈中提到,特斯拉的 Optimus 人形机器人将成为人类历史上最具影响力的产品之一,同时他指出,如果一切顺利,2026 年 Optimus 的产量将增加 10 倍,其目标是生产 5 万到 10 万个机器人,此后在 2027 年再将产量增加 10 倍。

马斯克透露,Optimus 预计将在今年年底前进行小规模生产,主要用于特斯拉内部使用,而对外销售可能从 2026 年开始。同时他提到其价格预计在 2 万至 3 万美元之间。

访谈中,马斯克还表示,现实世界中用于训练 AI 模型的数据已经所剩无几,合成数据是未来 AI 发展的解决方案。他解释称,补充现实世界数据的唯一途径就是通过合成数据,即为让 AI 自己生成训练数据。AI 从而进行自我评估,并通过此过程去不断进行自我学习、自我优化。

据悉,马斯克所表达的言论,与前 OpenAI 首席科学家 Ilya Sutskever 在 2024 年 12 月的 NeurIPS 会议上的观点类似。Ilya Sutskever 曾表示,AI 行业已经达到了所谓的「数据峰值」,并预测未来将缺乏足够的训练数据,预训练的时代也将会逐步结束。