1.1. AI行业动态:
①海外方面
TUM等研究人员提出了一种全新算法NPGA,能够生成高保真3D头像(北京前沿国际人工智能研究院微信公众号)
来自德国慕尼黑工业大学、伦敦大学学院等研究团队提出了全新算法——NPGA,可生成高质量3D头像。采用了高斯点云的方式,即通过无数个点组成3D人像形状,让渲染更加高效、逼真。实验评估结果显示,NPGA比起之前SOTA模型,在自我重现任务中,大约有2.6PSNR提升。
团队使用了3DMM的改进版——NPHM(Neural Parametric Head Models,神经参数化头部模型),从多视角的图像序列中追踪并提取身份识别的隐向量z_id和表情代码z_exp。基于3DGS中的为每个基元定义的场景表示,作者额外添加了高斯特征。
Cohere最新开源Aya-23,支持23种语言(北京前沿国际人工智能研究院微信公众号)
LLM在过去几年中蓬勃发展,但该领域的大部分工作都是以英语为中心。为了解决上述问题,最近,加拿大的独角兽AI公司Cohere开源了两种尺寸(8B和35B)的多语言模型Aya23,其中Aya-23-35B在所有评估任务和涵盖的语言中取得了最好成绩。
覆盖的23种语言分别为阿拉伯语、中文(简体和繁体)、捷克语、荷兰语、英语、法语、德语、希腊语、希伯来语、印地语、印尼语、意大利语、日语、韩语、波斯语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、土耳其语、乌克兰语和越南语。
Cohere最初与来自 119 个国家的 3,000 多名独立研究人员一起创建了一个庞大的多语言指令数据集Aya Collection,包含5.13 亿个提示和补全样本。
APPLE与OpenAI
或已达成协议(北京前沿国际人工智能研究院微信公众号)
Apple 已与 OpenAI 达成协议,将由 OpenAI 为 iOS 18 提供 AI 聊天功能,此外,Apple 也在积极与 Google 进行协商,希望将 Gemini 作为另一项选择。Apple 与 OpenAI 的这一合作将在全球开发者大会(WWDC)上公布。苹果的全球开发者大会将于 6 月 10 日召开,届时 Apple 将发布 iOS 18 以及新的 iPad、Apple Watch,Vision Pro 和 Mac 软件的下一个主要版本。据悉,新的 iPhone 操作系统被内部人士视为该设备历史上最大规模的升级,而 Vision Pro 则是产品发布以来首次获得重大软件更新。
②国内方面:
智谱AI开源GLM-4-9B,性能超越Llama-3-8B(甲子发现微信公众号)
智谱AI发布了GLM-4-9B,这是智谱AI最新一代预训练模型GLM-4系列中的开源版本。GLM-4-9B包含四个版本:一个基础模型GLM-4-9B-8k,三个对话模型GLM-4-9B-Chat-128k、GLM-4-9B-Chat-1M、GLM-4V-9B-8k。
在最核心的预训练环节,GLM-4-9B几乎采用了互联网上所有的公开数据,并引入LLM筛选出了10T的高质量多语言数据,在9.4B稠密参数下引入FP8进行训练,没有采用牺牲显存的MoE架构。
性能表现上,在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B-Chat综合能力相比上一代的ChatGLM3-6B提升40%,全面超越Llama-3-8B-Instruct,中文学科能力提升50%。在多模态方面,智谱AI首次开源了基于GLM基座视觉模型GLM-4V-9B。通过语言与图像数据混合预训练,在提升多模态性能的同时,避免语言能力的灾难性遗忘。在中英文综合能力、感知推理、文字识别、图表理解等多方面多态评测中,GLM-4V-9B超越了GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max 和 Claude 3 Opus。
腾讯混元:开源模型生图时间缩短75%!(腾讯云微信公众号)
开源不到一个月,腾讯混元文生图大模型(混元DiT模型)的Github Star数已达到2.1k,位于开源社区热门DiT模型前列!同时腾讯混元针对文生图开源模型,发布一组「加速库」:实测显示,
加速后的生图时间缩短75%、生图速度提升4倍,大幅提升模型运行效率。这也是业内首个由官方推出的加速库。
具体来说,这款加速器叠了两套buff:一是,知识蒸馏。通过降低扩散模型迭代的步数实现加速(就像看学霸的笔记,跳过部分训练步骤,直接借鉴复杂模型的经验,掌握重点)。使用蒸馏权重后,生成同等质量的图像,迭代步数减半。二是,TensorRT推理加速。通过工程优化,减少冗余计算、合并层次、精简精度,让模型更快处理数据。而且,它还支持与模型权重解耦。
为了提升开源模型易用性,腾讯混元做了努力。现在,用户可以基于ComfyUI的图形化界面,使用腾讯混元文生图模型。此外,仅用三行代码,用户就能在Hugging Face的官方模型库Diffusers中调用混元DiT模型,无需下载原始代码库。
“中国版Sora”来了!仅需一张全身照,就可以原地“唱跳”,分辨率高达1080p!(每日经济新闻微信公众号)
据新华社,近日,快手“可灵”视频生成大模型官网正式上线。相较此前各家放出的视频大模型以展示视频为主,本次亮相的可灵大模型已在快手旗下的快影App开放邀测体验。
据官网介绍,快手在短视频技术方面有多年的深入积累,其视频生成大模型也有天然、广泛的应用场景。可灵大模型为快手AI团队自研,具备诸多优势:能够生成大幅度的合理运动;能够模拟物理世界特性;具备强大的概念组合能力和想象力;生成的视频分辨率高达1080p,时长高达2分钟(帧率30fps),且支持自由的宽高比。
据悉,可灵使用了与Sora一样的Diffusion Transformer架构,3D时空联合注意力机制等,该架构巧妙地融合了时间与空间的信息,对视频数据进行综合分析和处理。可精准捕捉到视频帧内的局部空间特征以及跨帧的时间动态特征,从而更全面地理解和再现视频中的运动信息。
所以,无论是快速移动的物体、剧烈变化的场景,还是复杂的人物动作都能被精确捕捉,使得生成的视频内容动态性十足,同时具有很高的物理世界真实感。
全球开源新王Qwen2-72B诞生,碾压Llama3-70B击败国产闭源模型!(新智元微信公众号)
Qwen2-72B终于发布了!这个模型一出世,直接杀进开源LLM排行榜第一,完全碾压美国最强的Llama3-70B。
在各大基准测试中,Qwen2-72B一举斩获了十几项世界冠军,尤其在代码和数学能力上提升最为明显。同时,相较于上一代Qwen1.5,Qwen2也实现了大幅的性能提升。另外,开源Qwen2-72B还击败了国内一众闭源大模型,包括文心4.0、豆包Pro、混元Pro等等。
72B指令微调版模型,还增大了上下文长度支持,最高可达128k token。在16个基准测试中,Qwen2-72B-Instruct的性能可与Llama-3-70B-Instruct相匹敌。得益于高质量的数据,Qwen2-72B-Instruct在数学、代码能力上实现飞升。
差不多4个月时间,阿里团队就完成从Qwen1.5到Qwen2跨越式的迭代升级。除了Qwen2-72B,Qwen2系列包含了5种不同参数规模的预训练和指令微调模型。其中还有,Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B,都可支持32K上下文。
安全性方面,大模型在四种多语言不安全查询类别(非法活动、欺诈、色情、隐私暴力)中生成有害响应的比例。通过显著性检验(P值),看得出Qwen2-72B-Instruct模型在安全性方面,与GPT-4的表现相当,并且显著优于Mistral-8x22B模型。
阿里云持续开源自研模型,牵头建设中国最大的AI开源社区魔搭,正是为了推动AI应用门槛的降低。如今,大模型应用创新的奇点还没有到来。
当大模型的大部分潜力被真正挖掘出来,当越来越多开发者和企业结合自己需求,促进大模型的发展和应用,届时必将发生天翻地覆的变化。
1.2. 卫星行业动态:
“超重-星舰”第四次综合飞行测试情况简析(中国航天微信公众号)
美国东部时间2024年6月6日上午8:50(北京时间2024年6月6日20:50)SpaceX在德克萨斯州星基地的轨道发射台A利用超重B11和星舰S29原型机进行了超重-星舰的第四次综合飞行测试(IFT-4)。尽管助推级在上升过程和返回过程中各有1台发动机异常,星舰飞船级防热瓦仍然有脱落现象,前襟翼在返回过程中部分被烧穿,但
成功进行了级间分离、热分离适配器分离,两级分别成功返回海上实现受控溅落。
同时,
飞行过程中持续接收到传回的数据信号,使SpaceX获得了大量有用数据,该试验结果符合SpaceX预期,标志着超重-星舰的研制实现了又一个新的重要里程碑。
(一)近期计划
马斯克计划,如果此次实现了超重助推级在海上的精准软着陆,那么将在超重-星舰的第五次综合飞行试验(IFT-5)中尝试让超重助推级返回并降落在发射塔上。马斯克乐观地认为,2024年实现超重助推级返回发射塔的几率可能是80%到90%,届时将使用发射塔上一对被称为“机械哥斯拉”的巨大机械臂来支撑超重助推级。而回收星舰飞船级将需要更长的时间,飞船级将至少连续2次成功受控海上溅落后,才会尝试在星基地着陆。因此,预计星舰飞船级的回收可能在2025年。SpaceX还计划在2025年演示船对船的在轨推进剂转移,对未来的载人月球着陆任务至关重要。
SpaceX正在努力加快超重-星舰的生产节奏,朝着每天生产一艘飞船的长期目标迈进。为满足高速发展需求,SpaceX加快建设超重-星舰地面设施,在星基地建造第二座星舰发射塔的同时,推进卡纳维拉尔角的另一星舰发射台的建设,卡纳维拉尔角星舰发射台有望在2025年年中建成。未来,星基地将主要承担超重-星舰的开发和测试,而大部分的发射将在卡纳维拉尔角进行。
(二)远期规划
2024年4月,马斯克公布了超重-星舰和猛禽发动机的远期规划。目前的试验型为第一代超重-星舰(超重-星舰V1)。第二代超重-星舰(超重-星舰V2)具备完全重复使用能力,箭体长度较V1增加约3米,在重复使用状态下将能够携带超过100吨的物体进入轨道。通过升级改进后,最终的第三代超重-星舰(超重-星舰V3)在完全重复使用状态下运载能力可达到200吨,在一次性使用时可达到400吨。箭体长度将增加20~30米,推力增加至10000吨。
目前使用的猛禽发动机为第二代猛禽(猛禽V2),而SpaceX也将继续对其进行升级改进,未来的猛禽V3最终将能达到海平面推力280吨,真空推力306吨,同时它还具有更加简化和紧凑的设计,允许超重助推级省去发动机护罩。
1.3.
光通信行业动态:
美国电信公司Frontier拟筹集7.5亿美元用于光纤扩张(光电通信微信公众号)
美国电信公司Frontier计划筹集7.5亿美元,并利用这笔资金偿还债务、投资光纤基础设施和铜线迁移等。
Frontier表示,这些资金将由Frontier在北德克萨斯州的某些光纤资产和相关客户合同担保。去年7月,Frontier以达拉斯地区的光纤资产和客户合同为担保,发行了约10.5亿美元的债务。这个数字后来被提高到16亿美元。
这些资金将用于资助Frontier公司在1000万个地点铺设光纤的计划。Frontier在2024年第一季度增加了约32.2万光纤覆盖数,将总数扩大到680万,比其目标高出68%。该公司预计,2024年全年,其光纤家庭覆盖数将增加130万。
此外,该公司还在进行正式审查,探索多种选择,包括优化运营和财务状况,探索战略合作伙伴关系、合资企业、资产剥离、合并和其他业务组合。
谷歌将投资10亿美元 通过两条海底电缆改善美日数字化连接(光电通信微信公众号)
近日,美国科技巨头谷歌宣布将投资约10亿美元,通过支持建设Proa和Taihei两条全新的海底电缆改善美国和日本之间的数字化连接。
据悉,谷歌将与几家合作伙伴进行合作,其中包括KDDI、Arteria Networks、Citadel Pacific以及北马里亚纳群岛联邦(CNMI)。这些海底电缆是扩大太平洋连接计划的一部分,将在美国大陆和日本之间建立新的光纤线路,以支持谷歌的日本数字化市场计划。据该公司称,此举还将提高美国、日本和一些太平洋岛屿国家和地区之间数字化连接模式的可靠性。
有资料显示,Proa海底电缆将连接美国、日本、CNMI和关岛,而Taihei海底电缆将连接美国、日本和夏威夷。谷歌还将出资支持建设连接夏威夷、CNMI和关岛的大型互联电缆。美国和日本在一份联合声明中表示:“在去年10月美国和澳大利亚共同资助海底电缆计划的基础上,美国和日本计划与志同道合的伙伴合作,建立可信的、更有弹性的网络,并打算为太平洋地区提供海底电缆给予资金支持”。
1.4. 智能网联汽车行业动态
智能网联汽车重磅!九个汽车企业联合体入选试点(C114微信公众号)
据工业和信息化部官网6月4日公告,按照《关于开展智能网联汽车准入和上路通行试点工作的通知》有关工作安排,经汽车生产企业和使用主体组成联合体自愿申报、车辆拟运行城市人民政府同意、所在地省级主管部门审核推荐,工业和信息化部、公安部、住房城乡建设部、交通运输部(以下统称“四部门”)组织专家对首次集中申报的方案进行了初审和择优评审,研究确定了九个进入试点的联合体。
公告显示,下一步,四部门将按照试点总体要求和工作目标有序推进试点实施,并基于试点实证积累管理经验,支撑相关法律法规、技术标准制修订,加快健全完善智能网联汽车生产准入和道路交通安全管理体系,推动我国智能网联新能源汽车产业高质量发展。
官方解读称,试点的组织实施共分为五个阶段,分别是试点申报、产品准入试点、上路通行试点、试点暂停与退出、评估调整。当前,只是完成试点申报阶段的遴选,并不代表具有自动驾驶功能的智能网联汽车取得准入许可或允许上路通行。接下来,四部门将指导进入试点的联合体开展试点实施工作。