本文介绍了科大讯飞在人工智能领域的应用和创新。从AI虚拟数字人、智能语音技术到工业AI传感仪器,科大讯飞不断拓展AI的应用边界,为各行业提供数字化转型的标杆项目。文章通过描述科大讯飞在科晚上的展示和演示,展示了AI在教育、工业安全、虚拟数字人等领域的创新成果和潜力。
科大讯飞通过不断创新和研发,在智能搜索、文生视频、日常聊天等领域取得了重要突破,拓展了人工智能的应用边界。
科大讯飞推出的AI虚拟数字人“AI张腾岳”通过深度学习技术实现了与真人主持人的高度相似,展示了人工智能在虚拟数字人领域的最新成果。
通过AI多模态理解技术,科大讯飞将智慧黑板与虚拟人辅教相结合,为教育行业提供了创新解决方案,助力实现五育并举。
科大讯飞打造的巡检机器狗“小汐”和AI声学成像仪等产品,具备精准检测泄漏、设备故障预警等功能,为工业安全领域带来革命性的变革。
科大讯飞凭借国家级技术背书、全球领先的多语种能力和成熟的产业生态,在多个行业成功打造数字化转型标杆项目,为行业转型升级注入新的活力。
从一行一业到千行百业,科大讯飞正以创新为驱动,不断拓展人工智能的应用边界。
2024年,是AI应用集中爆发的一年,智能搜索、文生视频、日常聊天,这些已经融入到了我们的日常生活、工作之中,让我们享受到了便利。
但对于起调颇高的AI,也不禁会有质疑,AI也不过如此。但如果说,现在的AI能够判断煤气是否泄漏,能够让爱因斯坦出现在课堂之上,亦能够让李白“亲自”朗诵诗词,这是否会让你感到诧异?
其实这些看似天马行空的事情,离我们已经越来越近。
在12月29日晚间,中央广播电视总台首届《中国科技创新盛典》(总台“科晚”)播出,这场“科技春晚”以“新质生产力”为核心关键词,汇聚了新质生产力代表性的新兴产业、科技企业。
其中科大讯飞董事长刘庆峰作为杰出代表出席了此次“科晚”,并且用一系列精彩的现场演示,展示了最新的人工智能技术应用成果,让更多人看到了人工智能是如何解放生产力,如何为我们的生活创造更多价值。
这次科晚上有这样一幕,舞台上突然出现了主持人张腾岳的“分身”,两个张腾岳同时出现的情形着实让观众为之震惊。
但其实这是由讯飞智作打造的 AI 虚拟数字人,不但能够与真人主持人神态自若地互动对话,更是以其出色的方言朗诵能力惊艳全场,带来了一场跨越语言与方言的精彩表演。
舞台上,AI张腾岳用陕西、广东、河南三地方言分别演绎了《静夜思》《望月怀远》《满江红》等经典诗词,字正腔圆、韵味十足,仿佛一位来自当地的文化传承者,将诗词中的情感与意境通过方言的独特魅力展现得淋漓尽致。
除了让人惊喜的语言能力外,“AI张腾岳” 在与真人主持人的互动以及自身的形象动作展现方面同样表现优秀。它能够神态自若地与主持人进行对话交流,准确理解对方的话语并迅速做出恰当回应,其流畅自然的程度让人几乎难以察觉这是一个虚拟的存在。
在形象上,“AI张腾岳” 可以说是1:1的精准复刻,再现了真实主持人张腾岳的声音、表情和动作,从细微的面部表情到肢体的一举一动,都与真人高度相似,具备自然的表情、流畅的动作和真实的声音表现。
据了解,AI张腾岳融合了科大讯飞先进的语音合成、语音识别、语义理解、唇形预测、图像处理等前沿人工智能技术。通过深度学习,精准还原了表情和动作,再加上先进的语音合成技术,使得“AI张腾岳”拥有逼真的表情、流畅的动作和生动的声音表现。
“AI张腾岳”的出现,也意味着虚拟数字人已经实现了从“形似”到“神似”的跨越。
而这令人眼前一亮的表演,也与科大讯飞深厚的多语种技术积累有关。今年,科大讯飞作为第一完成单位的“多语种智能语音关键技术及产业化”项目获得年度国家科技进步一等奖。这是深度学习引发全球人工智能浪潮以来,过去十年人工智能领域的首个国家科技进步一等奖,标志着中国在多语种AI技术领域已达到国际领先水平。
多年来,科大讯飞在多语种技术领域屡创佳绩:连续5届获得国际多通道语音分离识别比赛CHIME冠军;荣获世界互联网大会首届杰出贡献奖、创新突破奖;在国际声学场景及分类挑战赛、IEEE国际多媒体博览大会等多个语音识别竞赛中,斩获多项冠军。
其实在今年的科大讯飞全球1024开发者节上,科大讯飞便率先推出了超拟人数字人,不仅在口唇、表情、动作上更为灵活自然,在制作模式上,与传统的数字人需要依赖预先录制的模板动作不同,讯飞数字人仅需一张照片即可完成形象的定制,并且用户可以直接在讯飞智作平台上体验这一技术,减少了用户的操作路径和使用门槛与成本。
随着大模型赋能数字人的飞速发展,虚拟人应用也可以在日常生活中很直观的感受到,从营销到金融,从文旅到电商,越来越多虚拟人开始承担着导游、客服、主播等多元角色,出现在金融、文旅、媒体、政企等常见场景。
目前讯飞多场景虚拟数字人结合星火认知大模型的最新技术已经赋能多个领域,从国际赛事巴黎奥运会到非遗文化北京中轴线,从行业活动天津智博会到智慧展厅山东高速,都能看到其身影。而以AI虚拟人交互平台为代表的平台化产品,也已在央国企(企业数字化)、教育培训、文化旅游、电子商务、金融服务等多个行业领域内成功落地,其应用的广度与深度均在持续拓展之中。
未来随着企业、行业应用数字人的深入,对数字人的需求模式也在分层,而随着科大讯飞围绕数字人产品的商业模式和打法策略的更新,相信未来可以帮助更多个人及企业实现更智能、更创新、更可靠的一站式的数字人解决方案。
在本次科晚上,除了AI张腾岳的出现,刘庆峰还演示了AI在教育领域的能力。
舞台上,刘庆峰站在智慧黑板前做了一个画圆的动作,一个完美的圆形立即呈现在黑板上。随后,他随手画下一个能够360度旋转的立方体,让抽象的几何概念变得生动具体。
其实这利用到的便是AI多模态理解。基于科大讯飞自主研发的3D剖分与动态渲染引擎,直观呈现空间构图,进行图形分割,动态展示截面与立方体的空间变化,在不改变老师的书写习惯的同时,将抽象知识进行直观展示,培养学生数学建构能力。
需要注意的是,虚拟人也是这块智慧黑板的“灵魂”所在。
晚会现场,爱因斯坦、李白等虚拟形象出现在了智慧黑板上,主持人与现场观众也实现了与历史名人的“隔空对话”。
从本质上来看,虚拟人辅教便是典型的AI数字人应用。虚拟人可以与学生实时进行情景对话、语音评测,还支持启发式读写拓展;同时也可以实时回答学生的奇思妙问,激发学生的好奇心与求知欲。课下,虚拟人助教还可以带领学生进行课间活动,比如唱红歌、课桌操、古诗词朗诵等等,助力实现五育并举。
在教育领域,科大讯飞已为全国32个省级行政区的5万余所学校提供常态化应用。此次“科晚”展示的星火智慧黑板不仅获得全球智慧教育创新奖,更成功入选2024世界人工智能大会SAIL奖(Super AI Leader,卓越人工智能引领者)TOP30榜单,并作为“AI+教育”赛道唯一获奖者入选“人工智能+”议题6项最具代表性项目之一。
搭载声学成像仪的巡检机器狗“小汐”,也出现在了这次科晚舞台上,并且刘庆峰亲自展示了小汐在工业安全领域的可能性。
在工厂模拟场景中,刘庆峰邀请知名主持人张腾岳进行了一场寻找泄漏点的实验。面对一堵模拟的煤气管道和危险品运输管道墙,尽管张腾岳贴近管道、全神贯注地聆听,却仍未能察觉到任何异常声音。然而,小汐仅用了短短几秒钟就精准锁定了泄漏位置,展现出其在工厂安全巡检和设备故障预警中的巨大潜力,让全场观众惊叹不已。
小汐之所以有如此出色的排查能力,得益于讯飞潮汐力的工业AI声学成像仪,再融合高精度麦克风和超声波声源定位技术。通过声像图与可见光图像叠加的成像方式,实时展示声源的分布状态,迅速辨别出细微声音。
这一技术不仅可以在工业安全领域实现精准检测泄漏、进行设备故障预警;在环境监测方面还能定位噪音源、检测危险气体;在安防监控领域可识别异常声音、辅助应急救援;在智能巡检中能替代人工巡检、进行数据采集与分析。
除了“小汐”,科大讯飞还依托工业六感技术,打造了AI声学成像仪、AI工业内窥镜等一系列工业AI传感仪器。这些产品不仅入选了工信部智能检测装备创新产品目录(第一批)、2024水利部先进实用技术推广目录,还获得中国电科院科学技术一等奖等奖项。
在全球元宇宙和数字经济加速发展的背景下,通过人工智能的赋能,科大讯飞凭借国家级技术背书、全球领先的多语种能力和成熟的产业生态,在直播、服务、影视、教育、电力、制造等众多行业,成功打造了多个数字化转型标杆项目,为行业转型升级注入了新的活力。
从这次科晚我们也能看到,科大讯飞正以创新为驱动,不断拓展人工智能的应用边界。在未来,我们有理由相信,科大讯飞将继续引领科技潮流,为我们的生活、工作和社会发展带来更多的惊喜与变革,让人工智能真正成为推动人类进步的强大力量。