专栏名称: 高工智能汽车
高工智能平台旗下专注智能汽车产业链的市场研究、媒体会议和投融资服务。我们重点关注无人驾驶、车联网、车载交互等汽车智能化浪潮。我们提供企业战略定位、品牌营销、供应链对接、投融资等服务。
目录
相关文章推荐
NE时代新能源  ·  这场备受期待的电池大会为何您不能缺席? ·  2 天前  
蔚来  ·  有了它,人人都是旅拍达人 ·  1 周前  
电动汽车观察家  ·  增程式电动汽车:是辉煌顶点,还是刚刚启程? ·  6 天前  
51好读  ›  专栏  ›  高工智能汽车

毛利超70%、超70+智驾客户,这家AI数据训练服务商刚刚止亏

高工智能汽车  · 公众号  · 新能源汽车  · 2024-09-21 10:00

正文

AI训练数据服务第一股海天瑞声终于迎来了“曙光”。

日前,海天瑞声发布2024年半年报显示,上半年其实现营收9242.63万,同比增长24.13%;实现净利润41.64 万元,不过同比去年同期的亏损1724.14万元,扭亏为盈。

其在财报中解释,主要是因为报告期内整体营业收入增长的同时,标准化数据集产品收入占比也持续提升,同时训练数据定制服务的毛利率也同比显著增长,共同驱动公司整体毛利率增加至 70.34%,而在2023年,其业务整体毛利率显示为56.01%。

并且其还提到,2024年上半年,受益于大模型技术的快速发展以及应用领域不断拓展,以智能终端厂商为代表的科技巨头纷纷加大多模态数据投入,全球数据服务市场持续增长。另外相关法规出台,使得其境外业务大幅增长,拉动公司整体营业收入快速增长。

数据显示,2024 年上半年,海天瑞声的境外业务的收入达到4369.53万元,同比增长50.00%。

资料显示,海天瑞声作为我国领先的AI算法训练数据与解决方案提供商。其训练数据业务覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个AI核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。

其业务主要分为智能语音、计算机视觉、自然语言、训练数据相关的应用服务四大类,其中智能语音业务收入占比超过7成,其次是计算机视觉业务,占比约18%,另外两大业务占比相对较小。

在2024年上半年,四大业务中智能语音业务和自然语言收入均同比有所增长,其中主力业务智能语音业务收入增幅超过37%。

过去的几年间,海天瑞声的业绩一直显得较为艰难,包括智能语音、智能驾驶以及大模型等下游AI 应用行业的大规模商业化发展也呈现震荡趋势。

海天瑞声在2021年,也就是上市当年就发生了营收和净利润双双下跌;随后的2022年,其营收重新恢复增长并创下了2.6亿元的新高,同比增长27.32%,但净利润继续下滑,当年其实现净利润2945.41万元,同比下降6.81%

2023年再次出现营收和净利润双跌,净利润还出现大幅亏损。

2023年公司实现营业收入1.7亿元,较上年同期下降35.33%;归属于母公司所有者的净利润亏损了3038.52万元,较上年同期减少203.16%;归属于母公司所有者的扣除非经常性损益的净利润亏损达到4,347.07万元,较上年同期减少528.32%;经营性现金流净额-3,104.62万元,较上年同期下降201.26%。

在2023年年报中,几大板块的营收均处于下滑态势,这也导致了整体业绩的下滑明显。

不过,刚刚跨过盈亏衡点的海天瑞声,业绩能否进一步飘红还有待观察。

2022 年底 ChatGPT 的爆火,AI大模型开始席卷各大行业,一时间各互联网大厂、科技公司、初创企业等都在下场投入大模型,这也带动全球 AI 产业进入新一轮发展期。

以上趋势对海天瑞声来说,将对旗下智能语音、自然语言几块业务形成利好。其也在财报中表示,2024 年上半年,受益于大模型技术的快速发展以及应用领域不断拓展,以智能终端厂商为代表的科技巨头纷纷加大多模态数据投入,全球数据服务市场持续增长。

根据资料显示,海天瑞声的客户包括阿里巴巴、Meta、腾讯、百度、字节跳动、微软、三星等大型科技公司,另外还包括科大讯飞、商汤科技、云知声、海康威视等人工智能企业,以上公司基本上均在AI大模型领域有所部署。

不过观察当前市场情况,各大大模型企业自身的大模型业务的商业化模式还处于探索阶段,很明显,只有大模型应用的渗透率达到一定程度,并在各大应用场景中真正落地实现了商业价值,跑通了商业路径,大模型客户外购训练数据的需求才会明显增长。
这也意味着,数据供应商期待大模型产业拉动相关业务线高速增长,还需要待以时日。

并且,当前AI大模型还需要持续的高投入,这包括研发、人力和算力等各项高额投入也带来不小的压力,这从几家AI客户的业绩也可见一斑。

例如云从科技2024 年上半年营收1.21亿,同比减少26.35%;亏损 3.56亿。科大讯飞今年上半年净利润亏损4.01亿元;而商汤科技今年上半年总收入为人民币17.4亿元,同比增长21.4%,上半年净亏损24.77亿元,相比去年同期亏损收窄21.2%。来自下游应用端的压力,恐怕也会向上游供应链传导。

在大模型应用趋势下,同时也对训练数据业务也将带来新的变化和挑战。

例如大模型范式下的训练数据与传统深度学习训练数据处理方式存在显著差异,数据标注技术呈现“智能化”,大模型数据服务将更加依赖算法的参与等等。

另外,人工智能技术加速向各产业内深度渗透,对数据处理更加注重专业性,这需要构建面向垂直行业的数据资源等等。

这也意味着,海天瑞声这类AI训练数据供应商还需要持续在算法、平台工具升级、大模型数据处理等方面进行大笔的研投入,以及针对各大行业垂直领域进行资源投入等等。

海天瑞声方面也透露,公司将继续在大模型数据领域进行研发投入,在大模型领域的部署主要分为两部分:首先在研发数据生产中使用的大模型工具;其次也在积极打造大模型数据集的矩阵,主要包括通用大模型数据集和行业大模型数据集。在行业数据上,已经研发出汽车、金融、教育、医疗等行业大模型所需的高质量数据集。

例如2023年在公司亏损的情况下,海天瑞声的研发费用共计5849.09 万元,占当期营业收入的 34.40%。2023年其还计划募集资金6.67亿元用于“AI 大模型训练数据集建设项目”和“数据生产垂直大模型研发项目”。

此外,以智能驾驶场景作为核心的计算机视觉业务也被视作海天瑞声的第二增长曲线。

2023年4月,海天瑞声推出专为自动驾驶场景设计的全栈式数据标注平台“DOTS-AD自动驾驶数据平台”。官方资料显示,目前公司至今已服务超过70家智能驾驶领域客户。

2024年上半年,公司加大了对高级别数据标注工具的研发力度,截至6月底,DOTS-D平台新增 3D动静分离标注工具,BEV多图层 4D车道线标注工具,并升级点云分割工具支持连续帧叠加标注和4D分段加载等核心能力,有效支撑了自动驾驶 BEV和 OCC主流算法演进对数据标注工具的需求。

此外,公司开发了 2D-3D 融合的动静分离检测追踪算法,在点云连续帧融合产线实现提效 30%以上,迭代优化点云分割算法和地面检测算法,在点云分割产线实现提效 20%以上。

而为进一步支撑自主品牌车企的国际化战略,公司在全球范围内扩展了道路采集业务,可提供包括采集方案设计、采集人员组织、车队管理、车辆改装及数据清洗与脱敏等在内的全链条服务。

2024年上半年,公司采集业务已覆盖包括德国、西班牙、捷克等多个国家,为公司构建智能驾驶全球化数据服务能力奠定了基础。

在2022年财报中,其首次披露了智能驾驶业务收入情况:2022年,公司智能驾驶业务收入4174.51 万元,同比增长115.12%; 但在后续的2023年年报和2024年半年报中均未明确披露。不过其在2023年半年报中提到其智能驾驶业务收入同比增长178.96%。

不过2024年半年报中显示,根据合同分类来自计算机视觉业务的营收数据同比上一年同期的来看,呈现下滑趋势。