从网络音频产业的实践看,网络音频平台在内容生产、分化营销和互动传播等方面不断进行创新和升级,从最初的用户自发、制作简陋的 UGC 生产阶段逐渐过渡到专业化、精品化的 PGC 生产阶段,随着生成式人工智能的横空出世,生成式人工智能得益于硬件性能、预先训练模型和多模态交互技术的持续优化与革新。目前已经被广泛应用于网络音频产业的生产、分发、营销、盈利等各个环节,引发了网络音频产业又一轮新的变革。
1.1 生成式 AI 助力内容生产提质增量
2022 年喜马拉雅实现了首次千万级的季度盈利,与此同时,荔枝 FM 在 2023 年发布的 2022 年度财报中披露,该公司全年的收入增长到了 21.85 亿元人民币,净利润为 8650 万元,这也是荔枝首次实现全年盈利。这两家网络音频平台的成功盈利,为在线音频行业注入了新的活力,使得该领域的关注度和热度再次上升。
目前,AI 语音识别和 AI 语音合成在音频制作中逐步成熟,大大促进音频内容生产新形式的发展和内容生产的效率。在技术创新上,喜马拉雅于 2023 年投入研发费用 9.3 亿,占总营收的 15.1%,其技术和研发团队占员工总数的 44.3%,同时为了应对数字化浪潮的挑战。其专门成立“珠峰实验室”,研发“珠峰音频 AI 模型”。促使其内容生产模式从 PGC、UGC 向AIGC 延伸,并且已将自动语音识别技术、语音合成技术等,广泛应用于评书、新闻、小说等内容制作中。具体来看,通过 AI 合成音、AI 演播的方式生产数千本、数万本有声书,可以替代真人朗读,带来平台成本投入的减少,以及利用 AI 技术为创作者提供更具效率的生产工具,也能让内容生态的运转效率提高,从根本上降低经营成本。喜马拉雅 CTO 姜杰表示,喜马拉雅在技术的创新和应用中很重视观察人和 AI 交互协同能产生什么全新的价值增量。音频内容呈现更智能化的趋势背后,将是 AIGC 对于喜马拉雅原有的UGC+PGC+PUGC 的音频生态的进一步丰富。
相比于机器人来说,个体之间因为不同的性格、际遇、生活环境造就个体之间的不可复制性,优质的音频内容生产被消费者所喜爱一定程度上也是因为其独特性。例如我国著名评书艺术表演家单田芳老师,十分擅长用声音塑造角色,单老标志性的“云遮月”嗓音成为独一无二的内容符号,在民间甚至留下了“凡有井水处,皆听单田芳”的说法。单式评书是中国非物质文化遗产,拥有庞大的粉丝群体,是一个大IP,为了复刻单田芳的评书风格,喜马拉雅智能语音实验室利用 TTS 技术将单田芳先生的声音解码,并为其设计了单独的韵律提取模块,最后结合 HITTS 技术框架,让单老的 AI 合成音仿佛本尊再现,使受众享受到更多单田芳先生的优秀作品。目前喜马拉雅上已有近百部运用单田芳先生 AI 合成音制作的专辑,这些专辑受到用户的追捧,部分评书专辑长期霸榜喜马拉雅相声评书热榜前列,其中《蜀山剑侠传》《解密开国将帅传奇故事》《民国四大家族》的播放量均超 500 万。
AIGC 作为一种新的内容生产模式,可以实现以十分之一的成本,以百倍千倍的生产速度去生产 AI 原创内容,例如喜马拉雅原创 TTS 音色“喜晓峰”“枪枪”已被应用于《听秦说》《36 氪·氪金大事件》等财经专辑内容中。其中,“秦朔朋友圈”账号下《听秦说》专辑在使用喜马拉雅 TTS 技术后从每周一更轻松实现每日一更,同时专辑的播放量和互动数据都显著提升。AIGC 不仅助力喜马拉雅内容创作者实现内容生产的提质增效,推动创作者布局音频生产,实现网络音频产业的升级转型,也为用户带来更加丰富的体验。
1.2 生成式 AI 赋能平台内容精准分发
《中国网络视听发展研究报告(2024)》显示,喜马拉雅系用户渗透率为 77.8%、蜻蜓 FM+ 猫耳 FM用户渗透率为 9.3%。喜马拉雅在网络音频行业占据着第一梯队的地位。[5] 在网络音频产业中,内容生态和付费用户数量是支撑企业发展的基础,喜马拉雅在用户渗透率之所以能够在同行业中遥遥领先,其背后的智能推荐机制功不可没。喜马拉雅通过其独有的生成式 AI 模型和大数据技术对用户数据进行深度数据挖掘与分析,开发了一套依托于人工智能的内容推荐和发现系统,同时构建用户智能标签体系。这些技术的运用显著提升了内容推送的精准度与高效率,并优化用户在使用平台时的整体体验。因此,在同行业的其他竞争者中,喜马拉雅凭借这一显著优势脱颖而出,构筑了市场竞争力。
喜马拉雅的核心竞争力之一是能够根据用户的偏好和习惯智能推荐个性化内容。这种个性化推荐系统是利用机器学习和生成式人工智能技术,喜马拉雅的AI 智能推荐系统通过收集用户的收听历史、搜索记录、点赞和分享行为等数据,构建用户画像,同时结合用户的活跃时间段和兴趣标签为用户推送内容,该系统还具备协同过滤技术,通过分析具有相似偏好的其他用户的收听内容,为当前用户推荐可能感兴趣的内容。在用户收到系统分发的内容后,通过对用户收听行为进行分析,用户对推荐内容的互动行为(如跳过、回听)会被用作实时调整推荐算法的依据,推荐系统会不断优化算法,调整推荐逻辑,以应对用户偏好的变化和新内容的加入。最终,所有技术的运用都指向提升用户体验,喜马拉雅通过智能推荐系统增强用户的使用黏性,提高用户满意度和留存率。
并且为了使 AI 智能系统推荐的内容可以被受众收听,喜马拉雅的“珠峰音频 AI 模型”结合语音信号处理技术(SSP),在长音频领域创新性地引入了 AI 智能音效功能。该平台已经发布了三种专属音效模式,分别是“超重低音”“剧院混响”“清澈人声”,这些音效被设计来满足不同用户对音效的个性化需求,并增强各类音频内容的听觉效果,以达到系统推送的内容被用户收听的效果。
喜马拉雅计划在未来不断完善 AI 智能推送系统,以进一步提升用户体验和平台的个性化服务能力。不断对现有算法进行深度优化,使其能够更细致地捕捉用户的即时需求和长期偏好。同时喜马拉雅将加强内容分析能力,通过自然语言处理和深度学习技术,更准确地理解音频内容的深层含义和用户的情感反应,以期在网络音频产业的激烈竞争中保持领先地位。
1.3 生成式 AI 促进优质产品定向营销
人工智能技术的快速发展,尤其是可解释人工智能、机器学习、大语言模型、多智能体系统等生成式人工智能技术的兴起,正在深刻影响和重塑着网络音频产业营销的理念、模式和实践。生成式人工智能可以优化广告创意和营销文案,从营销目标、竞品分析、营销场景、用户需求等维度自动生成营销文案和广告,提高产品的转化率和投资回报率,同时根据面向的平台、媒体、场景调整广告文案的风格和样式,以适应不同的传播环境。
如何使音频讲好故事,提高用户黏性和产品转化率,一直是喜马拉雅着力攻克的课题。传统的营销广告如开屏广告、贴片广告,虽曝光度高,但是用户更加倾向跳过广告,而音频广告的最大优势便是它的伴随性和独占性。为了构建独特的营销场景和营销模式,喜马拉雅致力于汽车品牌的跨界合作,围绕五菱汽车创新自研 LingOS 灵犀系统特性,使用生成式 AI 技术适配系统,以海量优质音频内容为载体,为车主量身定制喜马拉雅五菱专属电台,实现“车-人-生活”数据高效智能融合,无缝覆盖车主出行、娱乐、社交、用车全场景。此外,喜马拉雅还通过 AI 技术和深度学习方法,在基础音轨阶段就呈现出优质效果,为用户带来更加自然、真实的听觉感受。
生成式人工智能对产品营销的赋能在耳朵经济中崭露头角,许多网文作品在喜马拉雅 AI 音色的加持下等到了翻红的机会,黑岩网旗下的网文作品《捡漏》由于版权原因长期“束之高阁”,喜马拉雅使用了四位 AI 音色——喜小道、喜小迪、喜小玖和苏小刀完成了这部 AIGC 有声书的内容制作。用户可以根据自己的需求选择声音播讲这部有声书,同时这部作品上线喜马拉雅“免费畅听”专区,受到了广大听众的追捧,这部经典作品在 AI 的加持下得到了重新的展现和推荐,平台累计播放量已突破 1.1 亿。目前,生成式 AI已经在其内容生产、产品营销等各方面发挥着重要作用,平台移动端平均月活跃用户的生成式 AI 渗透率已达 14.8%。
通过生成式 AI,喜马拉雅能够为用户提供更加丰富和个性化的音频内容,并且准确识别具有独特特征的细分市场,并为这些市场定制个性化内容,提高营销的针对性和效果,拓宽了营销的触点。同时借助生成式人工智能,喜马拉雅不仅提升了自身的营销效率和效果,而且为用户提供了更加沉浸式和定制化的音频体验,同时也推动了音频行业的创新和发展。
1.4 生成式 AI 提升付费群体用户黏性
随着音频传输质量的提升、智能化互动的不断深化以及应用场景的持续扩展,在线音频内容消费时长伴随着技术升级正在加速驶入发展快车道。根据 2024 年4 月 12 日喜马拉雅在港交所更新的招股书显示,2021—2023 年喜马拉雅经调整净利为 -7.18 亿元、-2.96 亿元、2.24 亿元,平均月活跃付费用户分别约为 1490 万、1570万和 1580 万,移动端付费用户 2021 年至 2023 年的付费率分别为 12.9%、12.9% 和 11.9%,日活用户收听时长也从 2021 年的 144 分钟降到了 2023 年的 130 分钟。虽然连年亏损的喜马拉雅扭亏为盈,但是在月活用户、付费用户和使用时间,这三个音频产业最关键的运营指标上,喜马拉雅都出现不同程度的放缓或下降。作为在线音频平台,最主要的收入来源便是付费群体的消费,因此如何提高付费群体的活跃时长和挖掘潜在
客户的消费潜力成了网络音频平台思考的头等大事。
老牌网络音频产业的商业想象力已经接近匮乏,亟须找到新增长点。于是它们盯上了这两年最火热的项目:生成式人工智能。在 AIGC 浪潮下,2024 年初喜马拉雅旗下的 AIGC 平台喜韵音坊升级为一体化创作者工具品牌“音剪”,使用者也从 2022 年的 1.8 万人增加至 3.1 万人。音剪平台为创作者提供了 89 种 AI音色,无论是初出茅庐的音频剪辑新手,还是经验老到的平台主播,都可以根据自己的需求选择合适的 AI音色进行创作。同时音剪内置的 AI 模型可以根据创作者提供的音频素材一键完成问题检测、文字剪辑和智能包装,简化创作者的工作流程,提高创作者的创作热情。以及音剪上线的 AI 文稿功能,可以有效识别无文稿音频内容,根据上下文内容自动生成文稿;对于已有原始文稿的音频内容,则采用音频文稿对齐技术,将声音和文稿进行时间戳对轨,从而在声音播放的同时,实现对应文字同步高亮,做到声字同步,让用户能更便捷地享受边听边看的内容消费体验。这不仅有利于增强用户黏性,还可以进一步拓宽喜马拉雅的多元化使用场景。
2024 年 4 月 22 日喜马拉雅发布的《2024 春季有声阅读数据报告》显示,16.77% 喜马拉雅高黏度优质付费用户为订阅儿童 VIP 的会员人群,这反映出有声阅读正日益成为助力儿童教育的重要方式。同时根据其后台数据显示喜马拉雅三分之一的用户为育儿用户,并且高黏度优质付费用户中,已育用户占比高于全站,81.5% 已育高黏度优质付费用户的孩子年龄集中在 3-10 岁。[6] 因此喜马拉雅借助研发的“珠峰音频AI 模型”,家长可以将自己的声音嵌入喜马拉雅儿童故事库,其只需要简单地录制 5 段音频文本,系统将会对这些文本进行分析、训练,从而定制个性化音频内容,成功后即可在“爸妈讲故事”页面或支持 AI 转音的专辑中播放自己的声音,从而为亲子共读提供更个性化的体验,提高付费群体的消费意愿。