专栏名称: 果壳
果壳网(Guokr.com)是开放、多元的泛科技兴趣社区。
51好读  ›  专栏  ›  果壳

网易云年度报告被吐槽不准,算法忽略了一个关键内容

果壳  · 公众号  · 科学  · 2024-12-31 12:00

正文

以下文章来源于爱范儿 ,作者发现明日产品的

你我的年度之歌。


又到了甩出经典梗图的时节了:



哦不,错了,应该是这张:



嘲讽归嘲讽,但又怎么样,没人能阻止每年网易云每年发年度总结时候,大家一边滑手机一边截图,然后第一时间发朋友圈。


不过,今年网易云年度报告出来没多久,社交媒体上就出现了“年度听歌报告数据不准确”的话题。



有不少陌生歌手和听歌记录出现,网友们怀疑,这是因为网易云暗中拿用户账号去刷数据了,到了年末统计中露出了马脚。


这顶多是一些统计方法和口径需要澄清,而之前 Spotify 的大翻车,才真是把莫名其妙的内容硬塞给用户。


我的歌单,轮不到 AI 来指手画脚


Spotify 在 12 月初,就推出了自家的年度音乐报告,收获了一片差评。主要集中在,总结内容是由 AI 生成的,出现了很多奇奇怪怪的条目和总结。



Spotify 的翻车主要赖 AI。受到先前大幅裁员的影响,今年的 Spotify Wrapped 可能是 AI 含量最高的一年:除了常规的图文,还创建了一期由 NotebookLM 生成的播客节目,来讲述用户的收听数据,以及分析背后的收听习惯。



Google 那边,对这个合作评价很高,“根据数百万个人一年中特定的收听习惯,为他们定制播客,这可不是真人能做到的”公关在新闻发布会上表示。


实际上网易云在 2023 年,也浅浅尝试过人声播报,但只有一个很短暂的开头。说白了,用户听了什么样的音乐,自己心里是清楚的,轮不到 AI 来指手画脚。


而且实际效果呢,也差强人意。用户们都不买账,认为这总结根本是不知所云,完全踩不到点子上。



Business Insider 采访了一位曾经就在 Wrapped 团队的前工程师,他目前就职于一家人工智能的初创公司,并不反感 AI,但他认为 Spotify 没搞清楚重点:“公司过于依赖对生活没有任何实际意义的人工智能。”他对 Business Insider 说。


年度总结,很不好做


无论是用的是哪家产品,一年来,手机上播放过的音乐数不胜数。每一首歌都可能和一段回忆相关。


只是三百多天过去,记忆也不再清晰了。而年度报告能够把这些听过的歌曲,重新翻出来摆在台面上,再次看到这些曲目、歌手时,便能勾连起与之相关的生活记忆。这就是年度报告的价值。


因此,每每到了年底,相当多人对年度报告听歌报告,称得上是翘首以盼。而摆在策划面前的头号难题是:什么时候发?


今年网易云属于比较晚的梯队,Spotify、Apple Music 赶在月初,是因为国外以圣诞节为重,尚可以理解。可是 QQ 音乐今年在 20 号就推出了年度总结,随后 B 站、播客平台小宇宙也都陆续发布了总结,这就让局面焦灼起来。



时机的选择很微妙:太早了收录不了 12 月的数据,太晚了随着跨年和元旦的到来,会丢掉讨论度。


其次是具体内容的设计。年度报告有着非常强的社交属性:我库库对着报告一通截图是为什么,就是为了发社交媒体啊。“懂生活的人,已经开始运作自己的网易云歌单了”。



因此内容的设计成了最考验的一环。这也是 Spotify 翻车最重要的原因:想要借助大语言模型,生成一些有趣的风格标签,想法是不错,实测一塌糊涂。


很多 Spotify 用户在自己的年度总结里,看到了一个叫“Pink Pilates Princess Vogue Pop”的风格类型,看得人一头雾水:这是什么抽象的风格?没听说过啊。



这是 AI 出手之后,“糅合杂交”的结果,更糟的是它还被强行登记为许多人的年度最爱——谁会爱一个根本不存在的风格啊。


有一说一,网易云的内容设计,还是很能打的。比如去年正逢网易云十周年,推出的“十年听歌报告”按年份让用户回顾每一年的“主打歌”。



另外,以春夏秋冬作为意象,也是固定节目,每年都会出现。



音乐和记忆的勾连非常奇妙,它会神奇地把时间与空间凝结进去。当熟悉的旋律响起时,眼前浮现的不是音符,而是与这旋律共同相处的历程中,感情最为深刻的时光。


那么,最关键的问题出现了:要怎么样才能选对“年度之最”呢?


算法能算出人心吗?


到今年,常用年度听歌报告的用户,已经对“套路”了然于心:时长、总数、词云、春夏秋冬、活跃时段、深夜听歌、单日最高循环。


这些硬指标也是耳熟能详了。也不怪 Spotify 要引入人工智能这样的新技术,毕竟,它曾经吃过推荐算法极大的红利,没有算法就没有今天的 Spotify。



2012 年前后,Spotify 曾经重视过人工推荐,聘请了编辑来做歌单策划和整合。但到了 2014 年,就转向了个性化推荐算法。当时的目标很明确:通过播放数据,建立起平台本身的权威性,以此和大型唱片公司抗衡。


这是一个成功的战略转向,从此之后 Spotify 的卖点不再是音乐本身,而是使用音乐的方式。Spotify 的营销中高度强调“个性化”。


用户被吸引到一个(或许是)量身定制的世界中。日推、红心、分享和评论这些功能,鼓励用户与服务建立一种情感且亲密的关系。


这份亲密感与情感因素的营造,还体现在服务如何将算法计算而得的发现页面,包装成基于所有用户的共享集体智慧——任何用户都有可能成为一个“品味引领者”,而非源于冰冷的计算过程。


看上去很熟悉?虽然上面讲的是 Spotify,但网易云的操作也大差不差。



然而这种亲密的情感连接,给年度报告上了难度:播放频次和时长,未必直接反映对一首歌的情感。


我的年度之最来自一部电影原声带——这部分很准,我确实很很爱听 OST,每年这一类的歌曲占比都超过 20%——然而它之所以有最长的播放时间和频次,除了是因为好听和喜欢之外,还有一个重要原因:它只有 1 分钟 05 秒。


播一支常规的三分钟流行乐的工夫,已经能把这支 bgm 放三遍了,它不霸榜谁霸榜。连带着,这首 bgm 所属的专辑也被统计为年度专辑。


准吧,也是准的,但多少有点离谱。如果让我自己 pick 一个年度之最,肯定会有别的选择。


网易云一直没有开放这个设计。相比之下,垂直播客的平台小宇宙则是允许用户自己,手动决定年度之选的。不过也得承认,选一个年度播客属实更简单。而选一首年度之歌,就实在是太难了。



这种评选势必是一个涉及多个维度的艰难决策,或许也是大模型可以施展的地方。不是生硬的总结和编造,而是对长周期数据的准确理解和识别。


借着这篇文章的契机,我又回顾了 2023 年推出的“十年听歌报告”,以及当中的每一首歌。几乎不费工夫,我便能回忆起那些旋律携带着的细节:Zayde Wolf 的《Golden Age》陪伴我通勤,它上架下架很多次,每一次都在评论区里留下痕迹。Sufjan 竟然是我十年来最喜欢的歌手,第一次碰到他是在 2020 年,比记忆里的晚。在《冰雪奇缘》出来之后,我把原声带循环了个爽,也记起了这部电影所掀起的热议浪潮。



这要人如何决定年度之歌?一年是那么长的时光。音乐真是最神奇的魔法,当一首熟悉的歌,和它最常出现的时间节点放在一起时,不费吹灰之力就唤起所有的记忆,那是算法所无法深入的微妙空间,是只反应在音符上的动人时刻。


本文经授权转载自爱范儿 (ID:ifanr),如需二次转载请联系原作者。欢迎转发到朋友圈。