本文探讨了年轻人通过反向驯化算法来对抗“大数据杀熟”的现象,包括采用重置账户、立“穷鬼”人设、更换功能机等方式来试图改变大数据定价策略。文章从公众、技术专家、法律专家等角度分析了这种现象背后的原因,包括消费者对算法的认知能力提升、对信息不对称的担忧以及对平台行为的约束和规范的需求。同时,文章也提到了算法治理的问题,包括信息“孤岛”现象、算法外部性风险内化等难点,并指出监管端正在采取行动开展算法典型问题治理专项行动。
年轻人采用多种策略来对抗大数据差异化营销,如重置账户、立“穷鬼”人设、更换功能机等,试图改变大数据定价策略。
消费者对算法的认知能力逐步提升,开始具备反击算法的能力。然而,消费者对算法及平台的不信任源于信息不对称,平台方和消费者之间存在着巨大的信息不对称。
算法治理面临信息“孤岛”现象、算法外部性风险内化等难点。监管端正在采取行动开展“清朗·网络平台算法典型问题治理”专项行动,以整治算法问题。
为了防止被“杀熟”,一些年轻人试图“用魔法打败魔法”,通过反向驯化算法的方式来迷惑大数据。
他们有的采用重置账户的方式,以新客身份享受“新用户优惠”;有的在网上立“穷鬼”人设,频繁刷起“机票太贵,买不起”的留言;还有的选择更换老人机、功能机等,尝试摆脱被智能手机、被算法的支配感……
这些现象背后,反映了用户对算法的认知逐步加深,也开始具备反击算法的能力。而更深层次的问题是,基于信息的不对称,长久以来人们对算法能否公平公正地作出决策,存在不信任。如何消弭这种不信任感?这是算法治理过程中有待回应的关切问题。
这些年,有关“大数据杀熟”的讨论此起彼伏。
今年11月,京津冀三地消协联合开展了大数据营销差异化现象调查。超过四成的消费者明确表示曾遭遇“大数据差异化营销”;仅有8.7%的消费者认为没有遇到过。
上述调查还发现,受访者遇到大数据差异化营销的具体情况中,最常见的表现具体为:多次浏览后价格自动上涨、不同用户享有不同打折优惠形式、隐藏或不送老用户优惠券、同一时间不同用户购买相同商品或服务的价格不同差异化营销归因复杂。
为了对抗“大数据杀熟”,年轻人开始通过反向驯化算法获得优惠。
一些网友晒出“机票太贵,不去了”的帖子。
近日,南都·隐私护卫队观察发现,在小红书等社交平台上,不少用户晒出了“骂机票专用帖”,称机票太贵买不起,并喊话多家航空公司和在线旅游平台(OTA)让人失望。类似“不去了,机票涨那么多”“天天看,越看越涨”“再涨价统统卸载”等,在评论区里刷屏。还有多位用户晒出机票截图,称用这招成功地把价格“打”了下来。
如何看待年轻人“反杀熟”现象?复旦大学计算机科学技术学院教授、上海市数据科学重点实验室主任肖仰华长期从事大数据、知识图谱、大模型方面的研究。在他看来,“这是一件非常值得玩味的事情。”
从公众层面,一个可以明显感知的变化是,“年轻人或者说大数据平台的目标用户,对平台所使用的基于大数据来定价等技术,有了更深层次的认知和理解。”
当前,大数据分析技术已广泛应用于互联网服务产品中。其通过感知和获取用户的各种行为数据,洞察用户偏好,借助一个个标签形成对用户的画像,并辅助平台做相关决策——比如精准推送内容、制定和调整定价策略等。
“这种技术本质上是通过用户的行为数据分析,为用户提供更精准的个性化服务。”肖仰华对南都·隐私护卫队表示,技术本身是中性的,但不免被有些厂商利用,通过实时调整定价的策略以获取更高的利润——这就是所谓的“大数据杀熟”。
肖仰华进一步说道,比如你是一个使用高端手机的用户,一旦大数据模型感知到你的行为数据中表现出对某项商品的需求迫切,那么就有可能提高相应的价格。
“而现在幸运的是,我们公众对这一过程有了更认知和了解。”
上海市消保委副秘书长唐健盛则从不同世代的角度来解读“年轻人反向驯化算法”的现象。
他告诉南都·隐私护卫队,00后是移动互联网原住民,他们对信息的获取和处理能力远超其他世代的消费者。这使得他们更有能力去破解当前基于大数据技术的互联网服务的玩法,“这是一种博弈能力的提升。”
年初,“评分低的店可能更好吃”的话题引起热议。
今年年初,“年轻人报复性挤爆3.5分饭店”登上微博热搜。一些年轻人发现跟风打卡高分的“网红餐厅”却频频踩雷。但选择3.5分到4分、存活时间超过5年的饭店,反而收获了出乎意料的美味。
这一现象背后,一定程度也反映了消费者对当前“注水”评分机制的质疑——因为很多年轻人知道,一些所谓的高评分餐厅往往是刷好评“卷”出来的。
在唐健盛看来,年轻人反向驯化算法和“3.5分饭店走红”,有异曲同工之妙。这本质说明了消费者对算法的不满,尽管现在还难断定这些反向操作一定能打败算法(因为算法背后也是人),但可以看到年轻人——特别是以00后为代表的消费者,对算法有了更多认知,也更具与之博弈的能力。
那么,这些努力是徒劳吗?
在对外经贸大学法学院教授张欣看来,靠反向人设来“反杀”大数据可能有一定的效果。她告诉南都·隐私护卫队,从技术机理上看,通过大数据技术对用户进行画像,主要是根据各种各样的数据来判断的——比如浏览和点击习惯、购物的习惯等行为数据,甚至是在输入法中输入一些关键词等,都可能被分析。所以,如果用户反向操作呈现出与自己真实想法不一致的数据时,那么大数据将给出与当前的状态最相似的结果。
至于反向驯化算法的效果有多大?张欣认为,这需要分不同场景看待。比如实时定价,主要基于对实时数据的追踪(可能是用户刚刚说过的话或是敲过的文字),那么这种反向操作有可能起到一定作用。而如果是广告投放,这主要基于对用户数据的长时间追踪,已形成了用户画像或者与用户设备识别码深度绑定,那么能起到的作用较小。
此前有技术专家对南都·隐私护卫队表示,理论上平台内部闭环数据中的评论可能影响到模型,但实际上要受限于:训练时算法是否使用评论作为特征,如果使用了,它在多大程度上会影响算法推送。
还有技术专家分析,这种“留言喊话”方式的有效性完全取决于售票平台的算法设计,会不会因为用户在一些公开网站的留言而影响平台的定价策略。原理上这是可行的,但涉及价格歧视问题。
另据九派新闻近日报道,携程、飞猪等多家平台明确否认存在“杀熟”行为,并解释机票价格变动可能受包括航司活动、权益卡、促销红包、新人优惠等多重因素影响,靠刷评论无法让机票降价。
除了“哭穷”外,南都·隐私护卫队观察发现,还有人通过重置账号、关闭个性化推荐、故意绕过感兴趣的内容、修改个人信息为统一的昵称momo和粉色恐龙头像等,试图逃避算法推荐机制。
不希望冲浪足迹轻易被熟人发现的用户,换上了默认的昵称和头像。
还有一个有趣的现象是,近年来,越来越年轻人尝试加入“数字极简主义”、“反技术依赖”等社群行列。他们强调极限简化数字技术使用,比如改换老人机、功能机等,试图摆脱被智能手机、被算法支配的感觉。
透过这一现象,张欣指出背后一个深层次的原因是,人们对算法本身及其研发主体、科技平台的不信任。很多人不相信算法能公平公正地做出决策,也不相信平台会切实保障用户权益。而且人们发现,一旦侵权行为发生后,个体寻求救济的成本非常高,大多数人也不具备充分的时间和精力去维权。
“因此,还不如在一开始就从前端(着手),通过模糊用户个人画像、采用统一的头像和名称,尽可能地依据用户理解到的算法决策逻辑来回避算法。”张欣说,“其实这也反映了人们对个人隐私保护、对算法侵权风险的焦虑感。”
肖仰华持有类似的观点。他建议,平台方、工具方、服务提供方等,严格遵照互联网个人信息保护相关法规的规定,以最小信息采集的原则,保障用户知情权利。
“大数据‘杀熟’和‘反杀熟’事件存在,说明了我们很多平台可能有意或无意地违背了有关规定,或者说游走在灰色地带。”肖仰华进一步说道,一些用户之所以能反“杀熟“成功,恰恰说明这些平台可能是在违规或者越界地采集用户数据。
“既然如此,那我就让你过度采集到一些反向的数据——通过留言不愿购买、声称要卸载软件等策略,让平台降低服务和产品价格。”肖仰华告诉南都·隐私护卫队,“这也警示我们需要进一步加强对平台方行为的约束和规范:在用户未知情的情况下,不得过度采集用户信息。”
年轻人反向驯化算法背后,肖仰华还看到另一层面的问题,即信息不对称。他说,平台方通常会提供所谓的用户服务协议,但其中仍有很多“灰色”的表达和不明晰的细节,用户也不一定会严肃地认真阅读,彻底理解这一格式条款的每项内容。
“这就意味着平台方与消费者双方存在着巨大的信息不对称。”肖仰华表示,如何以公众能理解的方式清晰地告知其权利及其边界、缩小信息鸿沟,这需要各方努力,才有可能推动大数据或者互联网服务规范化、健康化发展。
从更深层次的原因看,肖仰华进一步向南都·隐私护卫队剖析,类似事件并非首次出现,可以说这是整个互联网信用体系不健全的一个缩影。例如,此前还有一些存在过度营销的互联网金融产品,在设计之初就有意地淡化了产品风险。
推而广之,肖仰华认为,不单单是互联网信息服务业,在全社会的很多方面可能都缺乏这样的信用体系。这种缺失会带来巨大的治理成本,而这个成本或将会是整个社会所无法承受的。
“特别是像互联网信息服务这样有着巨大信息不对称的行业,平台方的优势地位明显、掌握巨大的资本,也有健全的法律专家保障他们利益不受侵犯。相较之下,势单力薄的普通消费者的权利如何保护?”
在肖仰华看来,“怎么建立公平公正的信用服务体系,这可能是全社会要共同努力解决的一个根本问题。”
唐健盛认为,算法治理还应重点关注信息“孤岛”的问题。他解释道,跨平台精准广告推送的背后,其实是企业收集大量消费者个人信息后,描绘出用户画像,进而开展精准营销。商家掌握过多消费者个人信息后,向消费者实施的所谓个性化推送可能会造成信息“孤岛”,消费者收到的都是定制化的片面信息,知情权与选择权被严重弱化。
“比如你喜欢白芝麻,平台一直给你推送白芝麻比黑芝麻更好的信息,以此强化观念并让你确信这就是对的。”唐健盛告诉南都·隐私护卫队,消费者对于“大数据杀熟”相对可感可知,但对信息“孤岛”则难以察觉——它可能通过改变消费者的认知而操纵其行为,这是算法治理面临的最大问题。
“仅靠用户这一端,很难撬动整个(算法)生态的治理。”张欣认为,面对大数据和算法,消费者能做的其实非常有限,更多的还有赖于算法研发者的参与——因为他们更熟知算法的技术逻辑,也更知道如何通过技术手段根本性地改变算法应用的目的。而最根本的手段还是要通过法律制度框架,将算法应用所带来的负外部性成本内化。
在张欣看来,长久以来,在算法治理的一个比较大的难点是,它带来的任何负面风险是由整个社会所承担的。当前平台所采取的各种合规举措,包括事后救济手段等,并没有完全地将算法外部性的风险消弭。
她对南都·隐私护卫队表示,算法治理要通过法律机制构建有效的问责机制,让算法或大模型带来的负外部性能够内化为企业的成本,这样的话才能激励相关主体运用各种各样的手段——不管是基于技术的、平台的,还是内部生态治理,以及基于行业自律承诺等等,从根本上开发出公平可信的、以人为本的算法。
南都·隐私护卫队关注到,针对算法治理问题,监管端也在行动。
日前,中央网信办等四部门联合发文,部署开展“清朗·网络平台算法典型问题治理”专项行动,要求重点整治同质化推送营造“信息茧房”、违规操纵干预榜单炒作热点、利用算法实施大数据“杀熟”等。
唐健盛点赞了这一专项行动,“我们处在被算法所包围的环境里,如何让算法技术向上向善,是所有人的共同期待,希望能落实到位。”他说。
采写:南都记者 李玲
更多内容👇
哭穷能反向驯化大数据杀熟?专家:只是小聪明,算法透明方能治本