专栏名称: SegmentFault思否
SegmentFault (www.sf.gg)开发者社区,是中国年轻开发者喜爱的极客社区,我们为开发者提供最纯粹的技术交流和分享平台。
目录
相关文章推荐
程序员小灰  ·  清华大学《DeepSeek学习手册》(全5册) ·  昨天  
程序员小灰  ·  3个令人惊艳的DeepSeek项目,诞生了! ·  19 小时前  
程序猿  ·  “我真的受够了Ubuntu!” ·  2 天前  
待字闺中  ·  DeepSeek 爆火带来的大变化 ·  1 周前  
程序员的那些事  ·  李彦宏自曝开源真相:从骂“智商税”到送出“史 ... ·  4 天前  
51好读  ›  专栏  ›  SegmentFault思否

亚马逊虚假评论 116 元/条,水军挣钱有多容易?

SegmentFault思否  · 公众号  · 程序员  · 2019-12-28 10:30

正文

场景描述:

在知名的电商平台亚马逊上,虚假评论一直在诱导着消费者购买伪劣产品。 尽管亚马逊对此进行了一些管控,但依旧无法将其一网打尽。

近期,有媒体报道亚马逊的卖家正在从专业的造假公司手中,以不菲的价格大量购买虚假评论,甚至还形成了一个不小的灰色市场。 如何识别和监管这些假冒评论? AI 在其中又能扮演什么样的角色?


关键词: 电商购物   虚假评论   自然语言处理



一直以来,亚马逊就在对抗虚假评论的道路上忙得焦头烂额。

亚马逊实行了大量的监管手段,还是存在许多虚假评论


近日,外媒《每日邮报》发布了一项调查,在亚马逊平台上,活跃着一批专门兜售虚假评论的公司,他们背后操纵着网站上的虚假评论,每条假评论以 13 英镑(约为 116 元)的价格进行售卖。
在爆料中,一家位于德国的公司 AMZTigers ,就专门从事着这类不正当的交易,它在英国有 3,000 名测试人员,整个欧洲有近 6 万名人员,以提供快速的虚假评论服务。

亚马逊曾多次表示对平台实行了监管措施,在过去一年里,更是花费了 3 亿英镑( 27.26 亿元),来保护客户免受滥用、欺诈和其他形式的不当行为。 但这次的报道,侧映了它们的工作还有一些漏洞存在。

英国消费者协会曾怒将诸多亚马逊商品
打上「别买」的标签

虚假评论不仅仅只是亚马逊需要面临的问题,事实上,整个电商平台都存在着泛滥的假冒/欺诈性评论,这几乎就是网购环境下挥之不去的阴霾。




伴随着网购蔓延而来的虚假评论


虚假评论泛滥的背后,是巨大的市场利益驱动和恶性竞争在作怪。


在一项针对 2000 名成年人的调查统计中显示,超过 97% 的买家会依赖在线评论的内容,做出最后的购买决定。

虚假评论往往伴随刷单一起出现。 在去年底,新京报的一项调查中提及,阿里单在 2018 年一年里,就监控到 2800 多个刷单团伙,其中包括刷单 QQ 群 2384 个,空包交易平台 290 个,刷单交易平台 237 个。


刷单刷评的门槛很低,网络上随处可见,也掌握着巨大的流量。 比如大平台「握手网」客服号称有 60万「刷手」,而「宝宝刷单网」则称每天有近万名「刷手」在线。 在遭曝光后,一些平台关闭,另一些则改头换面重新开始刷单业务。



国内的电商平台也存在明目张胆的刷单刷评行为

央视也曾曝光过,一家销售不合格产品的儿童用品公司,在一年内刷单数量达到 1231 单,涉及金额超过 77 万元,伪造了近 40 倍的虚假交易记录,支也为此支付了约 2 万元的刷单佣金。


电商、网络「刷手」、刷单渠道,交织在一起,构成了庞大的刷单黑色产业链,它们有着一整套复杂而详细的运作流程,以制造大量的虚假销量和虚假评论。


央视报道中提及,连差评都可能是假的


2019 年 1 月 1 日,《电子商务法》开始施行,其中将「刷单」定义为违法行为,规定「电子商务经营者不得以虚构交易、编造用户评价等方式进行虚假宣传,欺骗、误导消费者。 」但因为违法成本低、隐蔽性强等特点,再加上平台的推荐机制等原因,催生了这一现象的野蛮生长。

除了电商平台需要借鉴更加完善的管理制度之外,也许另一种可行的方式,就是善用 AI 的力量。





AI 技术正成为打假的利器


从虚假评论受到人们和电商平台的重视以来,传统的数据分析方法,就一直被用来检测假冒/欺诈性评论。 但早期的数据分析技术,通常以提取定量和统计数据特征为主。


亚马逊上「不走心」的重复假评论

这些方法,能够筛选出一些低端的造假,想要进行更全面深度的数据分析,系统必须配备大量的后台数据,并能够执行涉及该数据的推理任务。


于是,一些研究人员将方向转向了机器学习和人工智能,用更有效的方法来对抗虚假评论。

Fakespot 是一款基于 AI 的线上检测工具
支持亚马逊、Steam、沃尔玛的评论检测

真实的评论和虚假评论之间,有一些语言特征上的差异。 比如一个刚注册的用户,在评论中充斥了过分的溢美之词,那么很有可能是来自水军的评论。 使用有监督/或无监督的学习方法,让 AI 学会去判断这些差异,就是 AI 进行打假的关键一步。


此类技术,归属于自然语言处理上的范畴。 通过提取和识别流行的电商平台上,虚假和不可靠的消费者评论,通过训练让算法学会识别和判断虚假评论,最终学会给用户评论的可信度进行打分。


这其中一项重要的任务,在于进行异常检测,从书写样式、格式,结合评论者的多种可用资料,判断该评论属于正常用户还是恶意的假冒评论。


比如发现拼写和语法上可疑之处,结合评论数量,购买方式,日期不匹配以及其他可疑评论活动的迹象。






请到「今天看啥」查看全文


推荐文章
程序员小灰  ·  3个令人惊艳的DeepSeek项目,诞生了!
19 小时前
程序猿  ·  “我真的受够了Ubuntu!”
2 天前
待字闺中  ·  DeepSeek 爆火带来的大变化
1 周前
万能的大熊  ·  旅行最好的原因,绝没有之一
8 年前
房地产投资融资俱乐部  ·  巴菲特2017年致股东信
7 年前
指尖阅读  ·  这才叫情人,你有吗?
7 年前