专栏名称: StuQ
实践驱动的IT教育平台
目录
相关文章推荐
黑马营销  ·  闪耀米兰,小红书携手VOGUE ... ·  昨天  
加措上师语录  ·  有传承,才有力量 ·  2 天前  
销售与市场  ·  国庆假期的第一个旅游趋势,出现了 ·  1 周前  
他化自在天  ·  【亚神殿光荣榜回顾】之@慕 篇 ·  1 周前  
51好读  ›  专栏  ›  StuQ

京东618|看人工智能如何助力京东破千亿

StuQ  · 公众号  ·  · 2017-06-20 21:03

正文

刚刚过去的6.18你有没有参与其中呢?深度学习的应用在这场全民的年中购物盛典中无处不在,ta悄悄帮我们优化着哪些购物体验呢?

京东618累计下单金额达到1199亿元,这个数据离不开深度学习技术在各个方面的帮助。

作为国内最大的自营电商,京东积极应用深度学习技术在各个业务线,优化用户体验。本文将着重介绍京东如何运用深度学习技术去优化商品数据,构建智能的商品生态来提升多业务用户体验。

图文不一致校验

图文不一致性是由于商品图片与商品文字描述的不一致导致的,这可能是由于图片和某一个或者多个文本属性冲突导致。这表明商品的基础数据存在错误,通常情况下会导致搜索的错误,影响用户的体验。


举一个简单的例子,当我们在京东购物,搜索 “男士 polo 衫 纯色”时,由于一些商品错误的文本信息导致该商品错误的被搜索命中,呈现给消费者。

上图中最右下角的格纹衬衫的扩展属性为纯色。该属性明显与商品图片不一致,错误的数据降低了搜索的准确率,但是增加了商品的曝光率。为此,我们通过自然语言理解和图片识别技术来检测图文不一致现象,对错误数据进行修正和通知商家修改。

高精度的图像识别技术,从商品图片中识别商品主体并抽取商品的特征,为文本属性修正提供高置信度的参照。以衣服的颜色为例,描述衣服颜色的名词数不胜数,以红色为例,就有绯红、桃红、品红、鲜红等等。利用分词抽取,我们获取了近万个颜色字段。

很多颜色的区分度极小,即便肉眼也很难区分,对训练数据的收集带来了很大的困扰。同时由于光照拍摄的问题,如此细分的分类对训练的结果也不一定有益。为此,我们首先对于颜色属性进行归一化,划分出不到 20 个色系,其余的属性也按照类似方法进行归一化。在准备好训练数据后,我们采用了 52 层 resnet 残差网络的finetuning 实现了多种图片特征 95%+ 的准备率模型。后续,我们会加入我们自己的卷积网络特征去提供准确率。

电商短文本理解 - 商品标题理解

商品的标题由采销人员和第三方商家命名,其中自营商品的命名较为规范。商家命名时,有些标题除了有文本描述矛盾外,还出现了大量词汇堆砌的情况。


从图上可以看到,一个跑步鞋商品的标题上“鞋”出现了 6 次。商家如此命名是为了增加搜索、推荐等系统命中率。然而实际情况上,搜索会对于此类词汇堆砌严重的标题进行降权,使得出现在搜索结果的末端。

为了解决此类问题,提升用户对于标题的信息获取的有效性,我们利用机器学习技术对商品标题进行一系列的处理:分词、实体识别、属性打标、热度计算、中心判定,将商品标题结构化。日后商家录入标题我们会利用模型结构化标题进行打分,对于此类词汇堆砌严重的标题进行结构优化,从源头上优化商品标题质量。

评论信息抽取

商城与用户的交互对于商品的反馈是商品数据的一个重要补充。用户的反馈主要包含商品评论,问答,退换货等信息。京东的理念是客户为先,因此我们对于用户的反馈极为重视。这些信息可以直观的展现用户对于商品的感受和质量的反馈。我们为此构建了多类语义理解模型,利用用户反馈,实现选品、商品质控等。下面我们选择评论的信息抽取着重介绍。

用户在购买商品时,之前用户的评论对用户的购买意愿有极强的影响力。但是在用户海量的评论中存在大量的无意义评论,这就影响到用户获取有效的信息。为此我们通过语言模型,对评论语句打分,将没有实质意义的评论折叠在评论最后。

此外我们会从评论中抽取关键词短语,通过对于短语与短语之间相似度的计算,聚合出出现频次最高的短语及相应的评论内容,展现给用户。此外我们还会分析用户评论的情感,真实展现负向情感关键词,给用户获得一个直观的产品描述,诚信对待消费者。


我们采用了无监督与有监督结合的方式构建关键词抽取模型, 在模型设计中,首先考虑到单独的词汇表达能力有限,不能满足业务需求,比如“声音”、“颜色”、“外观设计”等,而我们更需要的是,“声音大”,“颜色艳丽”,“外观设计时尚大方”等,所以采用了短语向量训练。然后根据业务其他需求加入了语言模型,情感模型,功能词模型等,最终取得不错的成果。我们的模型实现了定期自动更新。

模型会自动把你提交的评论做以上相关分析与处理,返回对应 top 关键词。结果示例:


可以说,通过深度学习技术,京东已经构建了卓越的智能商品生态来提升多业务用户体验。

不光是京东,国内外互联网巨头都在抢占 AI 高地,押注人工智能。而AI人才也正被高薪抢夺。

而随着火热的市场需求,也有越来越多的小伙伴想转行/求职AI相关职位,但是,却不知道该从何入手。其实,只要选对了老师和学习方法,机器学习是人人都能上手学的。而效率最高的学习方式,莫过于让实战经验丰富的老师带你在实战中学习。市面上唯一最高效学习课程《3个月成为AI实战工程师 —— 深度神经网络实战》让你学完就能把深度学习真正应用到工程实践中,尤其是高性能实时处理中。现在报名,还能直减2000元


还有5个 200元 本课程优惠码【STUQ620】,先抢先得!点「 阅读原文 」立即使用!


有问题?长按二维码,咨询课程详情~