专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
黄建同学  ·  #ChatGPT高级语音功能全量开放##ai ... ·  2 天前  
爱可可-爱生活  ·  [CV] Molmo and PixMo: ... ·  2 天前  
人工智能那点事  ·  国内首部AI知识产权标准启动编制,诚邀科技企 ... ·  4 天前  
宝玉xp  ·  分析专业//@张俊林say:o1是多个模型这 ... ·  4 天前  
51好读  ›  专栏  ›  机器学习研究会

【学习】深度学习在美团点评的应用

机器学习研究会  · 公众号  · AI  · 2017-02-10 19:07

正文


点击上方“机器学习研究会”可以订阅哦
摘要
 

转自:美团点评技术团队

前言

近年来,深度学习在语音、图像、自然语言处理等领域取得非常突出的成果,成了最引人注目的技术热点之一。美团点评这两年在深度学习方面也进行了一些探索,其中在自然语言处理领域,我们将深度学习技术应用于文本分析、语义匹配、搜索引擎的排序模型等;在计算机视觉领域,我们将其应用于文字识别、目标检测、图像分类、图像质量排序等。下面我们就以语义匹配、图像质量排序及文字识别这三个应用场景为例,来详细介绍美团点评在深度学习技术及应用方面的经验和方法论。


基于深度学习的语义匹配

语义匹配技术,在信息检索、搜索引擎中有着重要的地位,在结果召回、精准排序等环节发挥着重要作用。


传统意义上讲的语义匹配技术,更加注重文字层面的语义吻合程度,我们暂且称之为语言层的语义匹配;而在美团点评这样典型的O2O应用场景下,我们的结果呈现除了和用户表达的语言层语义强相关之外,还和用户意图、用户状态强相关。


用户意图即用户是来干什么的?比如用户在百度上搜索“关内关外”,他的意图可能是想知道关内和关外代表的地理区域范围,“关内”和“关外”被作为两个词进行检索,而在美团上搜索“关内关外”,用户想找的就是“关内关外”这家饭店,“关内关外”被作为一个词来对待。


再说用户状态,一个在北京和另一个在武汉的用户,在百度或淘宝上搜索任何一个词条,可能得到的结果不会差太多;但是在美团这样与地理位置强相关的场景下就会完全不一样。比如我在武汉搜“黄鹤楼”,用户找的可能是景点门票,而在北京搜索“黄鹤楼”,用户找的很可能是一家饭店。


如何结合语言层信息和用户意图、状态来做语义匹配呢?


我们的思路是在短文本外引入部分O2O业务场景相关特征,融入到设计的深度学习来做语义匹配的框架中,通过点击/下单数据来指引语义匹配模型的优化方向,最终把训练出的点击相关性模型应用到搜索相关业务中。下图是针对美团点评场景设计的点击相似度框架ClickNet,是比较轻量级的模型,兼顾了效果和性能两方面,能很好地推广到线上应用。



原文链接:

https://mp.weixin.qq.com/s?__biz=MjM5NjQ5MTI5OA==&mid=2651746041&idx=1&sn=f078081ae803fc58ba941c6008b5bc7b&chksm=bd12b7b48a653ea2245e493e865c83360795fe86c982ceadf1628b60603e00562000e3f1020e&scene=0&pass_ticket=RiBkSN3qepv9t2xh3ndSus9Rm9mLYNZACKI1Gc98g7E%3D#rd

“完整内容”请点击【阅读原文】

↓↓↓