快手的“无形之手”

南方周末 · 公众号 · 社会 · 2017-04-27 11:38

正文

▲2017年4月5日，北京中关村清华科技园，快手CEO宿华在快手总部接受南方周末记者采访。（南方周末记者张涛/图）

全文共1462字，阅读大约需要3分钟。

本文首发于南方周末

微信号：nanfangzhoumo

跟大多数有智能分发功能的互联网产品一样，快手的产品模式是，把人和信息做精准匹配。

快手CEO宿华介绍，一个快手的新用户，在冷启动的时候，机器首先会根据用户的注册资料、手机机型、地理位置和周边用户等情况，对用户做一个特征分析。当用户有了使用行为，浏览了内容后，快手的机器会根据用户的兴趣和爱好，升级用户特征库，进而给用户匹配更精准的内容。目前快手的用户特征库已经高达数百亿条。

如果这个用户开始发视频，快手的机器会对内容进行识别，把这个内容匹配和分发给其他可能对这个内容感兴趣的用户。

机器要实现对用户兴趣的精准识别，需要一定时间。比如宿华从小喜欢二胡，这并不是一个大众爱好，一开始系统并没有发现他这个爱好，过了一段时间机器才开始给他推荐一些二胡视频。宿华说，很难说机器用了多久发现这个兴趣，没有一个特别清晰的临界点和边界，像交朋友一样。

由于去中心化定位，所以快手的算法机器的作用就更大，因为一切注意力资源，都交给了机器来分配。这只快手上的无形之手，决定了你的内容被推荐给谁，被推荐给多少用户，也决定了是否给你直播权限。

这个机器是快手的人工智能技术和核心算法。它的作用是，理解用户上传的内容，然后把这个内容跟其他可能对这个内容感兴趣的用户进行匹配。

宿华介绍，快手人工智能技术的核心是三点。一是对内容属性的理解，二是对人的属性的理解，三是人与内容的互动。

内容属性的理解主要是识别照片、文字和视频内容。目前互联网行业的技术，在识别文字和照片的技术已经相对成熟。不仅能识别出一篇文章的类别（军事、体育和娱乐等），还能识别出一篇文章的情感（高兴、悲伤、贬低或赞扬）。但视频内容的识别技术还有待突破，目前只能识别场景（市内室外、酒吧、操场）。

宿华举例说，一段恋人拥抱的视频，人能简单分辨出来这是分别的拥抱。但机器识别不了这个拥抱是久别重逢还是短暂分别，是开心相聚还是悲伤离别。

“机器能识别是一只宠物，但是猫还是狗？是狗的话，什么狗？这些是更需要突破的技术。”宿华举例说，他发了一个自己小孩坐在玩具车上打瞌睡的视频。机器能判断视频里有一个孩子和一辆车，但机器目前还识别不了这是真车还是玩具车。

这个视频又不能简单地推送给发过孩子视频的用户。因为那些用户可能只喜欢自己的孩子。就算用户喜欢别人的孩子，但到底喜欢胖孩子还是瘦孩子，这些细节的差异，都需要机器去学习。

为了精准匹配，机器会进一步发现这个视频里其他细微的特征。

“每一个特征都是机器在猜测，然后做验证，这是一种弱决策，但很多弱决策叠加在一起之后，就变成了强匹配。”宿华说，这些特征在快手是百亿级存量。

对人的属性理解，则分成短期属性、中期属性和长期属性三块。其中，长期属性是出生年月和地区等。中期属性是兴趣爱好。最难识别的是短期属性，比如一个人搜索“苹果”，今天可能是想吃苹果，明天可能是想买一个苹果手机。这些属性是瞬息万变的，也最难识别和判断。

判断一个人的短期属性很难，但也更有价值。曾光明举例说，一个人是皇马的球迷，他希望看到皇马的消息，但可能不太想看到皇马输球的视频，如果你在不恰当的时候把皇马输球视频推送给他，他可能很不高兴。

人与内容的互动则指的是用户之间的点赞、关注和评论等行为。这些数据有助于机器预估一个人的兴趣爱好。数据互动最难的是需要时间沉淀、用户量积累和用户活跃度。

曾光明说，为了让机器更加公平和公正，快手的工程师们给机器定了一个“公理”，建立了一个规则社区。

在这个法治社会里，即便是宿华本人，如果没有上升力的内容，也很难被自己开发的机器所认可。宿华透露说，他的粉丝只有九十多个。