职业“鉴黄”,是很多人眼中奇特而又隐秘的工作。而实际上,这是一项非常具有挑战性的活儿。一个直播网站,最多时需要五六十人三班倒,24小时持续工作,一个人一小时最多需要审查6万张图片,对用户上传的视频、语音文件、图片做全面审查,还要保证检出率和误报率。而现在,如果由计算机接管这个活儿呢?
极限元智能科技能够为直播平台提供的互联网音视频智能监测系统,就能代替人工,对有害视频进行自动检测和报警,让“鉴黄”这件事儿,不再成为企业的人力成本负担。
这是极限元业务体系中的一项。这家在2014年成立的人工智能公司,在智能语音和计算机视觉等领域,开发了多项消费级智能产品,为网络安全、智能驾驶等提供行业应用。2016年,极限元完成了天使轮融资。
极限元创始人雷臻有过4年在华为的工作经历。离开华为后,雷臻参与联合创办了比特币交易平台OKCoin,到2013年,OKCoin已经成为全球最大的比特币交易所。而从2014年开始,雷臻又再次出发,创办了极限元。
(极限元创始人雷臻)
雷臻说自己是个喜欢“折腾”的人。选择2014年在AI领域入局,则是因为他认为,当时的人工智能行业,已经走到了一个临界点。“虽然人工智能早已产生,但是计算资源和数据量还远远不够,也一直没有发展起来。”而随着深度学习的发展,云计算和大数据的深化,计算资源的增长,以及基于深度学习算法的标志性企业的出现,雷臻觉得,人工智能发展的时机到了。
“人工智能商业化的应用,现在还只是出于早期阶段。这个赛道是足够大的。”雷臻说。同时,极限元的创业团队基本形成。联合创始人康利强拥有十多年软件研发、架构设计以及项目管理经验;联合创始人马骥曾就职于中科软与华为,是一名网络安全解决方案专家;CTO车浩毕业于中科院自动化研究所,在智能语音领域拥有多项科研成果。有了方向和技术人才资源,以及自己的创业经验,雷臻决定向人工智能领域进发。
刚成立时,极限元首先选择的是从智能语音领域切入。公司获得了语音合成、语音识别的相关技术发明和专利,推出了极限元“智能语音云平台”,开放API接口,对移动开发者和软硬件厂商提供技术解决方案。
“极限元是为数不多的能提供整个语音解决方案的公司。”雷臻对i黑马说。在语音识别、语音合成、声纹识别、口语评测、语音检索等方面,极限元都能提供相关服务。“在通用领域,我们的语音识别准确率能够达到95%以上。”雷臻说。
极限元的语音解决方案已经在多个领域推出了落地应用。据雷臻介绍,包括极限元联合语文出版社推出的“古诗词诵读APP”和“方言掌上通APP”。前者可以根据用户的语音诵读实现对字词准确性、韵律标准型的评测,同时提供自主学习功能。后者是出于保护方言以及互译的需求,可以帮助用户学习和使用方言,同时可以进行方言和普通话的互译。
安防领域也是极限元智能语音系统应用的重点。极限元推出的反电信诈骗系统,可以通过分析语音内容,判断来电是否为诈骗电话。雷臻表示,目前,该系统已经通过地方公安部门验收,并在几大电信运营商开始部署。
2016年,极限元推出了互联网音视频智能监测系统。这就是我们之前提到过的对直播平台等的内容监测产品。
鉴黄并不想外界所想象的那样有趣,而是一个苦逼活儿。现在,国家互联网管理机构对直播平台的要求日益严格,对事故处于零容忍状态。而直播的需求,却在日益扩大。直播平台们,必须设置专门监控团队,24小时实施人工监视。往往一个工作人员需要负责监督多个直播间,如果出现有害视频画面和语音,必须通过人工确认。因此,监管部门往往是三班倒,据极限元统计,1人1个小时最多要审6万张图片,一天处理40万-50万张直播截图。“小一点的直播平台光监督审核这块,可能就需要40-50人。”
极限元的解决方案能够实现音频+视频的双通道检测。对于视频直播内容,能够识别图像中的人物体征,识别人物肤色和肢体器官的暴露程度,分析动作行为,以及视频中包含的弹幕信息。同时,还可以从音频信息中提取关键特征,判断是否存在敏感信息。主要功能包括实时提取音频数据、音频信号降噪和增强处理、语音关键词检索、通过声纹和人脸对主播身份进行确认登。它能监控所有送检视频并对问题画面自动报警,支持事件回放,方便进行人工校验。
“应用了我们的解决方案,大约能够为直播平台节省70%-80%的人力。原来五六十人的监控团队,现在只需要10个人左右即可。机器验证介于‘性感’和‘色情’之间的内容,才会再需要人工校验。”雷臻告诉i黑马。目前,极限元的解决方案已经在花椒等直播平台得到了应用。
(互联网音视频有害信息审查安全网关)
音视频智能监测系统并非仅仅只能在直播平台上得到应用。在雷臻的计划中,它还具有更大的行业外延性。“各种图像、视频的涉黄内容审查场景中,比如公安部门、互联网信息监管部门、内容发布平台网站等,都可以得到应用。”雷臻说。“除了直播外,我们已经在加速泛娱乐行业布局,包括电商平台、社交媒体、游戏等。”视频直播领域,由于近年来成为热门社交领域,视频传播实时性较高,相关部门审查最为严格,因此也成为极限元首先试水的领域。
“我们起初在和网信办的项目合作中,发现了这是一个极大的需求。”雷臻说,“而且,我认为这是一个人工智能能够极大地发挥作用的领域——它的边界足够清晰,而且,数据量足够。”