尽管行动不便,但赵凯仍坚持定时前往阿里巴巴西溪园区和安全部小二沟通,“今年,我已经来回园区3~4趟。”
阿里安全部的算法专家薛晖(花名:奥创)见证了商家和鉴黄机器”斗智斗勇“的过程。
他表示,不久前,平台上出现一些二次元涉黄内容。
由于机器对于二次元漫画的鉴别能力不够,商家就开始抓住这个”死角“传播。
随后,安全部发现了这个问题,便向赵凯和小组成员发布了一项新任务,所需要打标的图片大多是成人动漫。
短时间内,通过大量的人工打标,教会机器学会看成人动漫。
薛晖表示,目前机器已经有了比较完善的鉴别动漫内容的能力。
据了解,阿里安全部的鉴黄人工智能机器大致经历了三个发展阶段。
从最初的基于肤色纹理等简单特征的技术,到基于局部特征和BoW(Bag of Words)的图像分类技术。
再到目前基于人工智能的深度学习技术。
一边是机器不断地迭代更新、扩大学习范围,另一边不断涌现的新型传播手段也在让色情内容变得更难捕捉。
2016年,移动直播轰轰烈烈的成为行业风口,市场出现200多家的直播平台。
同一年,阿里旗下的两大电商平台——淘宝和天猫,也相应推出了直播服务,定位于“消费类直播”,用户可边看边买。
阿里安全部决定开启对直播平台的实时监控,对于人工智能鉴黄而言,这并非一件易事。
“前两天,我们组里有同学在分享深度学习技术的论文集时,发觉一般每隔1~2年新的技术就会出现,原来的主流技术过时了。” 薛晖说。
他认为,在实时播出的画面中,鉴定主播行为是否违规,在目前阶段还是需要借助鉴黄师人工判定。
他举例道,例如女主播用性感的方式吃香蕉,闪露画面,都是依靠人工鉴定是否违规。
今年双11,为了应对淘系平台上直播节目的井喷式增长,安全部增调了不少人手主攻直播内容审查。
薛晖回忆道,每个人工鉴黄师要盯着一块被分成若干个小块的大荧幕,每一个小区块上定格着一个主播画面。
每隔几秒钟,鉴黄系统就会为上千个主播重新截图,就在短短几秒钟内,鉴黄师就要看完所有主播的行为。
有意思的是,这个阶段直接鉴定直播画面和动作尽管很困难。
鉴黄机器却能够通过直播观众的互动留言区域的反馈预测主播的行为。
若是遇上”出格“的留言,机器就会迅速以高亮的色彩边框,提醒人工鉴黄师高度关注相关主播。
懂文字,会鉴黄是这个机器的最大特征,一台普通服务器可以一天不间断的识别鉴定250万~350万张图片。
今年5月,基于这套人工智能系统,阿里巴巴安全部推出了“绿网”。
在淘系的平台,以及阿里生态下,“绿网”每天基于鉴黄业务的调用量有几亿次,而最终人工审核的比例大约在千分之几。
李若冰表示,随着准确率不断地提高,这套”鉴黄“机器人,已经开始输出给非阿里生态的互联网公司使用。
完
* 随时欢迎小伙伴们加小派君微信
投稿、爆料
欢迎大家转发、回复
来源:i天下网商,作者:陆文斌
*文章为作者独立观点,不代表派代网立场,版权声明:感谢原作者的辛苦创作,如涉及转载权限等问题,请作者与派代小编联系(微信:pdgd002),我们将在第一时间处理,谢谢!