专栏名称: 派代

每日三篇干货推荐！提供电商老板、实操人员最感兴趣的鲜活资讯及热门干货。是电商从业者的必备微信公共帐号。

揭秘鉴黄师：智能鉴黄时代来临，这份神秘职业如何转型？

派代 · 公众号 · 电商 · 2016-12-28 21:42

正文

点击上方“派代网”关注，查看更多电商干货

导言：“轻松、月入斗金和饱眼福”是外界对鉴黄师的臆测，而在现实世界中，他们的生活远没有外界谣传的那么香艳。

正文

”生无可恋“、”麻木“，在对话过程中，这些是鉴黄师赵凯重复最多的形容词。

他曾经一天最多审图数万张，而现在，智能技术的发展正在一点点将他从这样的生活状态“解救”出来。

阿里安全部称，阿里现在“鉴黄”进入了智能时代，99.9%的图片交由人工智能机器鉴定。

而鉴黄师的工作职责也随之发生了改变——从纯人工鉴黄，转向教会机器人鉴黄。

日夜颠倒的鉴黄师

一间五、六平方的房间，是赵凯的工作室，摆着一台电脑。

他今年34岁，作为一名鉴黄师，在这个房间，他每天要从5000张左右的图片中，审核出涉黄内容，并将其分类。

房间的另一侧是一张大床，堆放着不少玩具。他的另一个身份是父亲，2岁的女儿爱和赵凯一起玩耍。

由于工作的内容充斥着色情内容，关门工作算是赵凯对女儿的一种特殊关爱。

赵凯表示，等女儿在长大一些，我就要保证她在家时不工作。

“我非常爱我的女儿，作为父亲，我有责任和义务去保护她。

每次审图累了，一想到女儿长大后也会上网，就有了动力，要为她营造一个干净的网络环境”，赵凯表示。

每到夜晚，家人进入梦乡的时候，赵凯借着微弱灯光，打开电脑，变身为一名职业鉴黄师。

他表示，肯定不能当着家人和朋友的面做。

这份职业打破了赵凯原有的生活规律率，“一开始断定完所有图片，算得上生无可恋了”。

三年时间，赵凯日复一日的敲击鼠标和键盘快捷键，在他眼里，“已经不知道里面是什么内容了，只是按照标准执行。”

由于患有先天性小儿脑瘫，行走不便、语言交流有些困难，赵凯选择待在家里。

2013年，他偶然获悉残联和阿里巴巴向残障人士开放“鉴黄师”的这个岗位，因为只需在家工作，他抱着试一试的心态，加入鉴黄师团队。

和赵凯一样参与鉴黄工作的残障人士，在全国共有300多人，主要分布在浙江、河南和湖南三省，已经累计审核模型图片两亿五千多张。

凭借着高准确率和兢兢业业的工作态度，赵凯晋升为组长。

队员每当遇到很多难以判断的图片，都交给赵凯处理判定和解答。

2013年，阿里巴巴决定引入人工智能鉴黄。赵凯和其他300位残联成员则是整个人工智能鉴黄的重要环节。

在日常工作中，赵凯是为大量的图片审核分类，用他们的行话说叫“打标”，分成纯色情、性感、低俗、正常和无法判断五大类。

赵凯明白给图片打标，只是为了训练机器算法变得更加聪明。

让它逐渐拥有人的思维模式，而自己就是机器人的老师。

经过人工的训练，和机器自我深度学习，阿里安全部称，99.9%的图片可以由人工智能机器鉴定。

赵凯也发现，随着机器变得越来越聪明，他的日常工作量已经大幅度减少。

他回忆道，2014年，当人工智能还没有完全运作起来的时候，在高峰时期，每天的任务量达到70000张。

“鉴黄师的收入和外界传言的不同，多是以公益性质，要依靠几千元的津贴养活一家人，几乎是不可能”，赵凯说。

现在，他学会了一些室内设计的常用软件，白天做一些兼职，晚上继续“鉴定”色情内容。

赵凯表示，经过300位鉴黄师和人工智能的共同努力，现在淘宝网的环境变得越来越好。

道高一丈

由于交易额爆炸式增长，色情内容曾一度成为阿里巴巴安全部的心头病，单纯使用人力鉴定变得艰难。

阿里安全部小二李若冰（花名：博雷）表示，和社交工具以及网络社区等存在大量色情内容不同的是。

消费者在淘宝是被动接触色情内容。阿里巴巴对此容忍度为零，一直在处罚，甚至关停涉黄商家和买家账号。

即便有越来越聪明的机器鉴黄师，但还是会被不法商家钻空子，两者之间的博弈从来没有间断。

尽管行动不便，但赵凯仍坚持定时前往阿里巴巴西溪园区和安全部小二沟通，“今年，我已经来回园区3~4趟。”

阿里安全部的算法专家薛晖（花名：奥创）见证了商家和鉴黄机器”斗智斗勇“的过程。

他表示，不久前，平台上出现一些二次元涉黄内容。

由于机器对于二次元漫画的鉴别能力不够，商家就开始抓住这个”死角“传播。

随后，安全部发现了这个问题，便向赵凯和小组成员发布了一项新任务，所需要打标的图片大多是成人动漫。

短时间内，通过大量的人工打标，教会机器学会看成人动漫。

薛晖表示，目前机器已经有了比较完善的鉴别动漫内容的能力。

据了解，阿里安全部的鉴黄人工智能机器大致经历了三个发展阶段。

从最初的基于肤色纹理等简单特征的技术，到基于局部特征和BoW（Bag of Words）的图像分类技术。

再到目前基于人工智能的深度学习技术。

一边是机器不断地迭代更新、扩大学习范围，另一边不断涌现的新型传播手段也在让色情内容变得更难捕捉。

2016年，移动直播轰轰烈烈的成为行业风口，市场出现200多家的直播平台。

同一年，阿里旗下的两大电商平台——淘宝和天猫，也相应推出了直播服务，定位于“消费类直播”，用户可边看边买。

阿里安全部决定开启对直播平台的实时监控，对于人工智能鉴黄而言，这并非一件易事。

“前两天，我们组里有同学在分享深度学习技术的论文集时，发觉一般每隔1~2年新的技术就会出现，原来的主流技术过时了。” 薛晖说。

他认为，在实时播出的画面中，鉴定主播行为是否违规，在目前阶段还是需要借助鉴黄师人工判定。

他举例道，例如女主播用性感的方式吃香蕉，闪露画面，都是依靠人工鉴定是否违规。

今年双11，为了应对淘系平台上直播节目的井喷式增长，安全部增调了不少人手主攻直播内容审查。

薛晖回忆道，每个人工鉴黄师要盯着一块被分成若干个小块的大荧幕，每一个小区块上定格着一个主播画面。

每隔几秒钟，鉴黄系统就会为上千个主播重新截图，就在短短几秒钟内，鉴黄师就要看完所有主播的行为。

有意思的是，这个阶段直接鉴定直播画面和动作尽管很困难。

鉴黄机器却能够通过直播观众的互动留言区域的反馈预测主播的行为。

若是遇上”出格“的留言，机器就会迅速以高亮的色彩边框，提醒人工鉴黄师高度关注相关主播。

懂文字，会鉴黄是这个机器的最大特征，一台普通服务器可以一天不间断的识别鉴定250万~350万张图片。

今年5月，基于这套人工智能系统，阿里巴巴安全部推出了“绿网”。

在淘系的平台，以及阿里生态下，“绿网”每天基于鉴黄业务的调用量有几亿次，而最终人工审核的比例大约在千分之几。

李若冰表示，随着准确率不断地提高，这套”鉴黄“机器人，已经开始输出给非阿里生态的互联网公司使用。

完

* 随时欢迎小伙伴们加小派君微信

投稿、爆料

欢迎大家转发、回复

来源：i天下网商，作者：陆文斌