X 次元口袋
把数据的场景做深做透,真正帮助用户缩短从想法到产品的距离,是七牛一直以来的使命。从 2011 年至今,围绕数据管理打造场景化 PaaS ,我们已经服务了超过五十万家客户,承载了超过 2000 亿张图片,10 亿小时视频。
对互联网开发者来说,一站式在线数据管理一定要包含针对海量数据的零运维、高可用、高性能的数据处理服务,以便轻松应对图片、音视频及其他各类数据的实时、异步处理场景。目前,七牛提供的数据处理服务已经日处理数近百亿次,除了提供基础数据处理,还基于容器技术打造了易扩展、易部署、高自由度的自定义数据处理接入平台,与七牛数据处理服务无缝兼容使用,形成围绕数据展开的富媒体生态体系。
「X 次元口袋」就是介绍这些富媒体数据处理服务的一档栏目。
近几年,移动社交类、UGC 类平台、App 大量涌现,但面对每天大量的用户上传图片,传统的鉴黄师还忙的过来吗?打造健康的社交生态已成为这些平台、App 长期发展的关键,高效准确地鉴别和剔除淫秽色情信息成为一项迫在眉睫的任务。
七牛云携手专注于图像识别技术的图普科技推出了图片鉴黄服务,可判断保存在七牛云的图片是属于色情、性感还是正常,并给出判断的分数,分数越高判断为该类别的概率越大。
图片鉴黄是一种基于深度学习的图片识别技术。简单来讲就是:模仿人脑的机制来解析数据,让机器学会提取有判别性的特征,从而免去人工选取的过程。
工作原理可归纳为:
- 图片影像分析(肤色、姿态、场景);
- 交互行为分析(文件名、打开/上传时间);
- 特征库分析(影像指纹与不同库比对);
- 运维管理(用户举报、管理员鉴定、鉴黄师鉴定);
- 进化(更新信任/色情网站清单、更新影像信任库、更新文件名关键字黑名单)。
1. 成本降低的同时,效率大大提高。
鉴黄师平均每天审核处理的图片数只能在 3 万张左右,机器一天可以审 9 亿张。鉴黄服务基于大规模 GPU 超算平台,批量大并发可达 0.02 秒/张的响应速度,在保证稳定的同时,大大提高了审核效率,有效降低企业运营成本。
2. 准确率提高,误判少。
根据第三方服务提供商评测的结果显示,七牛平台的鉴黄服务准确度超过 99.5%,可以替代 90% 以上的人工审核,并且有强大的自学习能力,可以通过不断学习提高鉴别的准确度。
3. 全时工作。
由于工作内容的特殊性,人工鉴黄很难长时间连续工作,而机器鉴黄可以做到 7*24 小时不眠不休。
UGC 平台图像审核
社交应用、垂直社区等 UGC 平台,都需要对用户上传的图像内容进行审核。对一般平台而言,涉黄图像仅占全部内容的 1% 甚至更少,却需要对所有内容进行一一审核以排除风险,人力消耗巨大。通过接入鉴黄服务,机器将图像内容分类为色情/性感/正常,并给出机器确定和机器无法确定的部分,审核人员只需对机器难以确定的部分(约占总量 1%~5%)进行审核即可。通过这种方式实现由机器替代大部分审核人力,保障可靠稳定的审核工作同时减少 90% 以上人工成本。
在七牛平台上开启鉴黄服务,资源的存储和资源的处理浑然一体,实现零编程鉴黄,不需要再去经历冗长的注册、验证流程。
第一步:点击开始使用
第二步:获取图片 URL
第三步:在图片 URL 后面加上command ?nrop
返回值的说明:
1)Label 值表示机器对该图片的识别结果。Label=0, 代表该图片为色情图片;Label=1, 代表该图片为性感图片;Label=2, 代表该图片为正常图片。
2)Rate 值表示该图片符合机器识别结果的可能性。 例:Label=0,rate=0.9987,表示有99.87% 的可能是色情图片。
3)Review 值表示该图片/视频是否需要人工复审。review=true,代表机器对这个图片的判断把握不到 99.5%,建议复审下;review=false,表示机器对这个图片的判断把握超过 99.5%,比人工还高,是不用复审的。