针对广告主的短视频营销需求,不久前微瑞思创的“方舟”中台正式上线了一个新的能力——“仓颉”引擎。仓颉本为创字之神,而微瑞思创研发“仓颉”的引擎可以利用深度学习算法,重新解读博主创建的短视频内容,对其进行价值再造。
据雷锋网了解,“仓颉”可以通过深度学习技术对“方舟”内整合的包括抖音、快手、小红书在内的多个平台的KOL视频中出现的商品或公司logo、名称、标志物等进行自动检测和定位,分析和识别视频内容创作者可能进行的商业营销行为,帮广告主找到最合适的KOL。
具体来说,它的功能实现可以分为3个步骤:
1、对接各类平台的海量视频数据,按照视频创作者对其进行归类;
2、利用深度学习领域的卷积神经网络目标检测算法建立专有的logo检测识别模型,以品牌的logo数据集为基础,对模型进行训练,得到模型的最优参数;
3、加载最优参数的识别检测模型预测视频是否含有商业宣传内容;相应地,根据视频创作者的内容丰富度,实现对大V的核心受众分类,例如:美妆、数码、美食,旅游,母婴等。
通过上述技术和模块能力,
“仓颉”能够有效地利用服务器集群高速分析百万视频内容,并且对视频内容创作者的商业营销价值进行自动评估、分类,方便广告主从网上数以百万计的自媒体短视频内容创作者中筛选出适合自己的创作者进行广告投放和营销合作。
打个简单的比方,如果某个博主的视频中经常出现零食,那么零食品牌对他进行投放是比较有效的;如果他的视频经常出现可乐,那么可乐品牌对他进行投放就可以说是非常精准了。
这个过程听起来似乎简单,但要依靠人力对浩如烟海的视频进行归类和分析,几乎是不可能的。即便今天已经有了深度学习技术,实践起来依旧有着不小的挑战。
最显而易见的问题就是数据量太大,
仅仅快手单个平台的库存短视频数量就已经超过了80亿条,达到了PB量级的视频处理需求。
而且视频画面的背景非常复杂,需要识别的目标非常多样,logo在视频画面中的尺寸也很小。要在识别速度和识别准确率之间寻找平衡,对算法和算力都提出了非常高的要求。
这件事情放在别的企业非常难实现,但对微瑞思创的首席数据科学家司苏沛来说却要轻松的多。