雷锋网按:百度搜索在近日推出了基于人工智能技术的 “情人节用脸撩,开启桃花运” 功能,迎接情人节。
用户在百度搜索 App 中需用语音说一句 “开启桃花运” 即可进入主题页面。该页面包含两大核心功能,一个是 “自拍撩汉 / 妹指数”,另一个则是输入姓名和地名自动生成专属诗歌。
颜值打分原理
第一个颜值打分功能其实较为常见,虽然百度尚未对其进行详细介绍,但雷锋网了解到常见的基于监督学习颜值算法大致原理如下:
首先选择一组人脸特征:如眼间距、肤色、眼睛、鼻子、嘴巴尺寸等等,随后建立人脸识别算法,给定一张人像可自动计算上述人脸特征。采集大量人脸样本,人肉标记每张脸的颜值得分,然后向量化用 SVM 等方法建立模型。
随后需将带有颜值得分的人脸样本随机分成 1、2 两组,用 1 组图片经过特征提取来训练机器学习算法,进行调参,使得算法输出的分值尽量接近人工打分的结果。并用 2 组图片进行验证,看看算法对不包含在 1 组中的图片是否能正确计算出结果。
训练结束后即可用来给人像打分。
诗歌生成原理
目前市场上不少 AI 文学创作产品自于预设的文本模板。百度则是将大量诗歌作品数据进行训练,通过主题规划模型弥补诗句与主题关联性偏移等问题。
那么何为主题规划模型?根据百度官方介绍,主题规划模型是在理解用户 query 意图的基础上,对每一句诗的子主题进行规划,从而实现了对整首诗主题的把控。例如,用户 query 为 “西湖”,模型规划的子主题可能是 “断桥”、“烟雨”、“江南” 等等。
百度诗歌生成系统把写诗以模拟写对联的方式去进行文本输出,根据前一句诗生成下一句诗。这种用联诗方式生成的诗歌,容易发生词藻堆砌的情况。但利用主题规划模型,能在一定程度上避免这种情况。经过测试后发现,AI 生成的诗歌前后句的关联性表现确实不错。
上周,雷锋网在现场跟进百度副总裁王海峰 AAAI 的演讲时,他提到百度两步生成中国诗歌的方法:
首先对每一行诗的主题进行规划,然后进行具体诗句的生成。
举个例子,如果用户想要写一首和春天有关的诗,那么诗歌规划模型就会首先生成一个内容概要,包括春天,桃花,燕和柳这四个主题,然后由 RNN 模型根据这四个主题生成四句诗,来完成整首诗歌的创作。
在下面展示的这三首诗中,中间这首是由 AI 诗人完成的,而其他两首的作者都是中国古代诗人(白居易, 刘因)。王海峰说到,多数人都无法分辨出这三首诗中到底哪一首出自 AI 诗人之手。历史学者和《中国诗词大会》嘉宾蒙曼教授也说到 “这个人工智能诗人是诗坛小超人,能和人类诗人一样在诗中表达感情色彩。”
随着 AI 技术的门槛逐渐减低,可以预见未来越来越多的企业可以通过人工智能技术策划相关的主题活动供用户娱乐和互动。