我 相 信 这 么 优秀 的 你
已 经 置 顶 了 我
翻译|王一丁 选文|小象
转载请联系后台
2016 年 11 月,Google 发布了一款名为 Quick,Draw!的可爱小游戏,在Google的AI实验网站上,它为参与者展示了有趣又不寻常的AI实验。Quick,Draw!让参与者在20秒或更短的时间完成描画物品的挑战,从网球拍和酒杯到瑜伽和蒙娜丽莎,这个项目是为了推进机器学习研究。
从小游戏发布至今,已有 1500 万人画了出了 5000 万张图纸——是世界上最大的涂鸦数据集,此数据集现在可供研究人员,艺术家和设计师使用训练算法使用,比如这套数据可以对一只胳膊和一个回旋镖进行区分。https://quickdraw.withgoogle.com/data 是这个项目的官网,在里面可以通过滚动浏览展示这些图纸。网站本身就非常让人愉悦,并且可以看到具体的物品是如何展示一些共有的物质。
许多以电子为主题的涂鸦,以“立体声”为例。几乎所有在 Quick,Draw!中绘制立体声的人是通过画一个盒子然后再在里面画了两个圆圈来表现,比起现代立体声更像上世纪八十年代的狂潮箱。“耳机”也是很有趣的——虽然现今具有两个耳塞的耳机更加普及,但大多数图纸都有两个圆圈之间的线条,也正是老式(或防噪音)耳机的特征。绝大多数“电视”的图像上都有两条天线——你最后一次看到这样的电视是在什么时候呢?
这提醒人们,文化表现往往要跟随技术的脚步。一个老式的天线电视的形象相较于今天很多家庭中。类似的情况在表情符号上也有体现-——有 11 个单独的表情符号与邮寄信件有关,但其中只有一个是关于发送电子邮件的。事实证明,电视的表情符号是一个带拨号盘的老式真空管箱。机器学习算法可能只会学习识别上世纪五十年代电视机的图纸。但是,尽管不同的涂鸦很有趣(可以在网站里查看“胡须”图纸),就 Google 如何使用用户数据我们产生了疑问。从某种意义上说,玩家可以免费为 Google 创建此数据集。当记者询问 Google 如何计划使用这些数据时 Google 发言人回避了这个问题。
Quick,Draw!及其数据集似乎是无害且有趣的,但两者的存在提出了一个更大的问题:用户在公司仍在继续推动着一个算法管控一世的世界的时候,免费为如 Google 这样的公司创建的数据会被如何使用?
王一丁
计算机软件,水过ACM和数学建模,但爱文字胜于代码。现在某地方政府,为人民服务中。有意转向数据方向,没事刷刷Coursera。