专栏名称: Python程序员
最专业的Python社区,有每日推送,免费电子书,真人辅导,资源下载,各类工具。我已委托“维权骑士”(rightknights.com)为我的文章进行维权行动
目录
相关文章推荐
Python爱好者社区  ·  推荐我的抖音变现俱乐部! ·  3 天前  
Python爱好者社区  ·  张雪峰公司今年的年终奖... ·  3 天前  
Python爱好者社区  ·  推荐我的抖音变现俱乐部! ·  5 天前  
Python爱好者社区  ·  120道Python面试题.pdf ... ·  6 天前  
Python爱好者社区  ·  吴恩达,yyds ·  4 天前  
51好读  ›  专栏  ›  Python程序员

这只拒绝内卷的 AI 狼火了!高智商却自暴自弃,不想抓羊只想躺

Python程序员  · 公众号  · Python  · 2021-04-01 08:10

正文




新智元报道

来源:B站等 编辑:Yaxin

【导读】 近日,一个狼吃羊的AI火了!在一个狼吃羊的AI智障游戏中,狼发现自己吃不到羊,直接选择了「自杀」。然而,狼选择撞石的原因竟是「自杀分数高」!


智障AI狼最近火了!

在一个狼吃羊的AI游戏中,狼发现自己吃不到羊,而选择了「自杀」。

那么,狼为啥会选择直接撞死呢?

傻狼选择「自杀」,只因人间不值得!


近日,微博上一位网友@二雨TR最近发文称,听我老师给我讲他搞游戏ai的事情笑死我了。

在他发布的这三张聊天记录截屏中,具体介绍了这个狼抓羊的游戏机制。


从截图中可以看出,狼选择撞石的原因竟是,「自杀分数高!」

在这个项目中,研究人员给设定了狼吃羊游戏的基本原则是,狼在20秒内得分越高越好,而羊在20秒内存活时间越长得分越高。

开局两只狼,还有六只羊,地图上红色带×的字符就是狼和羊随机出现的可能位置。

狼和羊前面有6根射线,是用来感知范围。当这6根线和障碍物以及地图边界碰撞,就会返回一个坐标。

那根坐标白线便是狼和离它最近羊的连接,这样狼就可以每次优先吃掉最近的那只羊。

在研究人员开始训练的最初阶段,先固定了羊的位置,让狼去学习抓羊。

在狼学会抓羊后,羊也以随机的位置出现在游戏中。

狼抓到羊,奖励10分

狼撞到障碍物,扣1分

为了节省狼抓羊的时间,每秒钟狼都会受到0.1的惩罚

其中,羊撞到石头不会死,只要存活时间长,羊就能得到高分。

如果这两只狼想要在20秒以内得到高分,需要狼吃到羊的数量越多越好,吃羊所用时间越短越好。

在研究人员进行了20W次的训练,竟发现狼抓羊的效果越来越差。

大多数情况下狼基本吃不到羊,而且在抓羊的过程中浪费的时间也被扣分,干脆就选择撞死了!

该项目的一位研究人员@Sdust星尘研表示,「之所以会自杀, 是因为狼在前几万次的训练中发现一头撞死只扣-1.1分(-1 + -0.1)。

往羊那边走两步撞死扣-1.1到-2.4分。

偶尔一次能吃到,虽然正分,但是不值得」。

狼是打工人,羊是永远达不到的升职加薪


这只蠢狼已经在微博、知乎、豆瓣等各大平台上火出了圈。

网友们从狼抓羊的身上看到了自己。

那只狼不就是现在的我么!

狼就是打工人…每秒扣的是青春和时间,羊是永远达不到的「升职、加薪、迎娶白富美、走上人生巅峰」,撞石头就是躺平摸鱼…

还有网友表示,「AI训练告诉你,为什么现在的年轻人都不愿意努力了」。

奖励机制不合理


有网友对这一项目的奖励机制设置是否合理提出了质疑。

还有网友认为,单步惩罚太大,而撞障碍物的惩罚太小,应该把奖励函数设置为,撞到障碍物的惩罚无穷大,那么狼就知道了撞石的代价,就不会轻易选择自杀了。







请到「今天看啥」查看全文


推荐文章
Python爱好者社区  ·  推荐我的抖音变现俱乐部!
3 天前
Python爱好者社区  ·  张雪峰公司今年的年终奖...
3 天前
Python爱好者社区  ·  推荐我的抖音变现俱乐部!
5 天前
Python爱好者社区  ·  120道Python面试题.pdf ,完全版开放下载
6 天前
Python爱好者社区  ·  吴恩达,yyds
4 天前
吃喝玩乐新分类  ·  看看别人家的阳台,这样弄简直多出一间房!
8 年前
质化研究  ·  18小时从零掌握Python网络爬虫
7 年前