专栏名称: 吴师兄学算法
和程序员小吴一起从初学者的角度学习算法,以动画的形式呈现解题的思路。每周四篇原创文章,期待你的鉴赏!
目录
相关文章推荐
武汉大学  ·  百亿票房男主现身武大(bushi) ·  5 天前  
兰州大学萃英在线  ·  校园安全,“救”在身边——兰州大学学生应急救 ... ·  2 天前  
兰州大学萃英在线  ·  深度求索DeepSeek:当开源AI叩响象牙塔之门 ·  2 天前  
浙江大学  ·  今天14:30后,浙大等你查分! ·  3 天前  
武汉大学学生会  ·  促进交流互鉴,凝聚服务合力——记武汉大学学生 ... ·  2 天前  
51好读  ›  专栏  ›  吴师兄学算法

用脚本帮同学自动生成文章观后感后,这名大四学生火了...

吴师兄学算法  · 公众号  ·  · 2020-03-31 12:15

正文

点击关注上方“ 五分钟学算法 ”,

设为“置顶或星标”,第一时间送达干货。

转自大数据文摘

同一个中国,同一个网课。

3 月 9 日,全国大学生共同上了一堂 疫情防控思政大课 ,这可能是中国参与人数最多的一次网课了。

据统计,参加此次网课的学生数量高达 4000 万,大量的涌入一度让直播平台陷入瘫痪。


看完网课之后,辅导员们也给听课的同学们留下了作业,写一篇观后感以加深大家的印象。


你的观后感写的怎么样?我给你推荐你个网站

全国大学生收到同一份作业的情况也是实属罕见,年轻人打招呼的方式也变成了:“你的观后感写完了吗?”

可能是因为疫情在家,大家太长时间没有动笔写过东西,突然要写观后感还有点不适应。这时候, 一个网站出现在了大家的视野中 ,网站界面十分简洁,左上角是标题,“防疫大课堂观后感生成器” 十个大字点明了网站的功能,中间 “再给我整一篇” 的按钮的作用也很直接。


一键按下,一篇五六百字、像模像样的观后感便诞生了!


文章后面还贴心的附上截图一张,用过的大学生都说,“我自己写也就这水平”、“爱了爱了”。


5 天之内,这个观后感生成器已经帮助了共有 507338 位同学 ,生成了 1868839 次观后感 ,还收到了 一千多块钱的打赏 ,作者将打赏 全部捐给了韩红爱心慈善基金会

观后感生成器的前世今生

为了更加深入的了解这个神奇的网站,我们联系到了网站的作者,一位 江南大学的大四学生

问:你为什么想做这个网站呢?

答:程序员嘛, 只是想做一些有用的工具

当采访进行到这里,你大概也就知道了,这显然是一个 真正只关注技术的 “程序猿” !其思维方式也非常符合一位程序员的解决问题方式:出现问题 - 编写程序 - 解决问题 - 分享。

对于这个网站是如何实现自动生成观后感的功能,作者也表示,方式很 “简单粗暴”, 找了几十篇文章分解出了开头正文和结尾,每次随机组合一下就完事了

$head=rand(1,17);$str = file_get_contents("./head".$head.".txt");


最近也有不少大学生表示在家实在太无聊了,在微博大呼 “我要开学!”。



然而抗疫刚刚取得胜利,目前还有境外输入病例,一着不慎很有可能重蹈覆辙,所以目前还不是开学的合适时机,这场防疫大课堂既是对全国大学生的防疫教育,也是为了让大学生们能够进一步认清当前严峻的形势。


从胡编生成器到胡氏评论大赛,胡锡进本人参与

用技术手段进行有风格的文字生成,这位同学并不是第一位。最近,除了观后感生成器之外,GitHub 上还有一个 “胡编生成器” 项目也大火了起来,这也是继 “赵弹磁铁” 之后, 恶搞语言应用 的一位新成员。

从名字上大概就能猜出,胡编生成器是 以环球时报总编辑胡锡进的微博 为语料和原始数据制作的模型,首先我们还是先来看看效果如何:


熟悉胡锡进微博风格的人还是能一眼看出,生成器生成的文章不能再像胡锡进本人,从原始语料到一篇通顺的文章,这也要得益于胡锡进在微博坚持不懈的进行内容输出。

GitHub 指路:

https://github.com/menzi11/BullshitGenerator



早在胡编生成器之前,就有网友总结了 胡锡进的评论套路格式 :以形式遮蔽内容;消解意义;偷换目标;把稻草人批判一番;强抢功劳;模糊主次;打桌子哄孩子。

胡氏评论就是这样一种遇到新鲜事,第一时间生成评论发布,马上抢占舆论高地,赢取伟大胜利的评论形式。

如果还是不能理解胡氏评论的精髓,那就只好拿出 网友总结的评论格式模板 了:“近期互联网上出现了__________,老胡也看到__________,知道大家很__________,老胡忍不住啰嗦几句,虽然__________确实存在部分__________,但是__________,最后老胡呼吁__________”

胡编生成器这两天算是被网友玩坏了,这也惊动了胡锡进本人,甚至 在微博举办了一个胡氏评论大赛 ,玩得不亦乐乎。


看了胡锡进本人的 “参赛文”,你给几分?



去年风靡一时的 “狗屁不通文章生成器”

“胡编生成器” 的创作者称,胡编生成器的诞生,是基于去年年底风靡一时的 “狗屁不通文章生成器” ,只要 输入一句话,系统就会生成一篇万字长文 的神器。

好奇的文摘菌想知道输入 “防疫大课堂观后感” 会出现何种文章,于是...


没有对比就没有伤害,真的是 “狗屁不通”。


不仅出现了 车轱辘话 ,并且文摘菌也想知道 “防疫大课堂观后感,到底应该如何实现”。

再试一试输入这首非常洗脑的歌曲,看看有什么样的效果:


emmmm,翻来覆去就是那些句型。神器的作者也在 GitHub 表示,千万别当真,just for fun!


那么,这个文章生成器究竟是一个怎样的算法?作者在项目里写道:

鄙人才疏学浅并不会任何自然语言处理相关算法,而且目前比较偏爱简单有效的方式达到目的方式,除非撞到了天花板,否则暂时不会引入任何神经网络等算法。不过欢迎任何人另开分支实现更复杂,效果更好的算法,不过除非效果拔群,否则鄙人暂时不会融合。

看来作者也的确拥有一个有趣的灵魂。

那么有没有作者所说的更好的生成器,能够避免长篇大论下的 “狗屁不通” 呢?这就不得不提到 OpenAI 开发的著名的文本生成模型 GPT-2


一年之前,OpenAI 的新文本生成模型 GPT-2 掀起了一场不小的风波,在技术社区和社交网络引起广泛讨论。






请到「今天看啥」查看全文