专栏名称: 程序员小灰
一群喜爱编程技术和算法的小仓鼠。
目录
相关文章推荐
直播海南  ·  陵水通报游客划桨板被恶意驱赶 ·  昨天  
直播海南  ·  恭喜!他们结婚了! ·  2 天前  
直播海南  ·  春节期间,他们因这事被拘留! ·  3 天前  
51好读  ›  专栏  ›  程序员小灰

人类程序员要被取代了?世界上第一位AI程序员Devin问世!

程序员小灰  · 公众号  ·  · 2024-03-16 10:58

正文

程序员会被人工智能取代吗?

这个问题早在十几年前就开始被人讨论。 那时候,小灰觉得这只不过是在杞人忧天。而 如今,这一切已经无限接近现实。

前两天,有 一家名为 Cogni tion的10人初创公司宣布,他们研发出了 世界上第一位AI程序员Dev in。 此消息一放出来,立马刷 爆了全网!

好家伙,世界上第一位AI程序员Devin诞生,程序员这一下子职业不存在了?


Devin的“本领”

只需给Devin一句指令,Devin就可端到端地处理整个开发项目!而且 Devin 不会生病,不会请年假,不会跟你发牢骚。

不仅如此,在SWE-bench基准测试中,它无需人类帮助,可解决 13.86% 的问题。

相比之下,GPT-4只能处理1.74%的问题,且都需要人类提示告知处理哪些文件

在这里给大家简单普及一下,SWE-bench基准测试是什么?


SWE-bench是一个要求AI智能体解决开源项目(例如Django和scikit-learn)中实际GitHub问题的测试。

可以说,Devin解决代码问题的能力远远超过了此前所有AI大模型!

从零构建网站、自主查找并修复Bug、甚至是训练和微调自己的AI模型通通都不在话下~也可为一些成熟的代码库做贡献。

据介绍,它 已经成功通过一家AI公司面试 ,Cognition的开发者You还试着在全球最大的综合类自由职业平台Upwork上,为Devin提供真正的工作。

Devin能有多厉害?

1.端到端构建和部署程序

Devin可以帮我们解决的不只有是代码,还包括与之相关的整个工作流。

比如,当我们需要设计一个网页游戏时,Devin不仅能生成网页,还能直接完成服务端的部署,然后直接发布上线,省去了中间的人工操作。

只需要告诉Devin,我们想做一个个人网站,里面运行一个Devin定制版的生命游戏。

接着,Devin就会按照自己设计的这个清单开始编写代码,然后部署服务……
最终完成全部工作之后,一个即点即玩的游戏链接就呈现在了我们面前。简直不要太神奇!


2.自主查找并修复bug

不仅能一气呵成完成开发部署,Devin对代码的debug能力也是一流。

开发者给Devin一个GitHub链接,让它先熟悉项目情况,然后准备数据进行测试。

接着,Devin就会按部就班地编写测试用的程序并准备好有关数据,然后运行。
结果,在开发者已经发布的完整项目之中,Devin还真的找到了连开发者自己都没有发现的漏洞。

发现漏洞之后,Devin会回溯报错出现的位置及对应的数据,然后分析原因并给出解决方案。


最终经过调试,程序的bug被成功修复,完美通过了测试。

3.训练和微调自己的AI模型

除了这些一般的程序或项目,作为一个全能型AI助手,Devin还有能力帮助人类训练和微调其他AI。

对于一些常见的模型(比如示例中的Llama),用户只需要在promot中提及模型的名称,Devin就直接知道要训练哪个模型。

而在这个示例中,微调的具体方法(QLoRA)是以GitHub链接的形式输入给Devin的。

接到指令后,Devin还是像处理平常的程序一样边规划边执行,所需环境和依赖,还有模型本体,都会自动下载安装。


这些准备都完成之后,微调工作就会有条不紊地进行,而且其中的状态可以实时监控。

Devin的酷炫功能不仅如此还有很多很多...简直和活生生的程序员没有两样,而且人家不抱怨996,你说气人不!

Devin要怎么使用?

很遗憾,查看了官网,Devin已经真的是“程序员”,是一个活生生的人了, 而不是供大家随意使用的工具,官网对Devin的称呼都变成聘用Devin了。


不过,小灰经过多方面调研,终于找到了一个网址,大家可以体验一下Devin的本领。体验方法附在文末。

那么,怎么证明我们使用的是真正的Devin程序员呢?我们来问一问他:








请到「今天看啥」查看全文