专栏名称: 顶尖架构师栈
分享业务架构、技术架构、系统设计方案,以及微服务架构源码,提供业务场景答疑
目录
相关文章推荐
掌中淄博  ·  孙颖莎,王楚钦传来喜讯! ·  18 小时前  
掌中淄博  ·  孙颖莎,王楚钦传来喜讯! ·  18 小时前  
现代快报  ·  祝贺!王楚钦夺得WTT重庆冠军赛男单冠军 ·  昨天  
现代快报  ·  祝贺!王楚钦夺得WTT重庆冠军赛男单冠军 ·  昨天  
河北青年报  ·  她突然宣布退出 ·  昨天  
河北青年报  ·  她突然宣布退出 ·  昨天  
51好读  ›  专栏  ›  顶尖架构师栈

Claude 3.7来了!这个混合推理模型把代码能力拉满!

顶尖架构师栈  · 公众号  ·  · 2025-02-25 10:19

正文


大家好,我是易安,AI超级个体。
早上醒来翻开手机,发现朋友圈被Claude 3.7刷屏了!昨晚Anthropic悄然放出大招,发布了Claude 3.7 Sonnet。这并非大家期待的Claude 4.0,而是一款独创的混合推理模型,特别是在编程能力上直接拉满。作为一位资深的程序员AI玩家,我第一时间研究了一番,这里分享我的第一手体验和思考。


一觉醒来,AI又变天了


最近AI圈实在太卷了,OpenAI的o1、马斯克的Grok 3、国内的DeepSeek,几乎每周都有新模型出来。Claude 3.7 Sonnet的出现再次让我惊叹AI进化速度之快。

它最大的亮点是什么?"混合推理"设计。简单说,它把普通聊天和深度思考两种能力融合在一个模型里:


日常对话时,它就是更强的Claude 3.5,秒回信息;当你遇到复杂编程问题、数学计算或需要深入分析时,切换到"扩展思考模式",它会像人类专家一样展开推理,深入思考后再回答。


这很符合我们人类的思考模式,有时快速应对,有时深入思考。十多年编程经验告诉我,这正是开发中最需要的 —— 简单问题快速解决,复杂问题深入思考。


代码能力简直离谱

身为程序员,最让我兴奋的是它在编程方面的巨大飞跃。SWE-bench测试(测GitHub真实问题)得分达到70.3%,比上一代提高了整整20个百分点!


这不是PPT里的数字,而是实打实的编码能力。多家顶尖开发工具已经给出反馈:



  • Cursor说它是真实编程场景的最佳选手,处理复杂代码库远超对手
  • Replit发现它能从零搭建完整Web应用,而其他模型常常半途而废
  • Canva团队认证它写出的代码不仅能用,还很优雅,直接可上生产

这才是我们开发者真正需要的能力——不是解竞赛题拿高分,而是能帮我们解决日常开发中的实际问题。


终端里的AI拍档

更让我眼前一亮的是,Anthropic同步推出了Claude Code命令行工具。作为命令行爱好者,这简直是为我量身定做。


它能干什么?想象下班前遇到个棘手bug,你只需在终端里描述问题,它就能:



  • 自动搜索分析整个代码库
  • 找出问题并直接修改文件
  • 生成测试确保修复有效
  • 一键提交到GitHub

内部测试显示,一些通常需要45分钟的开发任务,用Claude Code几分钟就能搞定。特别是那些繁琐但必要的工作:写单元测试、重构老代码、调试复杂问题,效率提升明显。


我已经能想象它如何改变我的工作方式。早上来杯咖啡,先让Claude Code梳理昨天遗留的问题;下午专注核心架构设计时,它可以处理周边的测试和文档工作。








请到「今天看啥」查看全文