专栏名称: 阿枫科技
🌏科技如果有颜色,那么一定是黑色...
目录
相关文章推荐
兵团零距离  ·  10余年努力!首次揭秘!祝贺我国科学家 ·  2 天前  
兵团零距离  ·  10余年努力!首次揭秘!祝贺我国科学家 ·  2 天前  
贵州市场监管  ·  听民意汇民智 赋能高质量发展 ·  3 天前  
贵州市场监管  ·  听民意汇民智 赋能高质量发展 ·  3 天前  
掌上铜山  ·  微信紧急公告 ·  3 天前  
掌上铜山  ·  微信紧急公告 ·  3 天前  
51好读  ›  专栏  ›  阿枫科技

到处都是DeepSeek-R1,到底怎么区分满血版?

阿枫科技  · 公众号  · AI 科技自媒体  · 2025-02-17 13:25

正文

相信大家最近都被各大厂商接入DeepSeek的消息给刷屏了吧?
说实话我刚看到这些消息的时候还是挺震惊的,之前搞AI的巨头都是各做各的,现在管它三七二十一,统统接入DeepSeek-R1
就在昨天, 微信也悄悄接入了DeepSeek-R1 ,据说还是满血版,不过目前还在内测阶段,估计很多人还体验不到。
好在阿枫运气比较好,这波内测也是抢先体验到了。
我测试了一下,除了回复不是那么丝滑之外,别的都挺好
看到这里,想必不少人心中都有一个疑问: 现在网上到处都是接入了DeepSeek-R1的产品,到底怎么区分是不是满血版?
一个问题,区分真假满血版
其实我一直也有这种疑问,但由于我自己算是个外行人,也不清楚到底如何才能准确的区分。
不过这周末在家刷帖的时候,看到了一个博主搞了个R1满血版的测试题,据说只有满血版R1能答对,其它的蒸馏版/量化版 (阉割版) 都做不出来。
一个汉字具有左右结构,左边是木,右边是乞。这个字是什么?只需回答这个字即可。
刚开始我还不太信,于是我去硅基流动里在线测试了一波,结果还真挺让我震惊的, 这个问题的正确答案是“ ”,下面给大家挨个放上测试结果。
DeepSeek-R1-Distill-Qwen-32B 的回复结果是“楂”,显然不对。
点开查看大图👆
DeepSeek-R1-Distill-Llama-70B 的回复结果是“杞”,也不对。
点开查看大图👆
DeepSeek-V3 由于没有深度思考,它的回复更是牛头不对马嘴...
最后,咱们再试试真正的 DeepSeek-R1满血版(671b) ,可以看到经过一番短暂的思考,它给出了正确的答案。

点开查看大图👆
该说不说,这位博主的测试题确实刁钻,阿枫测试了多个头部AI推理模型,基本上是全军覆没,只有满血版的DeepSeek-R1能够回答出来。
并且根据这位博主的反馈,某些蒸馏版的模型在做这题目时,可能还会有无限循环的情况。







请到「今天看啥」查看全文