主要观点总结
文章介绍了阿里Qwen团队发布的推理模型——深度思考 (QwQ),其与DeepSeek-R1的对比,以及DeepSeek的技术架构优化情况。文章还提到了其他云市场的情况,以及深度思考模型的功能和特点,包括支持联网搜索、生成图片和视频等。
关键观点总结
关键观点1: 阿里Qwen团队发布的新推理模型深度思考 (QwQ)
深度思考是基于Qwen2.5-Max的推理模型,擅长数学理解、编程、AI智能体等。它支持联网搜索,并且不卡顿。
关键观点2: DeepSeek-R1与深度思考 (QwQ)的对比
两者都擅长解决数学和推理问题,并展示思考过程。但深度思考在生成答案质量方面还有待提升,目前还是一个预制版本。
关键观点3: DeepSeek的技术架构优化
DeepSeek进行技术架构升级优化,以解决繁忙次数过多和联网问题。优化后,其体验有所提升,但偶尔仍会宕机。
关键观点4: 其他云市场的情况
其他云服务商如腾讯、百度、华为等在AI领域有不同的发展战略。腾讯和百度拥抱DeepSeek更为深刻,而华为不涉及C端AI入口应用。
关键观点5: 深度思考模型的功能和特点
深度思考支持生成图片,后续还会支持生成视频。这是一个多模态大模型,功能上更加健全。
正文
一早醒来就看到个大消息——
阿里Qwen团队今日宣布在Qwen Chat发布了推理模型——深度思考 (QwQ) 。
在我理解中,这其实就是阿里对标
DeepSeek-R1的大模型产品。因为
这是一个基于Qwen2.5-Max的推理模型,更加擅长数学理解、编程、AI智能体等。DeepSeek-R1也是擅长解决数学和推理问题。
和DeepSeek-R1表现出来的产品心态,一模一样。
更重要的事,经过测试我发现,深度思考 (QwQ) 不仅支持深度思考,还支持联网搜索。并且,不卡顿。
其实,DeepSeek-R1现在最大的痛点有两个。第一总是繁忙,根本没办法实现多轮对话,除非你有耐心每次提问中间都能等一个小时。第二,联网基本不给你答案。
昨天我看到
凤凰网科技发了个报道,说DeepSeek繁忙次数变少了。原因可能是因为
DeepSeek又进行了技术架构升级优化。
有接近DeepSeek的人士对凤凰网科技表示,
“DeepSeek没有特别限制过,但之前可能是资源不太够”
,对于近期DeepSeek繁忙次数变少,系DeepSeek官方团队
仍在进行技术架构优化,使得较少资源情况下仍能支持广泛用户使用。
我去试了一下,确实如此,
DeepSeek繁忙的次数确实变少了,而且联网也能给出答案来,体验非常不错。不过,偶尔还是会宕机……
阿里的深度思考 (QwQ)
,
我测试了一下,虽然说支持联网,也不卡顿,但是生成的结果确实比不过
DeepSeek。
不过,现在的
深度思考 (QwQ)还是一个预制版本,现在还在更新中,等正式版本发布后,生成的答案质量大概率会提升。
大家看到这个行业趋势了吗?从整个云市场来看,腾讯和百度拥抱
DeepSeek最为深刻,腾讯元宝直接融合上线了
DeepSeek,百度的文小言也上线了DeepSeek来辅助做题——用户不能直接使用。
华为云、火山引擎、阿里云等等其他几家基本的态度还是蹭热度来推自家的云计算产品。在C端,基本不涉及DeepSeek。
华为不涉及可以理解,毕竟本身就没有做C端的AI入口应用。火山也是,并没有推出C端的个人应用。阿里是有的,但是为啥不融合DeepSeek呢?现在答案明了了,因为阿里正在做对标DeepSeek的深度思考模型了。
其实阿里在大模型领域一直很强势,尤其是在开源市场长期是中国大模型第一的存在。而这次的深度思考 (QwQ) ,我相信最终产品出来也不会太差。