华为DeepSeek与SiliconCloud联手推出基于华为云昇腾云的DeepSeek-V3和DeepSeek-R1模型,全球用户反响热烈。该国产大模型云服务平台提供Web端/手机端访问,价格优惠,并且多模态模型Janus-Pro-7B限免。此次合作展现了国产AI技术的实力,具有全国产、稳定推理服务、零部署门槛等特点。文章还介绍了使用体验和实测结果,以及合作背后的故事和更多细节。
平台首发上线了基于华为云昇腾云的DeepSeek-V3和DeepSeek-R1模型,Web端/手机端均可使用。
DeepSeek-V3和DeepSeek-R1模型的价格与DeepSeek官方优惠期价格保持一致,同时Janus-Pro-7B多模态模型限免。全球用户反响热烈。
得益于自研推理加速引擎和华为云计算资源的支持,硅基流动和DeepSeek模型取得了与国际顶级GPU模型相当的效果。提供稳定的、生产级的推理服务,并且零部署门槛。
用户可以在线体验模型服务,实测结果显示两个模型在响应速度上表现优秀,回答内容全面。开发者和应用开发者也给出了积极反馈。
SiliconCloud、华为和DeepSeek团队之间的紧密合作,共同推出了这一春节大礼包。合作背后得到了各方的全力支持和无私经验分享。
白交 衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
华为DeepSeek联手,全套国产——
国产大模型云服务平台SiliconCloud(硅基流动),首发上线了基于华为云昇腾云服务的DeepSeek-V3、DeepSeek-R1。
Web端/手机端均可用,价格非常便宜,春节期间还打折,目前使用成本如下:
这个价格与DeepSeek官方优惠期(截至2月8日24:00)价格保持一致。
与此同时,DeepSeek的多模态模型Janus-Pro-7B还限免。
消息一出,全球用户疯狂涌入,疯狂到用“爆”都难以贴切形容。
SiliconCloud创始人兼CEO袁进辉在朋友圈表示,这波全套国产带来的泼天流量,远比团队想象中的大得多——尽管他们的预期是建立在DeepSeek春节期间爆得有目共睹的基础上。
因此,官宣上线服务的第10个小时开始,SiliconCloud做出决定:
只能限流。
华为DeepSeek联手
经过华为云、SiliconCloud以及DeepSeek三个团队多日来的加班攻坚,国内用户迎来了这样一个春节大礼包!
此次联手主要具备以下几个特点:
1、全国产。得益于自研推理加速引擎加持,硅基流动和华为云昇腾云服务支持部署的DeepSeek模型可获得持平全球高端GPU部署模型的效果。
2、稳定的、生产级的推理服务。让模型能够在⼤规模生产环境中稳定运行,并满足业务商⽤部署需求。
3、零部署门槛,价格与官方优惠期保持一致。开发者开发应用时可直接调用 SiliconCloud API,使用起来很简单轻松。
除了开发者之外,用户也可以在线体验,免费的那种。
话不多说,咱们就进行一波实测。
在使用前接受一些基本参数设置,包括提示词、最大Token、Temperature等等。
也可同时选中两个模型进行一番对比。
大年初五迎财神可以干什么?
在响应速度上,两个都差不多,每秒15、16tokens输出。
从回答内容上看,V3比较直给,它直接罗列出来,有放鞭炮、打扫卫生、祭拜财神等。
R1考虑了用户背景、传统习俗、与现代社会的适应性、背后意义以及注意事项等。嗯,确实很全面。
用同样的问题问DeepSeek官方(深度思考模式),可以看到,在没有最大tokens的限制下,它输出的内容更多。
响应速度上面其实差不多的,给出的答案比较直接。
思考过程对比:
回答内容:
大家可以根据需求和使用体验自行选择。
但总而言之,国内开发者们可以放心用来开发各种各样地应用啦~
“部分成果会集成在华为软件包里给用户”
SiliconCloud官方推文表示:
无论是在昇腾上适配DeepSeek-R1&V3双模型,还是在此前上线其他模型的过程中,公司都得到了DeepSeek与华为云的大力支持。
袁进辉则在即刻和朋友圈透露了这次联手的更多消息。
譬如,这次合作,源于SiliconCloud员工的“突发奇想”:用国产卡,跑DeepSeek。
于是一拍即合,很快得到了华为方调配的充足资源,DeepSeek团队也“全程无私提供了很多经验”。
SiliconCloud、华为多条业务线、DeepSeek的同学们,就这么过了一个特别(忙)的春节。
他还在朋友圈回应,此次成果的一部分会集成在华为软件包里给用户。
与此同时,袁进辉也明确表示,现在只是一个初级成果,正持续提升使用体验中。
譬如一度出现的“R1触发深度思考概率有点低,发现是prompt和chat template问题,预计傍晚时能升级好”。
然后就真的在昨晚18点左右完成修复。
另一边,用起来的网友们已经有诸多反馈了。
即刻网友@葬爱咸鱼 表示,自己的使用体验和DeepSeek官方的没差。
另一名即刻网友@张翼轸 也在袁进辉的即刻动态下分享了自己的使用体验。
划重点:平台上R1速度体感超过了DeepSeek在Web端的速度,但同时有一些使用体验希望修正。
当然,由于主要是为开发者提供API服务,SilionCloud的playground只提供最基础的体验功能。
想要搭配使用V3、R1,还是需要调用API接口才能实现。
One More Thing
综观全球数据,DeepSeek现有2点特别值得关注:
第一,上线19天,DeepSeek日活达到1909万。
这个数据超过ChatGPT,意味着DeepSeek成为全球增速最快AI应用。
第二,DeepSeek-R1在City-Data的创意写作榜上拿下第一,终结了Claude霸榜7个月的局面。
而这个榜单上,同为推理模型的o1-mini排名22,o3-mini表现未入榜单。
试玩playground:
https://siliconflow.cn/zh-cn/models
参考链接:
[1]https://mp.weixin.qq.com/s/9AC5W4SjdWyFypnl3TBdUg
[2]https://mp.weixin.qq.com/s/sl_N-kjouq8NRK3kcdsaaQ
[3]https://x.com/ashfold/status/1885613592881619278
[4]https://x.com/teortaxesTex/status/1885593667206803579
量子位智库年终发布三大年度报告!
带你一起回顾2024年人工智能、智能驾驶、Robotaxi新趋势,预见2025年科技行业新机遇!
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!