美国多位官员表示,已经对DeepSeek开展国家安全调查。这事最坏的结果就是DeepSeek的网站和APP在美国被封禁,但也侧面说明美国那边确实觉得DS是一个竞争力的对手。
我这几天也迷上了AI大模型,打算在自己电脑上用DeepSeek搞一个本地的AI小助手,辅助我写量化策略。
正好了解了一些关于DeepSeek信息:
1. DeeSeek完全使用华为910B芯片训练。这条大概率是谣言,幻方的大模型用的是英伟达显卡,华为910B目前兼容性没那么好。
2.DeepSeek通过GPT回答生成数据数据打底,叠加互联网数据和购买数据,共同训练出了基底模型,然后用这个基底模型,再进行数据蒸馏,训练出了V3和R1版本的大模型。
3.557万美元的成本,指的仅是蒸馏的成本。数据标注、基底模型训练、训练技术架构,这些成本都没算。
4. DeepSeek让模型自己和自己对抗,提升智力水平。这种方式的好处是可以不依赖高质量预料教学,解决了中文语料不足和语料质量差的问题。其实OpenAI也用对抗的方式训练模型,但用的是其他模型对抗,自己和自己对抗,是DS的创新方法。
5. 传言幻方在发布R1之前做空英伟达,赚了一大笔钱。这个不保真,但感觉有一定可能性,我专门看了下日期,他们特地在日本加息后才发布的R1。而且幻方本身就是做量化私募的,利用这个点操作盈利也合情合理。
6. DS是开源的,可以本地化部署,用英伟达3060显卡就可以跑,显卡越好可以用的模型版本就越高。我学了一下,部署起来挺简单的,还能构建自己的知识库,比如我是做量化的,我可以把我量化的资料喂给模型,模型就能辅助我写策略。以后肯定越来越多的传统企业会去本地化部署DS大模型,比如智能客服,太顶用了,成本也不高。
我觉得这事长远来说真不一定利空英伟达,因为大模型的成本降低后,需求肯定会上来,从而反向带动英伟达显卡销量。未来很多小公司都本地化部署自己的大模型,各行各业都会需要显卡。还有就是,未来大模型有可能会装进手机和电脑里,这能带一波硬件更新。
我今年就打算买一张5090显卡,在自家电脑上部署大模型,把我的量化策略都喂给他,以后用它辅助我写策略,甚至可能可以给我一些新的思路。
像我这样想法的人肯定会越来越多,畅享一下,以后各行各业的打工人,为了提高工作效率,都会本地化部署大模型,本地化部署的好处一个是数据只在自己电脑上,隐私好;另一个是可以定制化,只为自己服务,相当于自己的私人小助手。