专栏名称: CTO肉饼
robbin是前JavaEye网站创始人,现在是丁香园CTO。如果你是技术人员,正在创业或者希望加入创业,关注互联网产品、研发、运营、创业管理,请关注我。
目录
相关文章推荐
新浪科技  ·  #OpenAI思维链并非原生#【#GPTo3 ... ·  昨天  
新浪科技  ·  【#华为小艺助手接入DeepSeek#,此前 ... ·  3 天前  
51好读  ›  专栏  ›  CTO肉饼

Mistral暴露野心:不再开源了吗?

CTO肉饼  · 公众号  ·  · 2024-03-03 16:44

正文

法国的开源大模型Mistral终于从开源的小模型走向商业化了,但这次不开源了。



Mistral赖以起家的是70亿参数的开源小模型,随后再接再厉搞出来了MoE混合专家模型,也号称小型的GPT-4,但这些都是开源的。


如今Mistral为了赚钱,也开始推大模型了,而且一推就是三个大模型,具体参数量没透露,反正就是:Mistral small, medium和large。尤其这个Large的模型,评测的数据好的异乎寻常,可以说仅次于GPT-4的水平。



MMLU测评,也就是海量多任务语言理解能力,远远超过了Google的Gemini和脸书的Llama 2。


而且可以看得出来,Mistral的三个商业版本的测评数据都比原先开源版本要好:



即便是最小的Mistral商业版本,也要超过开源的MoE专家混合模型了。而最大尺寸的Mistral显然遥遥领先了。


最后Mistral还高调宣布和微软公司达成合作伙伴关系,在微软的Azure云上推广Mistral的AI服务。话说微软真的是精明啊,一方面和OpenAI紧密合作,另一方面也不放弃任何可能的AI厂商,Azure云上不光跑GPT的大模型,还能提供Llama 2开源模型,现在连Mistral也有了。







请到「今天看啥」查看全文