专栏名称: CTO肉饼
robbin是前JavaEye网站创始人,现在是丁香园CTO。如果你是技术人员,正在创业或者希望加入创业,关注互联网产品、研发、运营、创业管理,请关注我。
目录
相关文章推荐
晚点Auto  ·  晚点对话何小鹏:我的造车血泪史 ·  21 小时前  
晚点Auto  ·  晚点对话何小鹏:我的造车血泪史 ·  21 小时前  
百车全说  ·  集合!刀客们~快来三刀的朋友圈玩 ·  昨天  
玩车教授  ·  教授说车 | 沉浸式体验方程豹 豹8! ·  4 天前  
51好读  ›  专栏  ›  CTO肉饼

马斯克给全球人民送大礼包了!

CTO肉饼  · 公众号  ·  · 2024-03-18 19:12

正文


3月17号凌晨,特斯拉的创始人马斯克给人工智能行业送上了一份大礼包。他将自己旗下的x.ai开发的大模型Grok彻底开源了。模型训练代码和连训练好的大模型的参数都开源了。Grok这次开源后,大家发现它是一个拥有3,140亿参数的大模型,而且是一个混合专家模型。不少先进的大模型,例如GPT-4还有Mistral都是混合专家模型,而且,3,140亿参数的开源大模型是目前参数量最大的一个开源大模型了。遥遥领先于Llama 2的700亿参数量。相比GPT-3的1750亿参数也要大的多。



当然,这个开源的大模型只是一个裸模型,它是在2013年10月份完成预训练的,但并没有针对特定任务做微调和优化。所以你下载这个Grok的模型之后,要用它做事情的话,还需要你自己还要继续做指令微调和针对特定任务的微调,最后还需要通过强化学习,才能作为对话式的AI来使用。所以不是你下载下来,就开箱即用的。还是需要相当有实力的AI团队基于这个裸模型做很多工作投入才行。







请到「今天看啥」查看全文