专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
目录
相关文章推荐
防骗大数据  ·  妈!你还在跟着炒股导师赚钱吗? ·  昨天  
城事导航  ·  男子连续开车10小时,差点截肢! ·  昨天  
中国安全生产网  ·  2月!这些安全新规标准开始实施 ·  3 天前  
51好读  ›  专栏  ›  新智元

GPT-4o mini实力霸榜,限时2个月微调不花钱!每天200万训练token免费薅

新智元  · 公众号  ·  · 2024-07-26 11:22

正文



新智元报道

编辑:桃子
【新智元导读】 Llama 3.1 405B巨兽开源的同时,OpenAI又抢了一波风头。从现在起,每天200万训练token免费微调模型,截止到9月23日。

Llama 3.1开源的同一天,OpenAI也open了一回。

GPT-4o mini可以免费微调了,每天畅用200万训练token,限时2个月(截止9月23日)。

收到邮件的开发者们激动地奔走相告,这么大的羊毛一定要赶快薅。

另一边,GPT-4o mini在大模型竞技场LMSYS排名也出来了。

总榜单中,GPT-4o mini与GPT-4o并列第一。

Altman本尊激动地表示,我从未对任何一次评估如此兴奋过,GPT-4o mini与GPT-4o性能如此接近,而价格仅有其1/20!

同时,他表示,GPT-4o mini的微调现在上线了。

OpenAI能把如此强大的模型,放出来让大家免费用,实在是出人意料。

网友一度以为,这可能是最高级的钓鱼邮件。

每天200万token,GPT-4o mini免费微调


邮件中,OpenAI宣布现正式推出GPT-4o mini微调功能,为的是让最新小模型在特定用例上,表现更加出色。

7月23日-9月23日期间,开发者们每天可以免费使用200万训练token。

超过的部分,将会按3美元百万token收费。

到了2个月免费使用截止后,微调训练也将按照3美元百万token收费。

此外,OpenAI在邮件中给出了,每个人值得从GPT-3.5 Turbo切换到GPT-4o mini的原因:

- 更实惠:GPT-4o mini的输入Token费用比GPT-3.5 Turbo低90%,输出Tokens费用低80%。即使在免费期结束后,GPT-4o mini的训练成本也比GPT-3.5 Turbo低一半。

- 更长的上下文:GPT-4o mini的训练上下文长度为65k Token,是GPT-3.5 Turbo的4倍,推理上下文长度为128k Token,是GPT-3.5 Turbo的8倍。

- 更聪明且更有能力:GPT-4o mini比GPT-3.5 Turbo更聪明,并且支持视觉功能(尽管目前微调仅限于文本)。

最后,邮件中还提到,GPT-4o mini微调功能将向企业客户,以及Tier 4和Tier 5开发者开放,未来将逐渐扩大访问权限,扩展至所有级别的用户。

想要动手操作的小伙伴们,OpenAI已经放出了微调指南,可参见:

https://platform.openai.com/docs/guides/fine-tuning/fine-tuning-examples

一部分网友对此并不看好,他们正在保存我们的数据,来训练和改进AI模型。

「又名,把你的私人数据给我,我会收你很少的钱」。

网友用例


拿到资格的网友,已经迫不及待上手测试了。

开发者使用《经济学人》风格的头条数据集,对gpt-4o mini进行了微调。

然后,他比较了gpt-4o、gpt-4o min原始模型和微调后的模型在生成头条方面的表现。

小模型霸榜,堪比GPT-4o


GPT-4o mini发布一周后,在大模型排行榜中的成绩终于出来了。

共收到了4K+用户投票,GPT-4o mini小模型直接攀升至榜首,与GPT-4o并列第一。

最最重要的是,便宜20倍!

这对于众多开发者来说,是个好消息,能够以更低的成本,搭建更强大的应用。







请到「今天看啥」查看全文