专栏名称: AINLP

关注AI、NLP相关技术，关注算法研发职位和课程；回复"文章"获取历史信息；双语聊天机器人"无名"；中英翻译请输入：翻译翻译内容；自动对联，请输入：上联上联内容；调戏夸夸聊天机器人，请求夸、求赞；查询相似词，请输入: 相似词词条

微软公布OpenAI闭源模型参数！4o-mini 8B！

AINLP · 公众号 · · 2025-01-03 18:21

正文

大家新年好！祝大家新的一年薪资歘欻的涨，论文嗖嗖的发！

没错，就在前几天，Microsoft发布的arxiv里竟然写了OpenAI闭源的大模型的具体参数！（消息来自：xhs博主 Scarlett_WH）

论文：MEDEC: A Benchmark for Medical Error Detection and Correction in Clinical Notes
链接：https://arxiv.org/pdf/2412.19260

里面具体公布了：

GPT-4 ~1.76T
GPT-4o ~200B
GPT-4o mini ~8B
o1 preview ~300B
o1 mini ~ 100B

这里有1个平常震惊是GPT-4 ~1.76T是真的大，有卡就是好；1个目瞪口呆的震惊GPT-4o mini ~8B，嗯哼？

再次怀疑微软的可信度，毕竟之前有过一次... 但是应该不会再来一次了吧。且信其为真吧，但是这也太不夸张了吧，还是难以置信，难道是这个8B只是激活的参数？或者用的MoE，这只是一个expert的参数？啥蒸馏技术这么nb？

主要是4o mini的表现肯定不止8B啊，你们认为呢？用过的同学肯定能体会到，这个和qwen和llama的7B根本不是一个档次的。

如果是真的，那是真nb！性价比之王！

以Gemini 1.5 Pro为对比举例：

嗯，是的，便宜40多倍~

希望微软不要再公布错参数了~

小模型又看到了希望！

快来留言谈谈你的看法吧~

进技术交流群请添加AINLP小助手微信（id: ainlp2)
请备注具体方向+所用到的相关技术点
                            

                            






                            
                                请到「今天看啥」查看全文

推荐文章

最高人民检察院 · 两个村民小组结了三十多年的“疙瘩”解开了……
23 小时前

新技术法学 · 法律AI基础｜（五）提示词革命：场域共振式
昨天

新技术法学 · 法律AI基础｜（五）提示词革命：场域共振式
昨天

最高人民法院 · 守望
昨天

最高人民检察院 · 第九届全国检察“三微”优秀作品展播｜微动漫：西游记之火眼金睛识诈骗
2 天前

中国基金报 · 销量突然猛增！很多人这几天出手，店员：有人一次性省了3万
4 天前

七台河网 · 吓出冷汗！哈尔滨一小区多家半夜被盗，竟无一家发觉！这些人家都少做了这件事……
8 年前

煮酒论史 · 震惊世界的一段碑文，很多人后悔没有早点看到！
8 年前

学习小组 · 「党建治学」韩庆祥：深刻理解党中央治国理政的科学方法
7 年前

今日房产 · 2014年最高楼板价66629元/㎡的前滩九宫格，如今长这样！
7 年前

吃喝玩乐在北京 · 这家自助排队到哭来了就能吃哭老板
7 年前