专栏名称: 歸藏的AI工具箱

互联网科技博主产品设计师、模型设计师、不会代码的独立开发者。关注人工智能、LLM 、 Stable Diffusion 和设计。

目录

相关文章推荐

Java编程精选 · 字节员工疑问：为什么大厂客户端宁愿用28k招 ... · 2 天前

芋道源码 · 面试官：为什么删除缓存后，Redis内存占用 ... · 2 天前

芋道源码 · DeepSeek浪潮，Spring也赶上了？！ · 2 天前

芋道源码 · SpringBoot ... · 2 天前

芋道源码 · java 插入式注解的打开方式！ · 4 天前

51好读 › 专栏 › 歸藏的AI工具箱

The Information 昨天发布的报道说 Open AI-20240828105924

歸藏的AI工具箱 · 微博 · · 2024-08-28 10:59

正文

2024-08-28 10:59
本条微博链接

The Information 昨天发布的报道说 Open AI 推理能力很强的模型 Strawberry 即将发布。 #ai#

可能用了跟斯坦福研究 Quiet-STaR 类似的方法。

又重新看了一下这个论文，Quiet-STaR 通过三个步骤提高模型推理能力：

并行生成理由：首先，在输入序列的每个标记位置并行生成多个理由。每个理由的长度为t，并在每个理由的开始和结束处插入学习的起始和结束标记。

混合后理由和基础预测：然后，使用一个混合头从每个理由的隐藏状态输出和原始文本标记的隐藏状态输出中生成一个权重，该权重决定了在后续标记预测中使用多少后理由的预测逻辑。

优化理由生成：最后，使用REINFORCE算法优化理由生成参数，以增加使未来文本更可能的理由的可能性。

论文地址：

请到「今天看啥」查看全文

推荐文章

Java编程精选 · 字节员工疑问：为什么大厂客户端宁愿用28k招一个零基础的应届生，而不愿意用20k招一个资深客户端？

2 天前

芋道源码 · 面试官：为什么删除缓存后，Redis内存占用依然很高？

2 天前

芋道源码 · DeepSeek浪潮，Spring也赶上了？！

2 天前

芋道源码 · SpringBoot 实战：文件上传之秒传、断点续传、分片上传

2 天前

芋道源码 · java 插入式注解的打开方式！

4 天前

日喀则在线 · 【艺术空间】སྒྱུ་རྩལ་པ་རྒན་ཚེ་རིང་སྒྲོལ་མ་ལགས། 西藏画家次仁卓玛

8 年前

穿衣搭配女王 · 春夏裙子不用买太多，有这3条就够了！

7 年前

哎咆科技 · 教你如何鉴别iPhone翻新机！

7 年前

木雕 · 金丝楠极品纹理，只看一眼就美醉了！遇上了千万别错过

7 年前

Excel之家ExcelHome · 你的气质里藏着曾经写过的函数公式

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!