专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
目录
相关文章推荐
河北交通广播  ·  最新!微信支持在电脑端收红包了! ·  6 小时前  
高分子科学前沿  ·  化学所刘鸣华课题组《自然·通讯》​:超分子玫 ... ·  19 小时前  
河北交通广播  ·  【992 | 快讯】全红婵,拟被保送! ·  昨天  
河北交通广播  ·  刚刚,2025年研考国家线,发布! ·  昨天  
高分子科学前沿  ·  摩擦起电,还能发Nature! ·  昨天  
51好读  ›  专栏  ›  歸藏的AI工具箱

现在大部分宣称复刻Open AI o1的项目基本都是基于提示工程-20241008152752

歸藏的AI工具箱  · 微博  ·  · 2024-10-08 15:27

正文

2024-10-08 15:27

现在大部分宣称复刻Open AI o1的项目基本都是基于提示工程和模型微调,没有一个是基于强化学习的。 #ai#

Entropy-based sampling 这个项目看起来更有价值一些,虽然我也看不用太懂。

主要逻辑是基于熵的采样方法,用于改善大型语言模型(LLMs)的文本生成过程。

通过控制熵和方差熵来避免分布退化,提高生成结果的多样性和质量。

框架中,根据当前熵和方差熵的值,采取不同的策略,如贪心解码、分支、回溯或引入推理链(Chain of Thought, CoT)。

详细介绍:notes.haroldbenoit.com/ml/llms/inference/sampling/entropy-based-sampling






请到「今天看啥」查看全文