[LG]《Sharpe Ratio-Guided Active -20250401054618

爱可可-爱生活 · 微博 · AI · 2025-04-01 05:46

正文

[LG]《Sharpe Ratio-Guided Active Learning for Preference Optimization in RLHF》S Belakaria, J Kazdan, C Marx, C Cundy... [Stanford University] (2025)

推荐文章

左右为篮 · 波波被抓了，没人管了你要造反了是吧？

8 年前

冷笑话 · 超级无敌棒的毛枕头，不知不觉又是一口狗粮！

8 年前

心理语录 · 从属相看透你的一生！越看越准！

7 年前

雾满拦江 · 简单人生，不需要那么多大道理

7 年前

社会学吧 · 窦文涛组局《圆桌派2》,你看到了什么？

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!