专栏名称: 歸藏的AI工具箱

互联网科技博主产品设计师、模型设计师、不会代码的独立开发者。关注人工智能、LLM 、 Stable Diffusion 和设计。

目录

相关文章推荐

看电视 · 剧集“开年第一会”复盘：在“长短”之间探索好 ... · 昨天

江南都市报 · 热搜第一！电视剧《漂白》继抄袭风波后被指拍摄 ... · 3 天前

AHTV第一时间 · 9集出现6次，网友呼吁下架！剧方火速删除.. ... · 3 天前

AHTV第一时间 · 9集出现6次，网友呼吁下架！剧方火速删除.. ... · 3 天前

正观新闻 · 9集6次性骚扰，电视剧《难哄》引争议！有网友 ... · 3 天前

电视剧鹰眼 · 【鹰眼头条】腾讯视频、慈爱传媒出品电视剧《方 ... · 5 天前

51好读 › 专栏 › 歸藏的AI工具箱

Hamel Husain 这篇内容真的很好，全是实践经验。#ai-20241031173628

歸藏的AI工具箱 · 微博 · · 2024-10-31 17:36

正文

2024-10-31 17:36
本条微博链接

Hamel Husain 这篇内容真的很好，全是实践经验。 #ai#

介绍如何帮助模型团队避免被各种指标淹没。

据我观察他说的这些问题国内模型训练团队也都有：

- 创建大量难以管理的指标
- 非常随意的评分标准
- 忽视领域专家意见
- 指标不能反映对用户或业务需求

他提出了Critique Shadowing来解决这些问题。

文章地址：hamel.dev/blog/posts/llm-judge/

请到「今天看啥」查看全文

推荐文章

看电视 · 剧集“开年第一会”复盘：在“长短”之间探索好内容落点

昨天

江南都市报 · 热搜第一！电视剧《漂白》继抄袭风波后被指拍摄现场内替身女演员遭车碾压，现场画面曝光

3 天前

AHTV第一时间 · 9集出现6次，网友呼吁下架！剧方火速删除......

3 天前

AHTV第一时间 · 9集出现6次，网友呼吁下架！剧方火速删除......

3 天前

正观新闻 · 9集6次性骚扰，电视剧《难哄》引争议！有网友呼吁下架，剧方火速删镜头

3 天前

电视剧鹰眼 · 【鹰眼头条】腾讯视频、慈爱传媒出品电视剧《方圆八百米》近日官宣杀青

5 天前

健康时尚百科 · 猪肉这样煮，当心癌症找上你！

8 年前

数码评价 · 随iPhone之后推出磨砂黑款，网友称其“黑得漂亮”

7 年前

历史震惊你 · 做人，要积八德（必读！）

7 年前

爱丽丝手札 · 买房就如买白菜？这样的杠杆太吓人了！

7 年前

MMC战神录 · MMC战神录丨世界格斗冠军赛021 优秀选手仁飘零

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!