专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
黄建同学  ·  Anthropic AI 为 Claude ... ·  昨天  
爱可可-爱生活  ·  [CL]《Self-Generated ... ·  昨天  
爱可可-爱生活  ·  【LLM资源中心:为大语言模型提供一站式学习 ... ·  3 天前  
爱可可-爱生活  ·  //@爱可可-爱生活:AI编程正在推动软件开 ... ·  5 天前  
题材挖掘君  ·  AI应用,最新标的公司梳理自取(精选名单) ·  5 天前  
51好读  ›  专栏  ›  爱可可-爱生活

[LG] A Survey on LLM-as-a-Judge -20241127055730

爱可可-爱生活  · 微博  · AI  · 2024-11-27 05:57

正文

2024-11-27 05:57

[LG] A Survey on LLM-as-a-Judge
网页链接
本文系统地综述了利用大型语言模型进行评估(LLM-as-a-Judge)的研究进展,提出了一个新的评估基准,并揭示了一些反直觉的发现,例如并非所有改进策略都能提升性能,为构建更可靠、更鲁棒的 LLM-as-a-Judge 系统指明了方向。