专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
宝玉xp  ·  回复@潘俊勇EasyDo://@潘俊勇Eas ... ·  昨天  
爱可可-爱生活  ·  [LG]《Computationally ... ·  2 天前  
爱可可-爱生活  ·  2024年大语言模型的关键突破与反思2024 ... ·  4 天前  
51好读  ›  专栏  ›  爱可可-爱生活

【LLM-as-an-Interviewer:一个通过模拟面试过-20250103172813

爱可可-爱生活  · 微博  · AI  · 2025-01-03 17:28

正文

2025-01-03 17:28

【LLM-as-an-Interviewer:一个通过模拟面试过程来评估大型语言模型(LLMs)能力的框架,让一个LLM扮演面试官的角色,通过提供反馈和追问问题来全面评估其他LLMs的能力】'LLM-as-an-Interviewer: Beyond Static Testing Through Dynamic LLM Evaluation' GitHub: github.com/interview-eval/interview-eval #人工智能# #语言模型评估# #动态测试# #AI创造营#