专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
宝玉xp  ·  转发微博-20250129040708 ·  4 小时前  
中国人工智能学会  ·  中国人工智能学会理事长戴琼海院士携手专家学者 ... ·  8 小时前  
机器之心  ·  Video Depth ... ·  昨天  
爱可可-爱生活  ·  【[67星]llmpeg:用自然语言操作ff ... ·  2 天前  
爱可可-爱生活  ·  《爱可可微博热门分享(1.24)》 ... ·  4 天前  
51好读  ›  专栏  ›  爱可可-爱生活

【[43星]ComplexFuncBench:复杂函数调用的终极-20250126140002

爱可可-爱生活  · 微博  · AI  · 2025-01-26 14:00

正文

2025-01-26 14:00

【[43星]ComplexFuncBench:复杂函数调用的终极测试基准!它能解决复杂场景下函数调用的评估难题,帮助开发者优化模型性能。亮点:1. 包含1000个复杂函数调用样本,覆盖多步调用、参数推理等场景;2. 支持长参数(超500 tokens)和128k长文本上下文;3. 提供自动化评估框架,快速验证模型效果】
'Complex Function Calling Benchmark: Exploring Multi-Step and Constrained Function Calling under Long-Context Scenario'
GitHub: github.com/THUDM/ComplexFuncBench
#复杂函数调用# #AI评估# #长文本处理# #AI创造营#