专栏名称: 爱可可-爱生活
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师
目录
相关文章推荐
宝玉xp  ·  转发微博-20241016022529 ·  2 天前  
爱可可-爱生活  ·  【AgentStack:快速构建强大AI ... ·  2 天前  
爱可可-爱生活  ·  [LG]《IGNN-Solver: A ... ·  3 天前  
爱可可-爱生活  ·  【In-Context强化学习精选:一个收集 ... ·  5 天前  
爱可可-爱生活  ·  [LG]《A ... ·  1 周前  
51好读  ›  专栏  ›  爱可可-爱生活

本文通过引入GSM-Symbolic和GSM-NoOp两个新的基-20241014051822

爱可可-爱生活  · 微博  · AI  · 2024-10-14 05:18

正文

2024-10-14 05:18

本文通过引入GSM-Symbolic和GSM-NoOp两个新的基准数据集,揭示了大型语言模型在数学推理方面的脆弱性和对无关信息的敏感性,挑战了现有评估方法的可靠性,并指出其推理能力更接近于模式匹配而非真正的逻辑推理。
[LG]《GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models》I Mirzadeh, K Alizadeh, H Shahrokhi, O Tuzel… [Apple] (2024) 网页链接 #机器学习##人工智能##论文#