本文提出了一个用于训练语言Agent解决复杂科学任务的框架,通过语言决策过程(LDP)形式化任务,利用随机计算图(SCG)建模Agent,并借助Aviary环境进行训练,结果表明,通过专家迭代和推理时计算量缩放,开源小模型在特定任务上的性能可以媲美甚至超越人类专家和前沿大模型,且推理成本大幅降低,揭示了在资源受限情况下高效构建高性能语言Agent的可能性。
知名互联网资讯博主 北邮PRIS模式识别实验室陈老师 |
新智元 · 学术顶刊乱用AI私改论文暴雷,编委会集体辞职 ... · 昨天 |
爱可可-爱生活 · 图解“一人一公司” ... · 昨天 |
宝玉xp · //@Ddd_23_:需求就是市场,一切技术 ... · 4 天前 |
爱可可-爱生活 · 【LLM-as-an-Interviewer ... · 4 天前 |
爱可可-爱生活 · 【Jupyter ... · 4 天前 |
新智元 · 学术顶刊乱用AI私改论文暴雷,编委会集体辞职!高校教授震怒发声 昨天 |
爱可可-爱生活 · 图解“一人一公司” #人工智能##AI创造营# -20250106135108 昨天 |
宝玉xp · //@Ddd_23_:需求就是市场,一切技术都是为需求而生-20250103172144 4 天前 |
爱可可-爱生活 · 【LLM-as-an-Interviewer:一个通过模拟面试过-20250103172813 4 天前 |
爱可可-爱生活 · 【Jupyter Copilot:为JupyterLab设计的G-20250103173932 4 天前 |
新闻夜航 · 洗衣、做饭、割猪草……稚嫩的脸庞刻写孤独的坚强!以爱之名,这一次为了他们! 7 年前 |
品途商业评论 · 从修马桶到辞职百度创业,身价过亿的他,又想去当导演... | 品途视频 7 年前 |
养花大全 · 盆底埋点渣,花长得根壮叶绿,旺极了! 7 年前 |
医药魔方 · 中国大陆及台湾药企的ANDA产品汇总 7 年前 |
程序员的那些事 · 代码写的好,出过畅销书,还拿过赛车冠军,这是一种什么体验? 7 年前 |