【人大团队打造角色扮演能力数据集,包含85个角色和14000段对话数据】
这两年, #大模型# 智能体受到了业界和学界的广泛关注。大模型智能体要想实现成功应用,就必须能够根据提示词准确地扮演相应角色。为了提升智能体的角色扮演能力,人们打造了大量的模型和 #数据集# 。
然而,这些模型和数据集大多只关注文本语料,即仅仅测试智能体能否准确刻画特定角色的文本理解和表达能力。
在真实世界中,智能体需要感知、理解和学习模态各异的周边环境,而文本环境只是其中的一种。
为了有效地评估智能体的多模态角色扮演能力, #中国人民大学# 高瓴人工智能学院准聘副教授陈旭和团队构建一个包含多模态信息的角色扮演能力数据集,其中包括 85 个角色、11000 张图片和 14000 段对话数据。
另外,他们设计了一套完整的角色扮演能力评测指标,具体包括图文匹配准确度和回复精准度等。基于以上内容,他们进一步微调了开源模型 QWen-VL-Chat。
戳链接查看详情: 网页链接
这两年, #大模型# 智能体受到了业界和学界的广泛关注。大模型智能体要想实现成功应用,就必须能够根据提示词准确地扮演相应角色。为了提升智能体的角色扮演能力,人们打造了大量的模型和 #数据集# 。
然而,这些模型和数据集大多只关注文本语料,即仅仅测试智能体能否准确刻画特定角色的文本理解和表达能力。
在真实世界中,智能体需要感知、理解和学习模态各异的周边环境,而文本环境只是其中的一种。
为了有效地评估智能体的多模态角色扮演能力, #中国人民大学# 高瓴人工智能学院准聘副教授陈旭和团队构建一个包含多模态信息的角色扮演能力数据集,其中包括 85 个角色、11000 张图片和 14000 段对话数据。
另外,他们设计了一套完整的角色扮演能力评测指标,具体包括图文匹配准确度和回复精准度等。基于以上内容,他们进一步微调了开源模型 QWen-VL-Chat。
戳链接查看详情: 网页链接