专栏名称: GitHubStore
分享有意思的开源项目
目录
相关文章推荐
普象工业设计小站  ·  中国玩家“拯救”土耳其小众游戏,销量暴涨20 ... ·  6 小时前  
普象工业设计小站  ·  洁癖姐妹建议人手一个,精致出行收纳超好用 ·  昨天  
数据派THU  ·  政务系统拥抱DeepSeek,会带来哪些改变? ·  3 天前  
普象工业设计小站  ·  亚洲顶流表情包女孩20岁了,最新近照惊艳曝光 ... ·  3 天前  
创意铺子  ·  79 元 2 ... ·  3 天前  
51好读  ›  专栏  ›  GitHubStore

出门问问序列猴子开源数据集

GitHubStore  · 公众号  ·  · 2024-03-13 07:04

正文

项目简介

序列猴子开源数据集1.0

序列猴子是出门问问提供的超大规模语言模型,基于其通用的表示与推理能力,支持多轮交互,能够大幅度提高生产效率和数据处理能力,被广泛应用于问答系统、自然语言处理、机器翻译、文本摘要等领域。

序列猴子数据集是用于训练序列猴子模型的数据集合,现选择部分数据集向公众开放。

序列猴子开源数据集1.0为序列猴子数据集的首个开源版本,涉及以下领域(请点击链接以查看详情):

  • 中文通用文本语料

  • 古诗今译语料

  • 文本生成语料

使用许可

序列猴子文本开源数据集1.0整体采用Apache 2.0许可协议。您可以自由共享、改编本数据集,唯需遵循以下条款:

  • 不施加附加限制:您不得使用法律条款或技术措施来限制他人执行本许可证允许的任何操作


项目链接

https://github.com/mobvoi/seq-monkey-data

关注「 GitHubStore 」公众号

扫一扫以下微信







请到「今天看啥」查看全文