专栏名称: 我爱计算机视觉
关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播CVML技术的业内最佳实践。www.52cv.net 微博:计算机视觉与机器学习,QQ群:928997753,52CV君个人账号:Your-Word。
目录
相关文章推荐
新闻坊  ·  上海最新披露!多名银行高管被罚! ·  2 天前  
新闻坊  ·  上海最新披露!多名银行高管被罚! ·  2 天前  
中国安全生产网  ·  DeepSeek眼中,安全员是什么样子? ·  3 天前  
51好读  ›  专栏  ›  我爱计算机视觉

在GPU云上部署Tülu 3,性能超越Llama 3.1 Instruct

我爱计算机视觉  · 公众号  ·  · 2024-12-11 14:17

正文

近期发布的 OpenAI o1在数学、代码、长程规划等问题上取得了显著提升,而背后的成功离不开后训练阶段强化学习训练和推理阶段思考计算量的增大。

基于此,有人认为,新的扩展律—后训练扩展律(Post-Training Scaling Laws)已经出现,并可能引发社区对于算力分配、后训练能力的重新思考。

他们不仅开源了两个性能超过Llama 3.1 Instruct相应版本的新模型——Tülu 3 8B 和 70B(未来还会有405B版本),还在技术报告中公布了详细的后训练方法。

Tülu 3 模型之外,Ai2 还发布了所有的数据、数据混合方法、配方、代码、基础设施和评估框架!

  • GitHub:https://github.com/allenai/open-instruct
  • 模型:https://huggingface.co/allenai

【Tülu 3】模型已经在趋动云『社区项目』上线,无需自己创建环境、下载模型,一键即可快速启动,快来体验【Tülu 3】带来的精彩体验吧!

  • 项目入口:https://open.virtaicloud.com/web/project/detail/515959738119565312

视频教程:

启动开发环境(初始启动8B模型推荐配置:B4.large;初始启动70B模型推荐配置:P2.4xlarge)

进入 Tülu 3 项目主页中,点击 运行一下 ,将项目一键克隆至工作空间,『社区项目』推荐适用的算力规格,可以直接 立即运行 ,省去个人下载数据、模型和计算算力的大量准备时间。

配置完成,点击进入开发环境,根据主页项目介绍进行部署。

使用方法

WebUI界面操作(8B与70B操作相同)

选中单元格,点击运行。

等待生成local URL,右侧添加端口号7860,复制外部访问链接到浏览器打开。

示例展示

➫温馨提示: 完成项目后,记得及时关闭开发环境,以免继续产生费用!

智汇全球,趋动未来

『社区项目』汇聚全球智慧,是促进技术交流的宝贵平台,期待每一位AI爱好者体验一键部署功能的强大魅力。

同时,我们也热切盼望每一位码友加入,分享您的精品作品,共筑这个充满活力与创新的技术乐园。


趋动云






请到「今天看啥」查看全文