本文转自微信公众号“科研猫”,作者:科研猫·Hiplot。
前不久, OpenAI 对外发布新一代生成模型 GPT-o1(就是之前代号“草莓”的那个)。
该模型在作出回答之前,会像人类一样,花更多时间思考问题,而不是脱口而出,想到哪儿写到哪儿。
通过训练,它们学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。
Hiplot官网以最快速度成功对接了新模型的API接口,为国内的广大科研用户提供升级版的
学术版
GPT-
o1
preview
和
o1-mini
。
最大亮点就是:
该系列模型在物理、化学、生物学等任务上的表现与博士生相似,在数学和编码方面的表现尤为出色。
因Hiplot与OpenAI保持更新上的联动,模型也越来越多。现我们特将所有模型合并在同一工具内,通过选项进行模型的切换。
Hiplot(网址:https://hiplot.com.cn)
云工具-绘图工具中一键到达
是不是已经被OpenAI 大模型纷繁不一的名称搞得昏头转向了,ChatGPT3.5、4.0、4.0 Turbo和4o?
没关系,因为大模型的名字,今天起再次「从 1 开始」了。
o1 上线之后, ChatGPT 在回答问题前会进行仔细思考,而不是立即脱口而出。ChatGPT 已经从仅使用系统 1(
快速、自动、直观、易出错
),进化到了可使用系统 2 思维(
缓慢、深思熟虑、有意识、可靠
),它可以在响应用户之前产生一个很长的内部思维链。
对于复杂推理,这是一个重大进步,代表了人工智能的新水平。鉴于此,
OpenAI 将计数器重置为 1,并将该系列模型命名为 OpenAI o1。
o1 是一个系列模型,包括了 o1、o1-preview和o1-mini,目前真正的o1还没有面市,我们可以接触到的,只有o1-preview(
预览版
)和o1-mini。
该公司在博客中给出了 preview 和 mini 版的不同定义:
「为了给开发者提供更高效的解决方案,我们也发布了 OpenAI o1-mini,这是一个
尤其擅长编程、更快、更便宜的推理模型。
」整体来看,
o1-mini 的成本比 o1-preview 低 80%。
由于 o1 等大型语言模型是在大量文本数据集上预训练,虽然具有广泛世界知识,但对于实际应用来说,
可能成本高昂且速度慢
。
相比之下,
o1-mini 是一个较小的模型,在预训练期间针对 STEM 推理进行了优化。
在使用与 o1 相同的高计算强化学习 (RL) pipeline 进行训练后, o1-mini 在许多有用的推理任务上实现了相媲美的性能,同时成本效率显著提高。
*“STEM 推理”是指在科学(Science)、技术(Technology)、工程(Engineering)和数学(Mathematics)四个领域。
在速度层面,OpenAI 比较了 GPT-4o、o1-mini 和 o1-preview 对一个单词推理问题的回答。结果显示,
GPT-4o 回答不正确,而 o1-mini 和 o1-preview 均回答正确,并且 o1-mini 得出答案的速度快了大约 3-5 倍。
在简单的 Prompt 下,用户可能不会注意到太大的差异,但如果问一些棘手的数学或者代码问题,区别就开始明显了。
(1)
在数学竞赛上
:GPT-4o的准确率为13.4%,o1 预览版的准确率为56.7%, o1正式版,准确率为83.3%。
(2)
在代码竞赛上
:GPT-4o的准确率为11.0%,o1 预览版的准确率为62%,o1正式版,准确率为89%。
(3)
在博士级科学问题上
:GPT-4o的准确率为56.1%,人类专家水平的准确率为69.7%, o1的准确率达到了惊人的78%。
与人类在回答难题之前会长时间思考类似,o1 在尝试解决问题时会
使用思维链
。通过强化学习,o1 学会磨练其思维链并改进其使用的策略。
o1 学会了识别和纠正错误,并可以将棘手的步骤分解为更简单的步骤。o1 还学会了在当前方法不起作用时尝试不同的方法。
这个过程极大地提高了模型的推理能力。
Re:OpenAI官网上
ChatGPT Plus 和 Team(个人付费版与团队版)用户,可手动选取使用 o1-preview 或 o1-mini。目前,每位用户
每周
仅能给
o1-preview 发送 30 条
消息,给
o1-mini 发送 50 条
消息。
Hiplot 学术版GPT-o1(preview和mini)
通过付费方式获取OpenAI的API接口
,为国内的科研工作者提供访问服务。
2:之前给GPT4.0、4.0turbo、4o预充的充值金可以和
o1共用吗?
Re:
可共用,无需额外再对o1进行另外充值。
Hiplot上3.5版是月会员无限量使用;
4.0系列(包括4.0/4.0turbo/4o)以及o1
系列
都是通过在Hiplot云市场中购买20元/次的充值金进行预充值,然后根据使用的“流量”,按量扣费。(Tips:Hiplot月会员购买充值金有折扣)
Re:
OpenAI 表示对这两个模型的 API 调用并不包含浏览网页获取信息以及上传文件和图片、函数调用、流式传输(streaming)、系统支持消息等功能。同样,OpenAI 表示正在努力提升这些限制。
4:Hiplot学术版GPT-
o1使用过程中的注意事项
Re:O1-preview及O1-mini当前为预览版,模型本身速度较慢,且连接不太稳定。
建议不要重复太多次提问,尽量保证在三问三答以内就清空重新开始,问题保持精简。提问后请耐心等待(
因为它要思考,要思考,要思考
),不要关闭或刷新网页。
若已扣费却未收到答案,可联系客服找回。
Re:
新增4o-mini模型,相比旧版3.5turbo,知识库版本更新、更加智能,同样是29元/月不限量使用。
6:更多使用技巧和详细说明,请前往工具旁边的【使用指南】区查看。
本文转自微信公众号“科研猫”,作者:科研猫·Hiplot。