真正适合做学术的“真学术”GPT来了！堪比博士生，更适合编程、逻辑推理~

Dots机构投资者社区 · 公众号 · · 2024-11-03 08:15

正文

请到「今天看啥」查看全文

本文转自微信公众号“科研猫”，作者：科研猫·Hiplot。

前不久， OpenAI 对外发布新一代生成模型 GPT-o1（就是之前代号“草莓”的那个）。

该模型在作出回答之前，会像人类一样，花更多时间思考问题，而不是脱口而出，想到哪儿写到哪儿。 通过训练，它们学会完善自己的思维过程，尝试不同的策略，并认识到自己的错误。

Hiplot官网以最快速度成功对接了新模型的API接口，为国内的广大科研用户提供升级版的 学术版 GPT- o1 preview 和 o1-mini 。

最大亮点就是：

该系列模型在物理、化学、生物学等任务上的表现与博士生相似，在数学和编码方面的表现尤为出色。

因Hiplot与OpenAI保持更新上的联动，模型也越来越多。现我们特将所有模型合并在同一工具内，通过选项进行模型的切换。

Hiplot（网址：https://hiplot.com.cn）

云工具-绘图工具中一键到达

是不是已经被OpenAI 大模型纷繁不一的名称搞得昏头转向了，ChatGPT3.5、4.0、4.0 Turbo和4o？

没关系，因为大模型的名字，今天起再次「从 1 开始」了。

o1 上线之后， ChatGPT 在回答问题前会进行仔细思考，而不是立即脱口而出。ChatGPT 已经从仅使用系统 1（ 快速、自动、直观、易出错 ），进化到了可使用系统 2 思维（ 缓慢、深思熟虑、有意识、可靠 ），它可以在响应用户之前产生一个很长的内部思维链。

对于复杂推理，这是一个重大进步，代表了人工智能的新水平。鉴于此， OpenAI 将计数器重置为 1，并将该系列模型命名为 OpenAI o1。

模型亮点

o1 是一个系列模型，包括了 o1、o1-preview和o1-mini，目前真正的o1还没有面市，我们可以接触到的，只有o1-preview（预览版）和o1-mini。

该公司在博客中给出了 preview 和 mini 版的不同定义：

「为了给开发者提供更高效的解决方案，我们也发布了 OpenAI o1-mini，这是一个 尤其擅长编程、更快、更便宜的推理模型。 」整体来看， o1-mini 的成本比 o1-preview 低 80%。

由于 o1 等大型语言模型是在大量文本数据集上预训练，虽然具有广泛世界知识，但对于实际应用来说， 可能成本高昂且速度慢 。

相比之下， o1-mini 是一个较小的模型，在预训练期间针对 STEM 推理进行了优化。 在使用与 o1 相同的高计算强化学习 (RL) pipeline 进行训练后， o1-mini 在许多有用的推理任务上实现了相媲美的性能，同时成本效率显著提高。

*“STEM 推理”是指在科学（Science）、技术（Technology）、工程（Engineering）和数学（Mathematics）四个领域。

在速度层面，OpenAI 比较了 GPT-4o、o1-mini 和 o1-preview 对一个单词推理问题的回答。结果显示， GPT-4o 回答不正确，而 o1-mini 和 o1-preview 均回答正确，并且 o1-mini 得出答案的速度快了大约 3-5 倍。

在简单的 Prompt 下，用户可能不会注意到太大的差异，但如果问一些棘手的数学或者代码问题，区别就开始明显了。

（1） 在数学竞赛上 ：GPT-4o的准确率为13.4%，o1 预览版的准确率为56.7%， o1正式版，准确率为83.3%。

（2） 在代码竞赛上 ：GPT-4o的准确率为11.0%，o1 预览版的准确率为62%，o1正式版，准确率为89%。

（3） 在博士级科学问题上 ：GPT-4o的准确率为56.1%，人类专家水平的准确率为69.7%， o1的准确率达到了惊人的78%。

与人类在回答难题之前会长时间思考类似，o1 在尝试解决问题时会 使用思维链 。通过强化学习，o1 学会磨练其思维链并改进其使用的策略。 o1 学会了识别和纠正错误，并可以将棘手的步骤分解为更简单的步骤。o1 还学会了在当前方法不起作用时尝试不同的方法。 这个过程极大地提高了模型的推理能力。

Q&A

1： OpenAI o1的收费情况如何？

Re：OpenAI官网上 ChatGPT Plus 和 Team（个人付费版与团队版）用户，可手动选取使用 o1-preview 或 o1-mini。目前，每位用户每周仅能给 o1-preview 发送 30 条 消息，给 o1-mini 发送 50 条 消息。

Hiplot 学术版GPT-o1（preview和mini） 通过付费方式获取OpenAI的API接口 ，为国内的科研工作者提供访问服务。

2：之前给GPT4.0、4.0turbo、4o预充的充值金可以和 o1共用吗？

Re： 可共用，无需额外再对o1进行另外充值。 Hiplot上3.5版是月会员无限量使用； 4.0系列（包括4.0/4.0turbo/4o）以及o1 系列都是通过在Hiplot云市场中购买20元/次的充值金进行预充值，然后根据使用的“流量”，按量扣费。（Tips:Hiplot月会员购买充值金有折扣）

3：o1的API接口有哪些限制？

Re： OpenAI 表示对这两个模型的 API 调用并不包含浏览网页获取信息以及上传文件和图片、函数调用、流式传输（streaming）、系统支持消息等功能。同样，OpenAI 表示正在努力提升这些限制。

4：Hiplot学术版GPT- o1使用过程中的注意事项

Re：O1-preview及O1-mini当前为预览版，模型本身速度较慢，且连接不太稳定。 建议不要重复太多次提问，尽量保证在三问三答以内就清空重新开始，问题保持精简。提问后请耐心等待（ 因为它要思考，要思考，要思考 ），不要关闭或刷新网页。 若已扣费却未收到答案，可联系客服找回。

5：会员不限量使用的“原3.5版”有哪些更新？

Re：新增4o-mini模型，相比旧版3.5turbo，知识库版本更新、更加智能，同样是29元/月不限量使用。

6：更多使用技巧和详细说明，请前往工具旁边的【使用指南】区查看。

更多功能的使用，一起去Hiplot官网探索吧~

网址：https://hiplot.com.cn

本文转自微信公众号“科研猫”，作者：科研猫·Hiplot。