昨晚,OpenAI正式发布了o1预览版,这是一个全新的AI模型系列,旨在提供更深思熟虑的响应。

o1命名的意义

OpenAI解释了o1这个名称的由来:

对于复杂推理任务来说,这是一个重要的进展,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为1,并将这一系列命名为OpenAI o1。

简而言之,这次模型的强大程度让OpenAI重新考虑了过去GPT系列的命名,推出了全新的o系列。

OpenAI o1的发布,标志着AI行业将在朝向通用人工智能(AGI)快速前进。

OpenAI最新o1模型的表现

OpenAI最新版本的o1模型在数学能力、编程能力等理科问题上表现优秀。例如,在AIME 2024数学竞赛中,GPT-4o的准确率为13.4%,而o1预览版的准确率达到了56.7%。未发布的o1正式版预计将达到83.3%。在代码竞赛中,GPT-4o的准确率为11.0%,o1预览版则达到了62%,而o1正式版的准确率为89%。在博士级科学问题(GPQA Diamond)中,o1的表现甚至超过了人类专家。

特别是在测试化学、物理和生物学专业知识的基准GPQA-diamond上,o1的表现全面超越了人类博士专家,这是历史上首次有模型取得如此成就。

未来,建议将文科类问题交给Claude处理,而理科相关问题则使用OpenAI最新的o1-preview模型。

目前,o1模型在功能上仍有不少限制,但考虑到它的早期阶段,这种情况是可以理解的。

如何使用OpenAI的o1模型

目前,o1模型已逐步向所有ChatGPT Plus和Team用户开放,只有付费用户才能使用最新的o1模型。

  • o1:新的强大模型,当前不方便对外公开。
  • o1-preview:o1的预览版,立即可供ChatGPT付费用户和API用户使用。
  • o1-mini:速度更快、性价比更高,适合需要推理但不需要广泛世界知识的任务。

o1-mini在速度和成本上更具优势,适合数学和编程等场景,但其世界知识的覆盖面相对较小。

然而,OpenAI的一贯特性是最新、最强大的模型使用限制较多,价格也相应较高。

o1预览版的使用限制为每周30条,o1-mini为50条。

目前,只有付费升级到ChatGPT Plus的用户才能使用最新的o1模型。

OpenAI最新o1模型的使用体验

我尝试使用o1模型解决一些复杂问题,发现它的表现非常出色。例如,关于农夫过河的问题,o1在思考6秒后给出了完美的回答。此外,针对一个奥数题,o1经过1分多钟的思考后,给出了正确答案。

提升o1模型回答质量的提示词

在与OpenAI最新o1模型互动时,以下提示词能够显著提升回答质量:

  • 保持提示简单直接:模型更擅长理解简短清晰的指令。
  • 避免思路链提示:由于模型内部进行推理,不需要提示其“逐步思考”。
  • 使用分隔符:使用三重引号、XML标签或章节标题等分隔符来清晰指示输入的不同部分。
  • 限制附加上下文:提供附加上下文时,仅包含最相关的信息,以防止模型的响应过于复杂。

OpenAI最新o1模型的使用限制

根据最新的官方通知: o1预览版的使用限制为每周30条,o1-mini为50条。

这个限制相对严格,使用超过限制后会收到提示,表明已达使用上限,此时只能使用其它模型,直到限制重置。

OpenAI最新o1模型值得升级使用吗?

个人来看,o1模型无疑是目前最强大的大语言模型,但由于其对每个问题的思考时间和每周使用次数的限制,可能并不适合大多数用户的日常使用。

然而,o1的潜力远不止于此,它将是我们迈向下一个时代的重要基石。

因此,建议大家尝试,但日常使用仍以GPT-4o为主。

如何升级使用OpenAI最新o1模型?

目前,o1模型已全面向所有ChatGPT Plus和Team用户开放,只有升级到ChatGPT Plus的用户才能使用最新的o1模型。

由于OpenAI限制国内银行卡的使用,建议通过海外虚拟信用卡进行付费升级,推荐使用 野卡 | 一分钟注册,轻松订阅海外线上服务,以便顺利完成升级。

通过野卡注册后,用户可以方便地完成ChatGPT Plus的升级,整个过程非常简单。遇到问题时,咨询在线客服即可获得快速响应。