GPT-5 是 OpenAI 最新一代的大型语言模型,于 2025 年 8 月 7 日正式发布。它具备先进的推理能力、多模态输入处理(文本和图像)以及统一的模型架构,可动态选择最佳子模型来执行任务。
GPT-5 可以执行多步逻辑推理、修正结论并论证输出,使其更适合超越简单对话的复杂工作流程。
GPT-5 的变体
OpenAI 发布的主要 GPT-5 变体包括:
- GPT-5(标准/主模型):专为逻辑、多步推理和复杂任务设计。它提供 GPT-5 的全部功能,具有强大的推理和代理功能。
- GPT-5 mini:一个轻量级版本,针对成本敏感型应用和使用需求较低的用户进行了优化。它以更低的成本和延迟提供良好的性能。
- GPT-5 nano:一个更快、更便宜、更紧凑的模型,针对低延迟和高性价比使用进行了优化。非常适合需要快速响应和最少计算资源的应用。
此外,还有一个 GPT-5 pro 变体,提供更高的推理深度和峰值性能,可通过 ChatGPT Pro 等付费订阅访问,具有增强的计算能力,但成本和延迟也更高。
GPT-5 的主要改进
GPT-5 的主要功能和改进包括:
减少幻觉
GPT-5 极少出现信息捏造,在某些测试中,事实错误比 GPT-4o 减少高达 45%,并且它经过训练,当无法在不猜测的情况下完成任务时会发出信号。
统一的先进推理和多模态能力
GPT-5 集成了先进的推理模型和多模态输入(文本、图像和语音),能够无缝处理复杂的、多步的工作流程,而无需在专用模型之间切换。
结构化、思维链推理
GPT-5 继承了 o3 模型等先前版本的结构化逻辑,能够进行多步思考、修正结论和论证输出,从而提高准确性,尤其是在事实和分析任务中。与早期版本相比,这大大减少了幻觉(在某些测试中事实错误减少 45-80%)。
扩展的上下文窗口
GPT-5 支持大型输入,输入限制约为 272,000 个 token,输出限制约为 128,000 个 token,这使其能够在扩展对话中保持连贯性并处理大型文档。
GPT-5 与 GPT-4o 对比
在推理、编码、可靠性和多模态能力等大多数关键指标上,GPT-5 的表现显著优于 GPT-4o。
以下是详细的对比:
特性 | GPT-5 | GPT-4o |
推理性能 | 更强的多步推理能力;在科学基准测试(GPQA Diamond)上得分约为 85.7%-89.4%,并启用了扩展“思考”功能 | 能力较弱,在相同基准测试上得分约为 70.1%;难以处理复杂的科学推理 |
编码能力 | 在 SWE-bench Verified (74.9%) 和 Aider Polyglot (88%) 等基准测试中领先,并启用了思维链;迄今为止最好的编码模型 | 在这些学术编码和代码编辑基准测试中的表现最弱 |
错误率和可靠性 | 幻觉和错误率最低(在开源数据中低于 1%,在困难的医疗任务中为 1.6%);推理模式可将错误率降低一半以上 | 幻觉和错误率较高(在 HealthBench 上高达 15.8%,在流量提示上高达 22%) |
模型架构 | 统一架构,具有动态子模型切换、多模态输入(文本和图像)、代理功能和工具集成 | 独立的旧版模型,多模态能力较弱 |
使用和可用性 | 提供标准版、mini 版和 Pro 版,具有不同的推理深度和 API 访问权限;由微软集成 | 旧版,于 2025 年 4 月在 ChatGPT 中弃用,仍可通过 API 访问 |
多模态和工具集成 | 强大的文本和图像实时处理能力,计划支持视频,并与生产力工具和编码环境集成 | 有限的多模态能力,无计划支持视频理解 |
如何访问 GPT-5
有几个地方可以访问 GPT-5。
- HIX AI(推荐):这是尝试 GPT-5 最简单、最流畅的方式。在 HIX AI 上免费试用,无需登录。我们为世界各地的用户提供此模型的无限制访问。
- ChatGPT 网页界面:所有 ChatGPT 用户都可以使用 GPT-5,包括免费、Plus、Pro 和 Team 订阅用户。免费用户使用量有限,超出使用量上限后会回退到 GPT-5-mini;Plus 用户享有更高的使用量限制;Pro 用户可以使用功能最强、使用量无限制的 GPT-5 Pro。
- API 访问:开发人员可通过 OpenAI 的 API 平台访问 GPT-5,该平台提供 GPT-5、GPT-5-mini 和 GPT-5-nano 等不同的模型变体,以满足成本和延迟需求。
常见问题解答
GPT-5相比GPT-4o有哪些改进?
GPT-5 提供了更强的结构化推理能力、更好的多模态能力、更少的幻觉(减少高达 45%),以及一个统一的模型,不再需要切换不同的专用版本。它还引入了智能体功能,以实现更好的任务执行和生产力工具集成。
GPT-5 能处理图像和其他类型的输入吗?
是的,GPT-5 支持包括文本和图像在内的多模式实时输入,未来计划实现原生视频处理并改进跨输入模式的转换。
GPT-5 适合用于编码和软件开发吗?
GPT-5在编码性能方面处于领先地位,并且可以深入分析代码库,使其在编程和软件相关任务中非常有效。
GPT-5 的 token 限制是多少?
GPT-5 支持约 272,000 个输入令牌和 128,000 个输出令牌的限制。
关于GPT-5和ChatGPT 的有益文章
探索关于GPT-5和ChatGPT的实用文章,了解更多关于这个 AI 模型的信息!