据3月18日消息,OpenAI今日推出了GPT-5.4 mini和GPT-5.4 nano型号。这两个模型是低成本、大规模的语言模型产品,专为快速、大容量的人工智能工作负载而设计。适合AI工作流程的小规模模型在许多AI工作流程中,高效的模型通常需要在性能、响应能力和工具调用能力之间取得平衡。该公司表示:“这些模型专为延迟敏感的工作负载而设计,其中延迟直接影响产品体验,例如需要快速响应的编程助手、执行辅助任务的子代理、捕获和解释屏幕内容的计算机操作系统以及可以对图像执行实时推理的多模式应用程序。” “与 GPT-5 mini 和 GPT-5.4 相比,您可以快速可靠地访问工具并成功执行专业任务。
mini 改进了编程、推理、多模态理解和工具使用,运行大约两次和第一个一样快。 GPT-5.4 nano 是一个更小、更快的版本,主要用于分类、数据挖掘、排序和更简单的编程辅助任务。性能 性能和盈利能力是评估小型、低成本模型时的主要基准指标。 OpenAI 列出了新模型与旧模型对比的测试数据。 • 在SWE Bench Pro基准测试中,GPT-5.4 mini得分为53.40%,而GPT-5 mini得分为45.69%。 • 在Terminal-Bench 2.0测试中,GPT-5.4 mini达到了59.30%,GPT-5 mini达到了38.20%。 • 在GPQA钻石测试中,GPT-5.4 mini得分为85.48%,接近GPT-5.4的93.00%。 •
根据OSWorld验证的结果,GPT-5.4 mini的得分为70.60%,高于GPT-5 mini的42%的得分。测试结果显示,GPT-5.4 mini的通过率接近GPT-5.4的水平,并且运行速度更快。在衡量模型正确解决问题的能力的基准测试中,轻量级的 GPT-5.4 mini 表现出色rmed 与 GPT-5.4 的全功能版本类似。 GPT-5.4 nano的性能介于上述两者之间。例如,它在 SWE-bench Pro 中得分为 52.39%,在 Terminal Bench 2.0 中得分为 46.30%。数据低于GPT-5.4 mini,但高于GPT-5 mini。子代理和多模式任务代理生态系统使人工智能架构能够模拟现实世界的协作模式。例如,将功能更强大的 AI 模型(例如 GPT-5.4 Thinking)与更快、成本更低的模型(例如 GPT-5.4 mini)相结合,类似于高级工程师为初级工程师提供建议和协作。代理系统可以组合不同规模的模型。大模型负责调度任务,小模型负责执行子任务。在这种情况下,GPT-5.4 mini 可以承担子代理任务,例如代码库搜索、文件审查和文档处理。 OpenAI 表示:“GPT-5.4
mini 具有多模式任务功能,适合涉及使用计算机的任务。该模型可以解释用户界面的密集屏幕截图,以协助计算机交互任务。 “可用性和定价 GPT-5.4 mini 目前可通过 API、Codex 和 ChatGPT 获得多个版本。免费和 Go 级别的用户可以通过溢出菜单中的“Think”选项调用 GPT-5.4 mini。OpenAI 表示,“对于所有其他用户”,DesAfter GPT-5.4 Thinking 激活速率限制,GPT-5.4 mini 将作为替代型号。”对于程序员来说,该公司表示 GPT-5.4 mini 涵盖了 Codex 应用程序、命令行界面 (CLI)、集成开发环境 (IDE) 扩展和网页。 OpenAI 指出,这个迷你模型“仅消耗 GPT-5.4 份额的 30%,使开发人员能够以大约三分之一的成本处理 Codex 中的简单编程任务”。此外,Codex 可以将任务委托给 GPT-5.4 迷你子代理,从而允许低成本模型执行较少的推理密集型工作。以下是成本比较数据: • GPT-5.4 mini 的售价为每百万个产品 0.75 美元ut 代币,每百万输出代币 4.50 美元,并具有 400,000 字的上下文窗口。 • GPT-5.4 nano 仅可通过API 获取,定价为每百万个输入代币0.20 美元,每百万个退出代币1.25 美元。相比之下,GPT-5.4 每百万个输入代币的成本为 2.50 美元,每百万个输出代币的成本为 15.00 美元。客户测试反馈技术公司 Hebbia 开发工具来帮助专业人员利用自然语言处理文档库。该公司的产品主要应用于金融、法律和科研等需要同时分析多个文档的领域。 Aabhas,Hebbia 首席技术官
Sharma 表示:“在同类模型中,GPT-5.4 mini 提供了相对稳定的端到端性能。在我们的评估中,它在各种输出和参考检索任务中表现符合预期,同时降低了成本。端到端性能也非常出色。在一些测试中,端到端通过率和资源贡献都高于较大的 GPT-5.4 模型。”kspace Notion比较常用(本文是用Notion写的)。该软件提供了一个结构化和非结构化数据集成平台,用户可以使用该平台创建无代码信息管理微应用程序来跟踪文章创建、内部项目等。 Notion AI 工程负责人
Abhisek Modi 表示,“GPT-5.4 mini 在处理明确定义的任务方面表现出很高的准确性。在页面编辑方面,其处理复杂格式的能力接近 GPT-5.2,且计算功耗相对较低。” PM Modi 进一步补充道,“以前,只有旗舰型号才能可靠地处理代理勾选工具调用。现在,mini 和 nano 等较小的 GPT-5.4 型号也具有相关功能。这使得用户在 Notion 中创建自定义代理时更容易选择正确的模型。” (短文)(本文由AI翻译,网易编辑审阅。)

新DLC《星空》预览及采访:重回星海》主站商城论坛自由职业者登录注册新DLC《星空》预告及采访:重回星海城主薛大师2026-0…

admin

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注