「Agent 原生」大模型来了?
黑料不打烊OpenAI 就正式推出 GPT-5.4。而这次模型更新,主打的正是当下最火热的 AI Agent 方向。在 GPT-5.4 之前,大模型的能力边界可以用一句话总结:它能告诉你「怎么做」,但它自己做不了。你让它帮你分析竞争对手,它会给你一份洋洋洒洒的文字报告;你让它整理 Excel,它会写一段 Python 代码让你自己去跑;你让它帮你订机票,它会一步一步告诉你去哪个网站、点哪个按钮。中间那道墙,叫做「计算机操作」。GPT-5.4 是 OpenAI 第一个把这道墙拆掉的通用模型。这意味着它处理的不再是「关于任务的对话」,而是「任务本身」。OpenAI 的铺垫如果你一直在跟踪 OpenAI 最近几个月的动作,会发现 GPT-5.4 不是一个突然冒出来的产品,而是一条清晰战略线上的最新落子。就在两周前,OpenAI 刚刚发布了 GPT-5.3-Codex,把 Codex 从「能写代码的 Agent」升级为「几乎能做开发者在电脑上所有事情的 Agent」,并在 SWE-Bench Pro 和 Terminal-Bench 上刷新了行业基准。爽文短剧与此同时,OpenAI 推出了面向企业的「Frontier」平台,HP、Intuit、Uber 已经是早期用户。
頁:
[1]