ScatterAI
Issue #1 · 2026年3月14日

OpenAI 发布 GPT-5.4:配备 100 万 Token 上下文窗口与原生计算机操作能力,剑指专业工作流程

Industry

1. OpenAI 发布 GPT-5.4:配备 100 万 Token 上下文窗口与原生计算机操作能力,剑指专业工作流程

OpenAI 发布了其最新前沿模型 GPT-5.4,并明确将其定位于专业工作场景——该模型具备最先进的编程基准表现、原生计算机操作能力、集成工具搜索功能,以及 100 万 token 的上下文窗口。100 万 token 这一数字绝非渐进式提升:它意味着单次模型调用现在可以处理约 75 万个英文单词,相当于同时处理多个完整的大型技术代码库。“专业工作”这一明确定位表明,OpenAI 已不再将其作为通用聊天机器人升级版来推介,而是将其定位为多个专业企业软件品类的直接替代方案。

这一竞争态势对 Anthropic 和 Google 的冲击最为显著。Anthropic 的 Claude 3.5 Sonnet 在编程任务上积累了相当可观的企业级市场份额,Google 的 Gemini 1.5 Pro 也率先开创了长上下文赛道,但 GPT-5.4 的到来将三大竞争维度(长上下文、计算机操作、智能体工具搜索)集于单一模型之中,无需客户自行拼凑组合。作为 OpenAI 通过 Azure OpenAI Service 和 Copilot 布局的分发核心,Microsoft 得以立即借势重启此前因能力差距而陷入僵局的企业采购谈判。Anthropic 所承受的压力尤为紧迫,因为其企业业务长期以编程能力优势作为核心差异化竞争点。

历史上最贴切的类比是 2007 年 iPhone 的横空出世——并非因为 GPT-5.4 是消费设备,而是因为它将此前需要独立最优工具才能实现的能力(浏览器、电话、音乐播放器)整合进一个统一平台。企业软件发展史表明:一旦集成产品在每个单项维度上都跨越”足够好”的门槛,集成方案在采购决策中便会胜过单点解决方案。OpenAI 的明确赌注在于:GPT-5.4 已同时在编程、长文档分析和智能体计算机操作三个维度上越过了这一门槛。

此次发布与本周业内可见的更宏观的智能体基础设施建设趋势直接呼应。将计算机操作作为原生模型能力,而非附加的 API 层,意义重大——它消除了延迟与可靠性方面的瓶颈,而正是这一瓶颈使得基于浏览器的智能体在生产环境中极为脆弱。100 万 token 的上下文窗口,也与 GitHub Copilot 和 Cursor 竞相满足的”全代码库理解”需求加速增长的趋势高度契合,暗示 OpenAI 正更直接地与开发工具领域的现有玩家展开竞争,而不仅仅是与基础模型同行角力。

这里的飞轮效应是一种经典的平台锁定机制:更长的上下文窗口支撑更复杂的智能体任务,更复杂的智能体任务产生更丰富的使用数据和用户工作流依赖,这些依赖提升了迁移成本,更高的迁移成本则为溢价定价提供支撑,进而资助下一代能力的研发。计算机操作能力加速了这一循环——一旦企业工作流由模型直接执行(点击、填表、操作内部工具),集成深度便几乎不可能在不付出巨大重新实施成本的情况下被逆转。OpenAI 销售的不仅仅是一个更好的模型,而是一个工作流底层基础设施。

为何重要:

来源:Introducing GPT-5.4