微软Azure智能体服务将多智能体系统的基础设施押注正式化

3. 微软Azure智能体服务将多智能体系统的基础设施押注正式化

微软在Build预览版上发布了Azure智能体服务，这是一个用于大规模协调多智能体AI工作流的托管基础设施层。产品包括：智能体状态管理（跨会话持久记忆）、智能体间通信协议、工具注册表（300多个预置连接器）、可观测性和追踪，以及按智能体的成本归因。定价基于消费；微软拒绝为预览版发布具体费率。

技术架构值得研究。Azure智能体服务使用有向无环图模型进行智能体编排——每个智能体是一个节点，消息是边，运行时管理执行顺序、重试逻辑和状态持久化。这与LangChain的顺序链模型有实质性区别，更接近应用于AI智能体的Temporal工作流模型。这意味着复杂的多智能体系统——智能体A并行调用智能体B和C，等待两者完成，然后将结果传递给智能体D——是一等原语，而非自定义代码。

历史类比是AWS在2006-2007年推出SQS和SNS。在这些服务之前，分布式消息传递是每个团队都略有不同地构建的自定义基础设施。SQS将其标准化，使其更便宜，但也让团队依赖于AWS的实现选择。Azure智能体服务正在对智能体编排做同样的事情。采用它的团队将能够更快地构建——但也将在微软关于智能体工作流应该是什么样子的心智模型上构建。

这与OpenAI的Operators和更广泛的智能体基础设施建设相关联。三家主要AI公司（OpenAI、微软、Google的Agent Space）同时发布了智能体工作流基础设施。这种收敛表明行业共识认为多智能体系统是AI部署的下一个单元——不是单一模型调用，而是专业化智能体的协调流水线。

定价不透明是刻意为之。微软需要了解实际消耗模式，然后才能设定费率。在预览版上构建的团队实际上是在为微软提供将影响正式版定价的成本结构数据。这对微软云预览版来说并不罕见——但这意味着现在构建复杂智能体系统的团队应该以较大的不确定性范围来建模未来的基础设施成本。

为何重要：

在Azure上构建多智能体系统的团队将收敛于微软的编排原语，创造深化Azure承诺的切换成本，超越单纯的算力
按智能体的可观测性和成本归因——听起来像基本功能——实际上是企业采购和成本分摊的最重要竞争功能
LangChain、LlamaIndex和其他Python原生智能体框架面临结构上处于不利地位的平台竞争：微软正在向已经购买Azure的企业销售智能体基础设施

信源：Azure智能体服务公告（微软博客），Build预览详情（The Verge），LangChain回应（LangChain博客）