首页新鲜数据计算机行业动态报告:端到端训练开启AGENT新范式 四月国产AGENT迎集中发布潮

计算机行业动态报告:端到端训练开启AGENT新范式 四月国产AGENT迎集中发布潮

时间2025-04-07 14:43:58浏览11

计算机行业动态报告:端到端训练开启AGENT新范式 四月国产AGENT迎集中发布潮

核心观点:当前预训练大模型边际收益受制于Scaling Law已经逐渐达到瓶颈,更强大的Agent(智能体)成为大模型厂商未来发力的重要方向。我们认为,根据agent的技术框架,其发展基本经历了三个阶段,即工作流框架+预训练模型、工作流框架+推理模型、端到端智能体框架+推理模型。随着以OpenAI DeepResearch为代表的第三代智能体的推出,智能体的强大潜力与Scaling Law加速阶段正逐渐显现。我们认为,受益于国产推理模型的强大能力基座,未来国产第三代智能体将展现出巨大的竞争力。
AI Agent成为大模型公司发力方向。当前,大模型成本投入过大,预训练边际收益在放缓,数据面临边界,以及以DeepSeek为代表的开源模型崛起,单纯的API模式无法支撑模型厂商盈利。因此,更聪明,能推理,能调用不同工具,能满足个性化需求,在应用层可实现更高价值链的AIAgent成为大模型公司急需发力的方向。
端到端强化学习的智能体框架Agent上限更高。围绕架构可以将智能体划分为Workflow(工作流)和端到端的Agent(智能体)两类框架,后者上限更高。其核心突破在于主动决策与动态规划,实现了内化思维链(CoT)与行动链(CoA)生成能力、动态选择最优工具优化API调用、跨会话行为优化等效果。相较于传统工作流,端到端Agent框架标志着AI系统从“流程执行者”向“目标驱动型决策主体”的范式跃迁。而工作流驱动的Agent核心依赖人工设计的规则与提示词通过结构化步骤完成任务,这类工作流的典型特征表现为被动响应机制。
我们认为,智能体可以主要分为三类:一是纯基于工作流框架的智能体。二是基于工作流框架,依靠推理模型进而具备长思维链能力的智能体。三是基于端到端智能体框架,实现CoT+CoA双轮驱动任务推进的智能体,这一代智能体最大限度地拓展了自身能力边界。根据大模型Scaling Law,第三代智能体的能力目前还处于加速扩展的阶段,主要受益于推理模型的升级和强化学习技术的快速突破。
随着OpenAl Deep Research和Claude 3.7 Sonnet的推出,我们看到针对任务的强化学习在推理过程发挥强大作用,更在工具调用,任务执行方面体现了强大潜力。我们认为,国产模型在强化学习的出色表现,将为下一步Agent的发展打下坚实基础,相信4月开始将陆续有国产优秀的Agent涌现出来,成为AI落地的重要场景。
风险提示:大模型技术发展不及预期、商业化落地不及预期、政策监管力度不及预期、数据数量与数据质量不及预期。

本文来源转载:

广电计量(002967):业绩超预期 新兴成长+提质增效双轮驱动 中国中铁(601390):Q4现金流显著改善 优化股东回报