首页新鲜数据AI动态跟踪(六):OPENAIO3、豆包新品首发 关注原生AGENT与多模态推理

AI动态跟踪(六):OPENAIO3、豆包新品首发 关注原生AGENT与多模态推理

时间2025-04-17 21:20:16浏览6

AI动态跟踪(六):OPENAIO3、豆包新品首发 关注原生AGENT与多模态推理

事项:
4 月17 日,OpenAI 公司发布o 系列模型中的最新款o3 和o4-mini,火山引擎发布豆包1.5·深度思考模型等新品。
平安观点:
OpenAI o3、o4-mini 新增图像深度思考与Agent 能力,Codex CLI 智能体开源推动AI 编程生态开放。o3 和o4-mini 被称为是OpenAI 迄今为止发布的最智能的模型,我们认为,在o1 优越能力的背后,核心突破在于运用思维链(chain ofthought)方法来处理复杂任务,而o3 和o4-mini 的主要突破在于两个能力:1)图像深度思考。首次实现在思维链中用图像来思考,结合高级推理与Web 搜索、图像处理等工具(自动缩放、裁剪、翻转或增强图像)。2)Agent 能力(代理能力)。
OpenAI 推理模型首次可以代理使用和组合 ChatGPT 中的各个工具,包括搜索网络、使用Python 分析上传的文件和其他数据、对视觉输入进行深入推理,甚至生成图像。此外,OpenAI 进一步推动AI 编程生态开放,开源了轻量级编程智能体Codex CLI,仅需OpenAI API key 即可零配置启动,开发者可直接从命令行体验多模态推理。
豆包1.5·深度思考模型对标全球推理模型第一梯队,视觉理解模型实现更强视觉定位能力。火山引擎在4 月17 日FORCE LINK AI 创新巡展·杭州站上,发布豆包1.5·深度思考模型等新品,我们认为以下进展值得重点关注:1)推理模型。性能上,豆包1.5·深度思考模型在数学、代码、科学等专业领域推理任务中表现已经达到或接近全球第一梯队水平,对标DeepSeek R1、QWQ-32B 等顶尖模型,并增加了视觉理解能力;功能上,豆包APP 基于豆包1.5·深度思考模型进行了定向训练,可以实现“边想边搜”。2)多模态。升级的豆包·文生图模型3.0 在最新的文生图领域权威榜单 Artif icial Analysis 竞技场中排名全球第一梯队;新版本豆包·视觉理解模型实现更强的视觉定位能力,可应用于线下门店的巡检场景、GUIagent、机器人训练、自动驾驶训练等。3)企业级服务。面向Agent 服务,发布OS Agent、GUI Agent 大模型(豆包1.5·UI-TARS),面向大规模推理,发布AI云原生·ServingKit 推理套件。
投资建议:我们认为,近期包括OpenAI、豆包在内发布的新模型,解题思路在此前思维链CoT 基础上,更多体现对模型原生Agent 能力(即工具使用)以及多模态推理能力的重视。全球大模型领域的竞争依然白热化,我们坚定看好AI 主题的投资机会,当前Agent 在企业端落地进度较为靠前,AI 应用建议关注OA/ERP/编程/办公等领域;算力方面,Agent 将带来更多的推理端应用需求,从而拉动推理端算力乃至整体算力需求向上。当前全球贸易摩擦持续演化,从性价比以及供应链安全的角度,我国国产AI 算力在国内AI 算力市场的接受度将进一步提高,市占率有望进一步提升,我们坚定看好国产AI 算力产业链。标的方面:1)AI 应用:AI+企服,建议关注泛微网络、致远互联、卓易信息、金蝶国际、税友股份、博思软件、普联软件;AI+办公,推荐金山办公、福昕软件、万兴科技,建议关注合合信息。2)AI 算力:推荐海光信息、龙芯中科、浪潮信息、紫光股份、中科曙光、神州数码、工业富联、深信服,建议关注寒武纪、景嘉微、华勤技术、软通动力、拓维信息。
风险提示:1)AI 算力供应链风险上升。2)大模型产品的应用落地低于预期。3)国内大模型算法发展可能不及预期。

本文来源转载:

乐舒适招股说明书专题研究:非洲市场景气向上 乐舒适综合壁垒深厚 策略事件点评报告:如何看待近期市场风险偏好回升?