首页新鲜数据AI系列跟踪(70):OPENAI正式发布O3和O4-MINI 豆包1.5和可灵AI2.0相继发布

AI系列跟踪(70):OPENAI正式发布O3和O4-MINI 豆包1.5和可灵AI2.0相继发布

时间2025-04-22 20:21:02浏览5

AI系列跟踪(70):OPENAI正式发布O3和O4-MINI 豆包1.5和可灵AI2.0相继发布

事件描述
近期国内外AI 厂商相继推出了最新产品:4 月15 日,快手正式推出了可灵AI2.0,并介绍了全新交互理念MVL;4 月17 日凌晨,OpenAI 正式宣布推出o3 模型和 o4-mini 模型 ;同日,火山引擎发布豆包1.5·深度思考模型。
事件评论
可灵2.0 发布全新多模态交互技术,构建以用户为中心的内容生态。继可灵AI1.0 发布10个月后,快手正式推出了可灵AI2.0,在本次2.0 模型的迭代中,可灵AI 正式发布AI 视频生成的全新交互理念Multi-modal Visual Language(MVL)。基于MVL 理念,可灵AI正式推出多模态编辑功能,用户可以非常直接地把自己的想法用图像等方式作为输入,生成符合自己想法的创意视频。我们认为在多模态交互技术的持续优化下,进一步降低创作门槛,实现更精准的复杂创意表达,并通过B 端生态扩展与全球开发者合作,推动AI 生成内容在影视、广告等行业的深度应用和以用户为中心的内容生态。
“链式推理机制”+“图像思维链”,展现AI 大模型对复杂任务处理和多模态交互的巨大潜力。OpenAI 于4 月17 日正式推出o3 模型和 o4-mini 模型。o3 和o4-mini 是OpenAI目前最智能的模型,比前身o1 和o3-mini 也更高效,同时成本也更低。1)链式推理机制:o3 首次引入链式思维(Chain-of-Thought)机制,模拟人类分步骤思考过程;2)图像思维链:两大模型首次实现“用图像思考”,将视觉信息直接嵌入推理链。用户上传的模糊草图、倒置图表可被实时旋转、缩放并辅助分析;3)工具自主调用:模型支持网络搜索、代码解析、图像生成等工具的智能组合调用,自主调用工具是Agent 能力最重要的体现,随着OpenAI 的O 系列、DeepSeek-R1 等推理模型日趋成熟,AI Agent 能力将迎来显著提升。我们认为o3 与o4-mini 的发布,为行业展现了AI 在复杂任务处理与多模态交互中的可能性,未来有望加速AI 从“智能工具”向“智能伙伴”的转型。
技术突破与多模态的深度结合,国产大模型为专业领域与通常场景提供更多AI 解决方案的可能性。4 月17 日火山引擎发布豆包1.5·深度思考模型,模型采用MoE 架构,总参数为200B,激活参数仅20B,具备显著的训练和推理成本优势。本次豆包模型在多模态能力上进行了深度拓展升级:1)视觉推理:支持图像分析,结合视频理解能力,实现语义搜索和动态内容分析;2)文字图升级:文生图模型3.0 支持2K 高清生成,文字排版更美观。截至2025 年3 月,豆包大模型日均tokens 调用量超12.7 万亿,较发布初期增长106 倍,我们认为随着技术突破与多模态融合,国产大模型在推理能力与实用性上有了显著提升,未来有望为专业领域与通常场景提供更多高效、低成本的AI 解决方案。
AI 技术与多模态交互的快速发展,提供了更多应用场景的可能性,未来有望加速AI 应用落地。多模态交互技术的升级帮助用户降低创作门槛并提升了转化效率;随着技术突破,AI 大模型在复杂任务处理和多模态交互中开始展露发展潜力,我们认为内容赛道作为最适合的商业化落地场景之一,建议关注AI 在游戏、影视、广告、IP 及衍生品等领域的商业化落地和投资机会。
风险提示
1、AI 技术发展及应用落地不及预期风险;2、内容监管风险。

本文来源转载:

游戏产业跟踪(10):游戏行业密集迎来政策催化 网络出版及游戏出海获政策支持 达梦数据(688692):受益于信创进程加速 业绩实现较快增长