首页新鲜数据计算机行业周报:阿里深夜开源QWEN2.5-OMNI DEEPSEEK-V3上线新版本

计算机行业周报:阿里深夜开源QWEN2.5-OMNI DEEPSEEK-V3上线新版本

时间2025-04-05 21:00:02浏览16

计算机行业周报:阿里深夜开源QWEN2.5-OMNI DEEPSEEK-V3上线新版本

算力: 算力租赁价格平稳, 阿里深夜开源
Qwen2.5-Omni
3 月 27 日凌晨,阿里通义千问团队发布 Qwen2.5-Omni。
这是 Qwen 系列中全新的旗舰级多模态大模型,专为全面的多模式感知设计,可以无缝处理包括文本、图像、音频和视频的各种输入,同时支持流式的文本生成和自然语音合成输出。
团队提出了 Thinker-Talker 架构,这是一个端到端的多模态模型,旨在感知包括文本、图像、音频和视频在内的多种模态,同时以流式方式生成文本和自然语音响应。此外,团队还提出了一种名为 TMRoPE ( Time-aligned MultimodalRoPE)的新型位置嵌入,用于同步视频输入与音频的时间戳。实时语音和视频聊天方面,该架构专为完全实时交互而设计,支持分块输入和即时输出。它还具备自然且稳健的语音生成:在语音生成方面,Qwen2.5-Omni 超越了许多现有的流式和非流式替代方案,展现出卓越的稳健性在和自然性。
多模态性能强劲:在与同样大小的单模态模型进行基准测试时,Qwen2.5-Omni 在所有模态上均展现出卓越的性能。
Qwen2.5-Omni 在音频能力上超越了同样大小的 Qwen2-Audio,并且达到了与 Qwen2.5-VL-7B 相当的性能;出色的端到端语音指令遵循能力:Qwen2.5-Omni 在端到端语音指令遵循方面的表现可与文本输入的有效性相媲美,这一点在MMLU 和 GSM8K 等基准测试中得到了证明。
Thinker 对于Qwen2.5-Omni 就像大脑一样,负责处理和理解来自文本、音频和视频模态的输入,生成高级表示以及对应的文本。Talker 则像人类的嘴巴,以流式方式接收 Thinker产生的高级表示和文本,并流畅地输出离散的语音 token。
Thinker 是一个 Transformer 解码器,配备有音频和图像的编码器,以便于提取信息。相比之下,Talker 被设计为一种双轨自回归 Transformer 解码器架构。
▌AI 应用: Gemini 搜索访问量环比+6.85% ,DeepSeek-V3 上线新版本
DeepSeek 上线新版本DeepSeek-V3-0324,参数量为6850
亿,相较上个版本参数增幅不大(6710 亿)。DeepSeek V3的一大亮点在于采用MIT 开源协议,上个版本还是自定义许可证,这不仅可以自由修改、分发模型,还支持模型蒸馏、商业化应用。
DeepSeek-V3-0324 所有指标性能暴涨,击败了Claude 3.5Sonnet,成为目前最强的非推理模型。就代码能力来看,DeepSeek-V3-0324 同样能够与Claude 3.5 Sonnet 一决高下。另外,在Aider 的多语言基准测试中,DeepSeek-V3-0324 拿下55% 的成绩,较前代版本显著提升,成为仅次于Sonnet 3.7 的非推理类模型第二名。其表现已可媲美R1 和o3-mini 等具备推理能力的模型。
在 KCORES 大模型竞技场中,Claude-3.7-Sonnet-Thinking无疑是LLM 当之无愧的王者,DeepSeek-V3-0324 以328.3 分拿下第三名,仅次于Claude 3.5 Sonnet。在mandelbrotset-meet-libai 测试中,DeepSeek-V3-0324 没有过多变化,较初版仅仅低了2 分,完成度提升很高。还有在火星任务测试中,DeepSeek-V3-0324 星球渲染正确,所有模型中位列第三。九大行星测试,DeepSeek-V3-0324 真正绘制出了太阳系的完整图。此外, DeepSeek-V3-0324 在MisguidedAttention 基准上,跃居非推理类模型榜首,甚至超越了Claude Sonnet 3.7(非推理模型)。
▌AI 融资动向: 两兄妹再次出手惊艳AI 圈,再次融资250 亿
近日,Anthropic 宣布完成E 轮35 亿美元(约合人民币250亿元)融资,投后估值615 亿美元(约合人民币4450 亿元),这距离Anthropic 上一轮10 亿美元的融资仅仅过去不到10 天。
达里奥·阿莫迪和丹妮拉·阿莫迪兄妹——2021 年离开OpenAI 开始创业,以他们为代表的AI 新贵们正在进行一场史无前例的融资竞赛。2025 年短短3 个月,从OpenAI 到xAI、再到Anthropic,以及OpenAI 前CTO 创立的新AI 公司都在疯狂融资。
通过这项融资,Anthropic 将推进其下一代AI 系统的发展,扩大其计算能力,加深其在机械性和一致性方面的研究,并加速其国际扩张。
诞生于前OpenAI 最早期员工达里奥·阿莫迪和妹妹丹妮拉·阿莫迪之手,Anthropic 融资之路可谓势如破竹。就在两个月前已经获得来自谷歌的10 亿美元投资,估值一度增长至600 亿美元,条件之一是必须使用谷歌的云服务,在此之前,Anthropic 也和亚马逊签过类似的条款。
2025 年仅过去四分之一,Anthropic 就拿下了超45 亿美元。
而再回过头来看,从2021 年2 月创立开始,Anthropic 已经
陆陆续续完成10 多轮融资,估值飙升至615 亿美元(约合人民币4400 亿元),是崛起速度最快的AI 公司之一。
▌投资建议
DeepSeek-V3-0324 的新版本代码能力显著提升,数学与逻辑推理能力增强,模型架构与开源生态进一步提升,凸显中国AI 企业在技术与成本上的竞争力,更重要的是,其性能跳跃表明该团队可能在为后续重大版本铺路。目前,借助借助新版 DeepSeek-V3,Ai 应用将在垂直领域加速渗透。建议关注临床 AI 产品成功落地验证的嘉和美康(688246.SH)、以AI 为核心的龙头厂商科大讯飞(002230.SZ)、芯片技术有望创新突破的寒武纪(688256.SH)、高速通信连接器业务或显著受益于 GB200 放量的鼎通科技(688668.SH)、已与Rokid 等多家知名AI 眼镜厂商建立紧密合作的亿道信息(001314.SZ)、加快扩张算力业务的精密零部件龙头迈信林( 688685.SH ) 、持续加码高速铜缆的泓淋电力(301439.SZ)、新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技(301196.SZ)等。
风险提示
1)AI 底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI 应用落地效果不及预期。4)推荐公司业绩不及预期风险。

本文来源转载:

深高速(600548):未来减值风险可控 定增落地助力发展 建筑装饰行业研究周报:“对等关税”超预期 重申内需复苏投资逻辑