传媒行业周报:英伟达开源推出253B模型 META发布开源大模型LLAMA4
板块观点与关注标的:1)资源整合预期:中视传媒、国新文化、广西广电、唐德影视、吉视传媒、游族网络等;2)AI:奥飞娱乐、汤姆猫、盛天网络、中文在线、易点天下、视觉中国、盛通股份、焦点科技、豆神教育、世纪天鸿、佳发教育等;3)游戏:建议关注确定性强的神州泰岳、恺英网络、巨人网络、吉比特,关注完美世界、ST 华通、冰川网络;4)国企:慈文传媒、皖新传媒、中文传媒、南方传媒、凯文教育、大晟文化等;5)教育:学大教育、行动教育等;6)港股:关注【阿里巴巴】【腾讯控股】【泡泡玛特】,产业爆发在即的【阜博集团】,K12 教培龙头【新东方】及业绩弹性较大的区域龙头【思考乐教育】【卓越教育】。
【英伟达开源推出 Llama Nemotron Ultra 253B 模型】4 月9 日,英伟达开源推出Llama Nemotron Ultra 253B 模型。该模型在GPQA 科学推理基准中以76 分登顶,超越了Meta 的Llama 4。它基于Llama 3.1 405B 微调,拥有2530 亿参数,可在多GPU 服务器上实现高准确性。其核心技术是测试时Scaling,通过动态分配计算资源,提升模型性能。Nemotron Ultra 在多项基准测试中表现优异,直逼DeepSeek R1。该模型的开源降低了企业部署成本,为学术研究提供了试验场,结合英伟达即将量产的芯片,其软硬协同战略清晰,旨在构建生态系统并获取算力红利。
【Meta 发布开源大模型Llama 4,首次采用了混合专家(MoE)架构】4 月5日,Meta 发布了其最强大的开源人工智能模型Llama 4。该模型首次采用了混合专家(MoE)架构,包含多个专注于特定任务的“专家”子模型,显著提升了训练和回答用户查询的效率。Llama 4 的两个版本Scout 和Maverick 分别拥有1090 亿和4000 亿参数,具备多模态能力,能够处理文本、视频、图像和音频等多种数据格式。Meta 表示,Llama 4 是其“迄今为止最先进的模型”,并在多模态领域中处于领先地位。Meta 还计划推出更强大的Behemoth模型,进一步巩固其在人工智能领域的地位。
【Kimi 开源轻量级视觉语言模型Kimi-VL 及其推理版Kimi-VL-Thinking】4 月10 日,Kimi 团队在北京发布了开源轻量级视觉语言模型Kimi-VL 及其推理版Kimi-VL-Thinking。该模型基于MoE 架构,总参数为16B,但推理时仅激活2.8B,具备强大的多模态推理和Agent 能力,支持128K 上下文窗口,并采用相对宽松的MIT 许可证。在基准测试中,Kimi 新模型超越了GPT-4o 等规模更大的模型,展现了卓越的性能。目前,两款模型均已上架Hugging Face,分为Instruct 基础版和Thinking 推理版。
风险提示:政策监管风险,竞争加剧风险,宏观环境不确定性风险。