传媒行业周报:OPENAI将开源新款推理模型 百度发布业界首个端到端语音语言大模型
板块观点与关注标的:1)资源整合预期:中视传媒、国新文化、广西广电、唐德影视、吉视传媒、游族网络等;2)AI:奥飞娱乐、汤姆猫、盛天网络、中文在线、易点天下、视觉中国、盛通股份、焦点科技、豆神教育、世纪天鸿、佳发教育等;3)游戏:建议关注确定性强的神州泰岳、恺英网络、巨人网络、吉比特,关注完美世界、ST 华通、冰川网络;4)国企:慈文传媒、皖新传媒、中文传媒、南方传媒、凯文教育、大晟文化等;5)教育:学大教育、行动教育等;6)港股:关注【阿里巴巴】【腾讯控股】【泡泡玛特】,产业爆发在即的【阜博集团】,K12 教培龙头【新东方】及业绩弹性较大的区域龙头【思考乐教育】【卓越教育】。
【OpenAI 将在未来几个月内开源一款强大的推理模型】4 月1 日,OpenAl首席执行官山姆·奥尔特曼宣布将在未来几个月内开源一款强大的推理模型。
这是自GPT-2 以来,OpenAl 首个开源的模型。该模型将具备与o3-mini 相当的推理能力。这显示OpenAl 正在回归其开源初心。OpenAI 计划在未来几周内启动一系列开发者活动,收集反馈意见并试用早期原型。可见,OpenAl 目前采取开源闭源两手抓的策略。一方面,闭源模式下,OpenAl 可以通过ChatGPT 订阅服务、API 使用费等渠道获得稳定的收入。另一方面,开源则能为OpenAI 打开更多的市场,吸引更多开发者和企业对解决闭源模型带来的用户流失问题,还能帮助OpenAl 减轻其巨大的运营成本压力。
【百度发布业界首个端到端语音语言大模型,已首发上线文小言,可免费体验】4 月2 日,百度发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型文小言,可免费体验。该模型具备超逼真的方言识别能力,能实现情感饱满对话,超低时延,将用户等待时间降至1 秒左右,且调用成本较行业均值下降约50%-90%。模型采用Cross-Attention 跨模态技术,结合Encoder 和语音识别,节省KV 计算,实现情感控制,采用EALLQA 技术降低推理成本。百度计划4 月将模型上线到开放平台,加速大模型在语音交互场景的应用与普及。
【借助新版DeepSeek-V3,DeepSite 应用实现一句话创建游戏/App】借助新版DeepSeek-V3,DeepSite 应用可以实现让任何人可以一次性创建任何应用或游戏了——并且能一边开发一边看效果。与此同时,新版DeepSeek-V3的成绩单出炉——该模型在Hugging Face 竞技场开源模型排名中超越前代DeepSeek-R1 登顶。实测显示,DeepSite 能快速生成贪吃蛇、超级马里奥等经典游戏原型,并在2 分钟内完成企业网站搭建。该工具每日限制生成次数约3-4 次。开发者社区反馈,DeepSite 显著降低编程门槛,被称作“网页版Cursor”。深度求索计划持续优化模型推理效率,推动AI 原生开发工具在开源生态中的应用落地。
风险提示:政策监管风险,竞争加剧风险,宏观环境不确定性风险。