行情中心 沪深京A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递 科技龙头指数

DEEPSEEK重塑AI时代大模型研发范式:计算机效率革命剑指“暴力计算法则”

国泰君安证券股份有限公司 02-14 00:00

本报告导读:

Deepseek 潜精研思重构AI 研发范式,在训练和推理效率上取得颠覆性成果,硬件需求的平民化有望推动国产算力繁荣发展,本地化部署有望迅速铺开。

投资要点:

投资建议:D eepseek降低对硬件算力的需求,云服务厂商将迎来一波新的增长势头,短期来看现阶段本地部署可能是最适合大型企业和特殊行业企业的AI 调用方式。我们看好本地国产推理算力的爆发,以及如向量数据库等新型基础软件的扩圈。推荐标的:浪潮信息、紫光股份、星环科技-U、软通动力。受益标的:中科曙光、神州数码、拓维信息、拓尔思等。

Deepseek 以“单位算力效能提升10 倍”为目标,通过算法优化降低模型训练与推理成本。Deepseek 打破了 AI 大模型领域 “拼投入” 的固有观念,以极低的成本实现了与行业巨头相媲美的模型性能。在训练成本方面,训练671B 的DeepSeek V3 的成本是557.6 万美元(约合4070 万人民币),仅为Llama 3 的7%,而OpenAI 训练ChatGPT-4o 所花费的成本高达7800 万美元甚至是1 亿美元,还需要上万张英伟达H100 芯片,相比之下DeepSeek-V3 在训练时使用的GPU 是英伟达的H800,一款在性能上被削弱的特供AI 芯片。如今DeepSeek-R1 用不到GPT 5%的成本,便获得了和OpenAI 的顶尖推理模型o1 相当的能力。同时公司采用MIT 协议全栈开源,包括模型权重、训练代码及部署工具链,吸引全球开发者共建生态。

DeepSeek 的技术革命性在于其开创了全新的大模型研发范式。首先DeepSeek 采用了MoE 和MLA 两大创新架构来实现高效的推理和成本效益高的训练;算法层面,动态稀疏化专家网络设计(DynamicMoE),使模型推理过程中仅需调用不足4%的神经网络参数;工程层面,Deepseek 采用FP8 低精度训练框架,相比传统32 位计算方案,能耗降幅高达80%的同时保持模型收敛稳定性;尤为突破的是DeepSeek R1 引入的强化学习驱动范式摆脱了对SFT 的依赖,通过自演进式训练机制,其基于强化学习的冷启动策略仅需行业基准值1/5 的标注数据量即可完成高效训练。这些创新突破共同构建了对"算力军备竞赛"发展路径的系统性颠覆。

开源模型 DeepSeek 在当下的AI 时代将扮演重要角色,就像Android 之于移动互联网革命。它会重构产业生态,引发链式反应,加速上层应用发展与下层系统统一。这将调动起跨越软硬件和上下游的生态力量,促使各方加大 “模型 - 芯片 - 系统” 协同优化与垂直打通的投入,进一步削弱 CUDA 生态优势,为国产 AI 产业发展创造机遇。DeepSeek 通过技术创新,在 AI 模型训练过程中实现了对高端进口芯片依赖的降低,这为国内企业展示了一条可行的技术路径,极大地增强了国内企业自主研发算力芯片的信心。

风险提示:技术研发进展不及预期、资本投入不及预期、市场竞争加剧的风险。

免责声明

以上内容仅供您参考和学习使用,任何投资建议均不作为您的投资依据;您需自主做出决策,自行承担风险和损失。九方智投提醒您,市场有风险,投资需谨慎。

推荐阅读

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈