ASIC芯片专题：揭秘博通大涨之谜系列（一）

来源：九方智投 2024-12-19 20:27

事件：AI芯片行业变天，博通市值突破1万亿美金。12月17日消息，美股AI网络芯片公司博通（Broadcom，NASDAQ: AVGO）近期发布财报后股价飙升，连续两个交易日累计涨38%，收于250美元/股，公司市值已突破万亿美元大关（最新市值为1.17万亿美元），成为全球第九家市值超过1万亿美元的公司，同时也是全球第三家市值超越1万亿的半导体公司。博通CEO陈福阳日前表示，该公司正与3个大客户一起开发ASIC（专用集成电路）AI芯片。他估算，到2027年，市场对定制款AI芯片ASIC（专用集成电路）的需求规模将达600亿-900亿美元。

经过多年的迭代升级，2024年谷歌发布了第六代TPU芯片Trillium，计算性能较上代产品提升4.7倍，内存带宽提升1倍，能耗优化67%。谷歌并未对外销售TPU芯片，但TechInsights预计2023年谷歌自用的TPU芯片已经达到200万颗，仅次于英伟达的市场规模。在AI ASCI芯片领域，英特尔也成为重要的参与者。

在AI ASIC需求快速增长的背景下，以博通、Marvell为代表的公司迎来了业绩爆发期。根据博通发布的财报数据，公司2024财年AI收入大增2.2倍至122亿美元。博通正与三个大型客户开发AI芯片，预计2025年AI芯片业务收入达到150亿-200亿美元。随着AI技术的发展及端侧AI需求的快速增长，ASIC将在AI推理、AI消费电子产品方面扮演着重要的角色。

一、AI芯知多少

作为一种AI芯片，TPU是专用集成电路（ASIC）的代表。主流AI芯片架构包括GPGPU、ASIC和FPGA，一般认为GPGPU为改善CPU效率而生，而TPU可以进一步改善GPGPU未优化完全的部分，三者是从通用到专用不断演进的过程。

目前AI芯片通常采用GPU与ASIC架构。目前通用的CPU、GPU、FPGA等都能执行Al算法，只是执行效率差异较大。但狭义上讲一般将Al芯片定义为“专门针对A算法做了特殊加速设计的芯片”。Al芯片可以分为GPU、FPGA和ASIC架构，根据场景可以分为云端和端侧。

CPU和GPU在架构组成上都包括3个部分：运算单元（ALU）、控制单元（Control）、缓存单元（Cache）。从结构上看，在CPU中，缓存单元占50%，控制单元占25%，运算单元占25%；而在GPU中，运算单元占90%比重，缓存、控制各占5%；由此可见，CPU运算能力更加均衡，GPU更适合做大量运算。

GPU通过将复杂的数学任务拆解成简单的小任务，并利用其多流处理器来并行处理，从而高效地执行图形渲染、数值分析和AI推理。

通常GPU核心可分为三种：CUDACore、TensorCore、RTCore。每个CUDA核心含有一个ALU(整数单元)和一个浮点单元，并且提供了对于单精度和双精度浮点数的FMA指令。

如果将GPU处理器比作玩具工厂，CUDA核心就是其中的流水线。流水线越多，生产的玩具就越多，虽然“玩具工厂”的性能可能会越好，但也受限于每个流水线的生产效率、生产设备的架构、生产存储资源能力等。反应在GPU上，还需考虑显卡架构、时钟速度、内存带宽、内存速度、VRAM等因素。

和其他芯片相比，AI芯片重点增强了运行AI算法的能力。目前主流AI芯片为GPU和ASIC。国际上，Nvidia的H200TensorCoreGPU以其卓越的计算性能和能效比领先市场，而Google的第六代TPUTrilliumASIC芯片则以其专为机器学习优化的设计提供高速数据处理。在国内，寒武纪的思元370芯片（ASIC）凭借其先进的计算处理能力在智能计算领域占据重要地位，已与主流互联网厂商开展深入适配；海光信息的DCU系列基于GPGPU架构，以其类“CUDA”通用并行计算架构较好地适配、适应国际主流商业计算软件和Al软件。