牛财金

计算机算力芯片CPU、GPU、TPU、NPU、FPGA、ASIC有什么不同？

算力

2023-11-15

现在人工智能AI、云计算、大数据都离不开计算机的主要算力芯片。

算力芯片分为通用算力芯片和专用算力芯片。

通用算力芯片有CPU等，专用芯片芯片有GPU、NPU、TPU、FPGA、ASIC等。

CPU、GPU、NPU、TPU、FPGA、ASIC有什么区别呢？

英文简称	英文	中文
CPU	Central Processing Unit	中央处理器
GPU	Graphics Processing Unit	图形处理器
APU	Accelerated Processing Unit	加速处理器
DPU	Data Processing Unit	数据处理器
NPU	Neural Network Processing Unit	神经网络处理器
TPU	Tensor Processing Unit	张量处理器
FPGA	Field-Programmable Gate Array	现场可编程门阵列
ASIC	Application-Specific Integrated Circuit	应用于特定目的的集成电路

CPU

CPU，中央处理器，是一种通用处理器，例如我们个人PC里的Intel CPU, AMD CPU, 主要用于计算机的通用处理，如文本处理、图形处理、多媒体处理等。CPU一般采用串行方式处理指令，适合于顺序执行的任务，但处理大规模并行计算时效率不高。

GPU

GPU，图形处理器，是一种专用处理器，主要用于图形、影像、视频等计算密集型应用。最早GPU是用在图像处理方面，是特别处理3D游戏。喜欢打游戏的人都需要有一个高性能的GPU。AI计算兴起以后，NVIDIA等公司利用GPU的并行处理方式，同时处理多个指令，算力比CPU高，但功耗也较高。NVIDIA公司开发的GPU有很多应用, 例如：人脸识别，机器学习，Chat-GPT等。目前，GPU是AI算力的主力。

DPU

DPU ，数据处理器，是一个新型可编程多核处理器，是一块 SoC（System On Chip）芯片。它符合行业标准，具有很高的算力，还具备高性能的网络接口，能高速解析、处理数据，并高效地将数据传输到 CPU 和 GPU 。DPU 和 CPU 的最大不同，是 CPU 擅长通用性计算任务（什么任务都能接，比较“杂”），而 DPU 更擅长基础层应用任务（做特定的任务，比较“专注”），例如网络协议处理，交换路由计算，加密解密，数据压缩等“脏活累活”。所以说， DPU 是 CPU 的一个好帮手，CPU 、GPU、DPU是数据中心的关键铁三角。

例如，2021年4月，NVIDIA推出的数据处理器BlueField-3 DPU，是首款为 AI 和加速计算而设计的 DPU ，针对多租户、云原生环境进行了优化，提供数据中心级的软件定义和硬件加速的网络、存储、安全和管理等服务。据称，一个 BlueField-3 DPU 所提供的数据中心服务，可相当于多达300个 x86 核才能实现的服务。这就释放了大量的 CPU 资源，用于运行关键业务应用。

NPU

NPU，神经网络处理器，是专门用于执行神经网络计算任务的处理器，其设计目的是为了提高深度学习模型的训练和推理速度，主要用于加速人工智能和机器学习任务，包括图像识别、语音识别、自然语言处理等。神经网络模型通常由大量的矩阵运算组成，而NPU通过专门的硬件架构和指令集，可以高效地进行这些运算，提供更快速和高效的计算能力。NPU通常采用定制化的硬件架构和算法，以满足神经网络计算的特殊需求。

它采用了一些特殊的技术和优化，如量化计算、稀疏计算等，以提高神经网络计算的速度和效率。NPU的出现使得手机等设备能够在本地进行更复杂和高性能的人工智能任务，而无需依赖云端的计算资源。这为诸如人脸解锁、智能摄影、语音助手等功能提供了更快速和实时的支持。

NPU的优势在于可以高效地执行神经网络计算任务，但相对于CPU和GPU而言，其通用性更低，只适用于特定的应用场景。NPU通常需要与CPU和GPU协同使用，以实现最佳的性能和效果。

TPU

TPU，张量处理器，它是一种专门用于加速神经网络等机器学习算法的处理器。TPU是由谷歌开发、并使用在其云平台上的自定义ASIC芯片。TPU最初是为了提高谷歌自己的人工智能服务如搜索、翻译、语音识别等而设计的，后来也向第三方开放了使用权限。

TPU的结构主要由两部分组成：矩阵乘法单元（MXU）和向量运算单元（VPU）。矩阵乘法单元负责执行矩阵乘法等密集计算，它可以在每个时钟周期内完成256x256个16位浮点数的乘法和加法运算。向量运算单元负责执行向量加法、减法、乘法、除法等运算，它可以在每个时钟周期内完成4096个8位整数或1024个32位浮点数的运算。

FPGA

FPGA，现场可编程门阵列，是一种可编程逻辑器件，可以按照用户需求进行编程，实现各种特定的逻辑功能。FPGA具有低延迟、高吞吐量、低功耗、可编程重构等优点，适合于各种实时计算和信号处理任务。FPGA优点是超高的灵活性和超短的设计迭代周期。

FPGA的局限性：

1、基本单元的计算能力有限；

2、速度和功耗有待提升；

3、FPGA 价格为昂贵。

FPGA大部分用于ASIC设计公司的开发验证，很少用在产品上。用FPGA做产品的目的大部分是为了抢上市时间，后期再换成便宜的ASIC。

ASIC

ASIC，特定应用集成电路，是专门设计用于特定应用的芯片。因为可以实现高度定制化的计算，ASIC产品被广泛用于加速AI工作负载，具有极高的性能。与通用集成电路不同，ASIC电路是根据特定的应用要求进行设计和定制的，其功能非常专一。ASIC一般用于需要高度可靠性、高速度和低功耗等特定要求的应用中，例如计算机、工业控制、电信、医疗仪器、军事等领域。

与GPU和FPGA的灵活性不同，定制化的ASIC 一旦制造完成将不能更改，所以初期成本高、开发周期长的使得进入门槛高。目前，大多是具备 AI 算法又擅长芯片研发的巨头参与，例如，Google在2016年推出的TPU。 2017年，斯坦福大学推出基于新神经形态计算架构的ASIC 芯片Brainstorm，运算速度为普通电脑9,000倍，可模拟约100 万个大脑神经元、几十亿个突触连接

ASIC芯片有哪些优点？

ASIC芯片有以下几个优势

1. 集成优势：因采用定制化设计，ASIC 芯片系统、电路、工艺高度一体化，有助于客户获得高性能集成电路。如 TPU1 是传统 GPU 性能的 14-16 倍，NPU 是 GPU 的 118 倍。

1. 面积优势：ASIC 芯片在设计时充分利用单位运算单元能，避免冗余计算单元存在，有利于缩小芯片体积。

2. 能耗优势：ASIC 芯片单位算力能耗相对 CPU、GPU、FPGA 较低，如 GPU 每算力平均约消耗 0.4 瓦电力，ASIC 单位算力平均消耗约 0.2 瓦电力，更能满足新型智能家电能耗的限制。

4. 价格优势：受到体积小、运行速度高、功耗低等特点影响，ASIC 芯片价格远低于CPU、GPU、FPGA 芯片。当前全球市场ASIC 芯片平均价格约为3 美元，远期若达到量产规模，ASIC 芯片价格有望保持持续下降态势。

ASIC芯片有哪些缺点？

ASIC芯片的缺点

1. ASIC芯片设计开发周期长。

2. 对算法依赖性较高。人工智能算法高速更新迭代，导致ASIC芯片更新频率较高。