本文由半导体产业纵横(ID:ICVIEWS)编译自techspot
引领芯片制造进入模块化新时代。
![]()
虽然小芯片(Chiplet)已经存在了几十年,但如今它们已成为芯片制造领域最热门的趋势,为从个人电脑到服务器、手机和可穿戴设备等数百万台设备提供动力。
虽然小芯片已经存在了几十年,但其使用在历史上仅限于特定的专业应用。然而,如今它们处于技术的最前沿,为全球数百万台台式电脑、工作站、服务器、游戏机、手机甚至可穿戴设备提供支持。
短短几年间,大多数领先的芯片制造商都已采用小芯片技术来推动创新。现在很明显,小芯片即将成为行业标准。让我们来探索一下是什么让它们如此重要,以及它们如何塑造技术的未来。
什么是 Chiplet?芯片组是分段式处理器。它不是将每个部分整合到单个芯片中(称为单片方法),而是将特定部分制造为单独的芯片。然后使用复杂的连接系统将这些单独的芯片安装到单个封装中。
这种安排使得受益于最新制造方法的部件尺寸缩小,提高了工艺效率,并使其能够容纳更多的组件。
硅科学要充分理解处理器制造商为何转向使用小芯片,我们必须首先深入研究这些设备是如何制造的。CPU 和 GPU 最初是由超纯硅制成的大圆盘,直径通常略小于 12 英寸(300 毫米),厚度为 0.04 英寸(1 毫米)。
硅片经过一系列复杂的工序,形成多层不同的材料层——绝缘体、电介质和金属。这些层的图案是通过一种称为光刻的工艺创建的,其中紫外线照射到放大的图案(掩模版)上,然后通过透镜缩小到所需的尺寸。
这种图案以一定的间隔在晶圆表面重复出现,最终每个图案都会变成一个处理器。由于芯片是矩形的,而晶圆是圆形的,因此图案必须与光盘的周边重叠。这些重叠部分最终会被丢弃,因为它们没有功能。
完成后,使用探针对每个芯片进行测试。电气检查结果会根据一系列标准告知工程师处理器的质量。这个初始阶段称为芯片分级,有助于确定处理器的“等级”。
例如,如果芯片要用作 CPU,则每个部件都应正常工作,在特定电压下在一定范围的时钟速度内运行。然后根据这些测试结果对每个晶圆部分进行分类。
完成后,晶圆被切割成可供使用的单个部件,即“芯片”。然后,这些芯片被安装到类似于专用主板的基板上。处理器在准备分发之前还要经过进一步的封装(例如,使用散热器)。
整个过程可能需要数周的制造时间,台积电和三星等公司对每片晶圆收取的费用很高,根据所使用的工艺节点,费用在 3,000 美元到 20,000 美元之间。
“工艺节点”是用来描述整个制造系统的术语。从历史上看,它们以晶体管的栅极长度命名。然而,随着制造技术的进步和元件尺寸的不断缩小,命名不再遵循芯片的任何物理方面,现在它只是一种营销工具。
尽管如此,每个新的工艺节点都比其前身带来好处。它可能生产成本更低、在相同时钟速度下消耗更少的功率(反之亦然),或者密度更高。后一个指标衡量给定芯片面积内可以容纳多少个组件。在下图中,您可以看到 GPU(PC 中最大、最复杂的芯片)多年来的发展情况……
![]()
工艺节点的改进为工程师提供了一种提高产品功能和性能的方法,而无需使用大而昂贵的芯片。然而,上图只展示了部分情况,因为并非处理器的每个方面都能从这些进步中受益。
芯片内的电路可分为以下几大类:
- 逻辑——处理数据、数学和决策
- 内存——通常是 SRAM,用于存储逻辑数据
- 模拟——管理芯片与其他设备之间的信号的电路
不幸的是,虽然随着工艺节点技术的每一次重大进步,逻辑电路的体积都在不断缩小,但模拟电路却几乎没有变化,而 SRAM 也开始达到极限。
![]()
虽然逻辑仍然占据芯片的最大部分,但近年来,当今 CPU 和 GPU 中的 SRAM 数量已显著增加。例如,AMD 在其 Radeon VII 显卡(2019 年)中使用的 Vega 20 芯片总共具有 5 MB 的 L1 和 L2 缓存。仅仅两代 GPU 之后,为 Radeon RX 6000 系列(2020 年)提供支持的 Navi 21 芯片就包含超过 130 MB 的组合缓存——显著增加了 25 倍。
随着新一代处理器的开发,我们可以预计这些成本将继续增加,但由于内存的缩小幅度不如逻辑的缩小幅度,在同一工艺节点上制造所有电路的成本效益将越来越低。
在理想情况下,人们会设计一个芯片,其中模拟部分在最大和最便宜的节点上制造,SRAM 部分在小得多的节点上制造,逻辑部分则保留给绝对尖端技术。不幸的是,这在实践中无法实现。不过,还有另一种方法。
分而治之1995 年,英特尔推出了 Pentium II,这是其原始 P5 处理器的继任者。它与当时其他处理器的不同之处在于隐藏在塑料外壳下的设计:一块电路板容纳两个芯片。主芯片包含所有处理逻辑和模拟系统,而一个或两个独立的 SRAM 模块用作二级缓存。
虽然主芯片由英特尔制造,但缓存来自外部供应商。这种方法在 20 世纪 90 年代中后期成为台式电脑的标准配置,直到半导体制造技术的进步使得逻辑、内存和模拟系统能够完全集成到单个芯片中。
![]()
英特尔奔腾 II – 中央处理器在中间,缓存芯片在右边。
虽然英特尔继续尝试在同一封装中集成多个芯片,但它在很大程度上坚持所谓的单片处理器方法,即一个芯片可以实现所有功能。对于大多数处理器而言,不需要多个芯片,因为制造技术足够精湛(且价格合理),可以保持简单。
然而,其他公司对采用多芯片方法更感兴趣,其中最著名的是 IBM。2004 年,人们可以购买 POWER4 服务器 CPU 的 8 芯片版本,该版本包含四个处理器和四个缓存模块,全部安装在同一机箱内(称为多芯片模块或 MCM 方法)。
大约在这个时候, “异构集成”一词开始出现,部分原因是DARPA 所做的研究工作。异构集成旨在将处理系统的各个部分分开,在最适合每个部分的节点上单独制造,然后将它们组合到同一个封装中。
如今,这种技术更广为人知的名字是系统级封装(SiP),自诞生之日起就一直是智能手表配备芯片的标准方法。例如,Apple Watch Series 1 就在一个结构内安装了一个 CPU、一些 DRAM 和 NAND 闪存、多个控制器和其他组件。
![]()
Apple S1 SiP 的 X 光照片。来源:iFixit
通过将不同的系统全部放在一个芯片上(称为 SoC 或片上系统)可以实现类似的设置。但是,这种方法无法利用不同的节点价格,也无法以这种方式制造每个组件。
对于技术供应商来说,将异构集成用于小众产品是一回事,但将其用于大多数产品组合又是另一回事。这正是 AMD 对其处理器系列所做的。2017 年,这家半导体巨头推出了单芯片 Ryzen 台式机 CPU,并推出了Zen 架构。仅仅几个月后,AMD 就推出了两条多芯片产品线:Threadripper 和 EPYC,后者的配置最多可达四个芯片。
两年后,随着 Zen 2 的推出,AMD 全面拥抱了 HI、MCM、SiP(随便你怎么称呼它们)。他们将大部分模拟系统从处理器中移出,并将它们放入单独的芯片中。这些芯片采用更简单、更便宜的工艺节点制造,而其余逻辑和缓存则采用更先进的工艺节点。因此,小芯片成为了流行的流行词。