解密英伟达芯片架构命名:科学巨匠的数字重生
发布时间:2025-05-05 23:55:25 来源:雷电竞下载APP官网在万众瞩目的 2025 GTC 大会上,Nvidia 首席执行官黄仁勋正式揭晓了新一代 AI 图形处理器的详情信息,并以「证实暗物质存在」的女性科学先驱——美国天文学家 Vera Rubin 的名字来命名。
虽然此前 Nvidia 官方并未解释过其命名惯例,也没有强调其选择的偏向性,但 Nvidia 的芯片名称突出了女性和少数族裔科学家,多方媒体及网友们认为,这是当前美国社会多元化倡议 (DEI) 政策收缩背景下,彰显科技界包容性、多样性的独特案例。
回顾 Nvidia 每一代芯片架构,显而易见,Robin 并不是第一位被用于 Nvidia 芯片命名的科学家。早期,公司的首款芯片是基于「Fahrenheit」(华氏温标创始人)命名,而自 CUDA 诞生后(1998 年),Nvidia 开启了以科学家名称命名的新篇章,以此向 AI 领域的先驱们致敬,甚至曾出售一款员工专用 T 恤,上面印着几位著名科学家的卡通形象。
截至目前发布,已经有 11 款芯片架构代号取自科学家名字。这些名字背后,不仅凝聚了人类科学智慧的巅峰成就,也似乎寄托着 Nvidia 在 AI 征程中对科学技术创新的致敬与传承。下面,笔者将从架构命名的视角切入,带你重新了解这些芯片。
尼古拉·特斯拉于 1856 年出生在奥地利帝国斯米良(现属克罗地亚),自幼对科学展现出浓厚兴趣。在其科研生涯中,最大的成就是设计出现代交流电 (AC) 供电系统,打破了直流电一统天下的局面,让电力得以更高效、广泛地传输和使用,极大推动了第二次工业革命。
1891 年,他还发明了特斯拉线圈,这一装置在现代的无线电和电视设备等电子装备中仍被大范围的应用。尽管特斯拉一生历经坎坷,晚年穷困潦倒,但他的创新精神和众多发明影响深远。
NVIDIA Tesla 是全球机器先进的数据中心 GPU,Tesla 加速器有能力以前所未有的超快速度运行更大型的模拟。Nvidia 的 Tesla 架构作为其首个实现统一着色器模型的微架构,提升了 GPU 灵活性与效率,支持 C 语言编程,为后续 GPU 发展奠定了基础。
Fermi 架构发布于 2010年,名字取自意大利-美国著名物理学家恩里科·费米 (Enrico Fermi)。
Fermi 生于 1901 年,是美国芝加哥大学物理学教授。他对量子力学、核物理、粒子物理以及统计力学都做出了杰出贡献,曼哈顿计划期间领导制造出世界首个核子反应堆(芝加哥 1 号堆),也是的设计师和缔造者之一,被誉为「原子能之父」。
Fermi 拥有数项核能相关专利,并在 1938 年因研究由中子轰击产生的感生放射以及发现超铀元素而获得了诺贝尔物理学奖。他是物理学日渐专业化后少数几位在理论和实验方面皆能称作佼佼者的物理学家之一。
Fermi 架构是 NVIDIA 第一个完整的 GPU 计算架构,支持 ECC 和多任务 CUDA Core 处理,强化了 GPU 的计算能力和错误修正能力。Fermi 引入了多个图形处理簇 (GPCs),每个包含多个流处理多处理器 (SMs),都具备较高的并行解决能力和更好的散热效果。
Kepler 出生于 1571 年,是十七世纪科学革命的关键人物,是早期支持哥白尼的「日心说」理论的关键人物。他发现了行星运动三大定律,即轨道定律、面积定律和周期定律,并且赢得「天空立法者」的美名。
这些杰作对艾萨克·牛顿影响极大,启发其后续推导出「万有引力定律」。同时他对光学、数学也作出了重要的贡献,可谓是现代实验光学的奠基人。
Kepler 首次支持 GPU Direct 技术,使得多个 GPU 之间可以直接进行数据传输,避免通过 CPU 中转,减少延迟和增加带宽。通过优化 CUDA Core 的布局和性能,明显提高了 GPU 的能效比。引入了动态并行技术,允许 GPU 在执行过程中动态调整并行任务的数量和类型,极大地提升了灵活性和计算效率。
他生于 1831 年,在少年时期就展现了对于几何学的研究热情,开始对正多面体进行研究。但在 13 岁前,他的学习成绩却并不突出。在1864年发表的论文《A Dynamical Theory of the Electromagnetic Field》中,Maxwell 提出电场和磁场以波的形式以光速在空间中传播,并提出光是引起同种介质电场和磁场中许多现象的电磁扰动,同时在理论上预测了电磁波的存在。
此外,他还推进了分子运动论的发展,提出了彩色摄影的基础理论,奠定了结构刚度分析的基础。其最大功绩是提出了将电、磁、光统归为电磁场现象的麦克斯韦方程组。他在电磁学领域的功绩实现了物理学自艾萨克·牛顿后的第二次统一。
Maxwell 架构减少了每个处理块的 CUDA Core 数量,增加了更多的控制逻辑,使得 GPU 能够在同等功耗下提供更高的性能。此外,Maxwell 引入了第一代 DSR 技术和 MFAA 技术,提升了图形质量和渲染效率。GM107 核心(如 GeForce GTX 750 Ti),能效提升一倍,支持 DirectX 12。
Pascal 架构发布于 2016 年,命名来源于有着「全能王」称号的布莱兹·帕斯卡 (Blaise Pascal)。
他生于 1623 年,是法国著名的神学家、哲学家、数学家、物理学家、化学家、音乐家、教育家、气象学家。Pascal 早期研究自然和应用科学,对机械计算器的制造和流体的研究作出重要贡献,扩展托里切利 (Evangelista Torricelli) 的工作,澄清了压强和真空的概念。
数学上,Pascal 促成了两个重要的新研究领域。16 岁写出一篇题为射影几何的论文,1654 年开始与皮埃尔·德·费马 (Pierre de Fermat) 通信,讨论概率论,深刻影响了现代经济学和社会科学的发展。1654 年末一次信仰上的神秘经历后,他离开数学和物理学,专注于沉思和神学与哲学写作,身后其笔记本被编为《思想录》。
Pascal 架构在 GPU 计算能力上有了质的飞跃,首次引入 HBM2 内存和 NVLink 技术,明显提高了带宽和支持的数据传输速率。同时支持多达 16 个 SM 和新的半精度浮点数 (FP16) 运算,为 AI 训练和推理提供加速。GP100(如 Tesla P100),采用 16 nm 工艺和 HBM2 显存,支持深度学习框架。计算性能比前代提升 50%,显存带宽 732 GB/s。
1745 年 Volta 出生在意大利科莫;1774 年,他成为科莫皇家学院 (the Royal School in Como) 的一名物理教授。一年后,他改进并推广了起电机,即静电产生设备。1776-1778 年,Volta 开始研究气体的化学性质。
在读完本杰明·弗兰克林 (Benjamin Franklin) 所著的关于「可燃空气」的论文后研究并发现了甲烷,1776 年,他在马焦雷湖发现甲烷,并于 1778 年成功地分离出了甲烷。1779 年,他成为帕维亚大学的实验物理学教授,他一直担任此教席近 40 年,并研究了电容,发现了电势和电荷之间的关系。
引入了 Tensor Core,专门设计用于加速深度学习应用中的矩阵运算。它还提升了 NVLink 的带宽,并引入了新的 HBM2 内存技术。Volta 在 AI 计算和图形处理方面均有显著提升,GPU 架构逐步优化了内存使用和数据传输效率。GV100(如 Tesla V100),引入 Tensor Core 加速矩阵运算,AI 算力达 112 TFLOPS。支持 NVLink 2.0,多 GPU 协作性能提升。
Turing 架构芯片于 2018 年发布,它的命名源自计算机科学和人工智能之父艾伦·图灵 (Alan Turing)。
Turing 生于 1912 年,是英国计算机科学家、数学家、逻辑学家、密码分析学家和理论生物学家。在第二次世界大战期间,他领导英国政府密码学校的破译工作,成功破解了德国的恩尼格玛密码机,为盟军取得胜利立下汗马功劳。
更为重要的是,他提出了 「图灵机」 的概念,为现代计算机的逻辑工作方式提供了理论模型,开创了AI领域的先河,并提出了著名的「图灵测试」,用以判断机器有没有智能,对计算机科学和AI发展都有着突出的贡献。NVIDIA 以「Turing」命名芯片架构,是对图灵在计算机科学领域奠基性贡献的崇高敬意,也寓意着其芯片在推动人工智能技术发展方面,将如同图灵的理论一样,具有开拓性和引领性。
Turing 架构集实时光线追踪、AI、模拟和光栅化于一身,标志着 NVIDIA 在光线追踪技术上的重大突破。配备全新 RT Core 和 Tensor Core,首次实现实时光线追踪。改进 Tensor Core,每秒可提供高达 500 万亿次的张量运算。此外,它引入了新的 GDDR6 内存,提高了内存速度和带宽,为图形密集型应用和游戏提供了更高的性能。
他出生于 1775 年,是法国物理学家、数学家,经典电磁学的创始人之一。从 12 岁开始,他便开始有效学习高等数学,在青少年时期就已完成了数学和科学的学习。1820 年,在奥斯特 (Hans Christian Ørsted) 发现的电流磁效应基础上,Ampere 开始着手建立描述电磁关系的物理理论与数学方程。1826 年,提出载流导线中的电流与其产生的磁场之间的关系,即安培定律。
Ampere 架构引入了第三代 Tensor Core,提供了更强大的 AI 训练和推理能力及更逼真的图形渲染性能,支持更多的数据类型和更高的计算效率,同时也推出了多实例 GPU (MIG) 技术,允许单个 GPU 资源在多个用户间进行分割,提高了硬件的使用效率。GA100(如 A100),支持 TF32 和 BF16 数据格式,稀疏矩阵计算优化。显存带宽达 1.6 TB/s,AI 训练效率显著提升。
2022 年 Hopper 架构正式问世,它的名字是为了纪念计算机科学先驱格蕾丝・赫柏 (Grace Hopper)。
Hopper 于 1906 年生于美国,是一位传奇女性。她在计算机编程领域取得了开创性成就,是 COBOL 语言的先驱。在早期计算机使用机器语言编程的复杂年代,赫柏发明了世界上第一个编译器 A-0 系统,让程序员能够用更接近人类语言的方式编写代码,并在 1956 年开发出 FLOW - MATIC 程序语言,极大地提高了编程效率,为现代计算机编程语言的发展奠定了基础。
Nvidia 以她的名字命名芯片架构,不仅是对她在计算机科学发展贡献的认可,或许还寄托着 NVIDIA 芯片也能如她一样为现代科技发展注入强大动力的美好愿景。
Hopper 架构使用先进的台积电 4N 工艺制造,拥有超过 800 亿个晶体管,通过五项突破性创新技术,助力全球 AI 基础设施引擎实现数量级的性能飞跃。引入了第四代 Tensor Core 和多项创新技术,包括改进的 NVLink 和新的 HBM3 内存技术。它专为 AI 计算和高性能计算场景设计,提供了前所未有的计算速度和效率,同时支持更复杂的 AI 模型和算法。
她出生于 1815 年,是一位英国数学家兼作家,穿孔机程序创始人,著名诗人拜伦勋爵和安妮贝拉·米尔班克·拜伦的女儿。她是第一位主张计算机不只可拿来算数的人,并发表了第一段分析机用的算法,写作第一份「程序设计流程图」,被公认为史上第一位程序员。其在计算机史上的开创性的意义给后代带来无尽的启发。
Ada GPU 架构能够为光线追踪和基于 AI 的神经图形提供革命性的性能。该架构明显提高了 GPU 性能基准,更代表着光线追踪和神经图形的转折点。
Blackwell 16 岁便进入伊利诺伊大学厄巴纳 - 香槟分校学习,他是首位非裔美国国家科学院院士,是美国国家科学院首位黑人院士,也是加州大学伯克利分校首位黑人终身教员。
在博弈论、信息论和概率论等领域,他都有着重大贡献,而最为著名的当属 Rao - Blackwell 定理,该定理作为统计估计理论的基石,提供了增强估计量的系统方法,极大推动了统计学的发展。
在 2024 年的 GTC 大会上,黄仁勋说:「我想向大家介绍一款以数学家、博弈论专家、概率学家大卫·布莱克威尔 (David Blackwell) 的名字命名的超大 GPU。我们大家都认为这是一个完美的名字。」
Blackwell 架构引入了第五代 Tensor Core,支持新的数据类型和 AI 训练技术,提供了极高的计算效率和能效比。优化了 GPU 内部的数据传输和处理机制,为处理大规模数据集和复杂的 AI 模型提供了强大的支持。B200/GB200 超级芯片,集成 2080 亿晶体管,第二代 Transformer 引擎支持 FP4 推理。性能较 Hopper 提升 30 倍,能耗优化 25 倍。
在科技快速的提升的今天,Nvidia 的芯片产品已成为推动AI领域进步的关键力量。通过这样的命名方式,Nvidia 将科技与人文紧密地交织在一起,为我们呈现了一部精彩纷呈的 GPU 架构进化史。每一个芯片名字背后,是每一位科学家们智慧和成就的时空跨越,并在 Nvidia 的 GPU 架构中得以延续和升华。这些命名不仅是对先驱者们的致敬,更激励着无数科技工作人员在探索 AI 与 GPU 技术融合的道路上不断前行。
随着科技的慢慢的提升,Nvidia 在 GPU 架构的探索上也不会停下脚步。未来,又会有哪些科学巨匠的名字被铭刻在新的架构之上,为 AI 和 GPU 技术的发展注入新的活力,让我们拭目以待。

