当我们谈论人工智能的“智慧”时,其实是在谈论其背后的“算力”。2020年,正是AI芯片战场风起云涌的一年。从我们口袋里的智能手机,到实验室里的超级计算机,一场关于计算能力的无声竞赛正在上演。对于刚接触这个领域的新手来说,可能不禁会问:这么多芯片,到底谁才是当年的“算力王者”?它们的比拼,又仅仅是为了一个数字排名吗?本文将带你穿越回2020年,揭开那场算力角逐的帷幕。
对于普通消费者而言,最直接的感受来自手机。2020年初,各大评测机构发布的手机AI芯片排行榜,成为了观察移动算力最直观的窗口。
当时,高通骁龙865以显著的AI跑分优势,在许多榜单中位列第一。其搭载的第五代AI引擎,宣称能实现高达每秒15万亿次运算(15 TOPS),这个数字是前代产品的两倍。它是如何做到的?关键在于其异构多核可编程架构,并非依赖单一模块,而是让CPU、GPU、专用的Hexagon DSP乃至传感器中枢协同工作,在处理AI任务时,就像一支分工明确的特种部队,在功耗和精度间找到了精妙的平衡。
紧随其后的竞争异常激烈。苹果的A13仿生芯片和华为的麒麟990 5G芯片在伯仲之间。这里出现了一个有趣的现象:不同评测基准(Benchmark)的结果可能大相径庭。例如,在某个海外基准测试中,麒麟990 5G曾以超过7万分的成绩领先,而在另一些以不同侧重点设计的测试中,排名则可能变化。这恰恰说明,单纯的算力数值(TOPS)并非衡量芯片AI能力的唯一标准。架构效率、对特定算法(如图像识别、语音处理)的优化、以及软硬件协同的深度,共同决定了最终的用户体验——比如拍照更美、语音助手更聪明。
视线离开手机,AI算力的战场扩展到了更广阔的终端与边缘设备领域。这些芯片通常嵌入在摄像头、汽车、智能家居设备中,它们不需要手机芯片那样的全能,但必须在特定场景下做到极致的高效与低功耗。
2020年,业内媒体评出了当年的“最强终端AI加速芯片Top10”,呈现出一幅百花齐放的景象:
*英特尔Movidius Myriad X:专为视觉处理设计,集成了专用的神经网络计算引擎,主打高能效比的深度神经网络推理。
*恩智浦i.MX 8M Plus:面向工业物联网,除了神经网络加速器,还集成了音频DSP,能同时处理视觉和语音信息。
*英伟达Jetson Nano:虽然算力仅为0.5 TFLOPS,但其基于成熟的GPU生态,让开发者能快速在嵌入式设备上部署复杂的AI模型。
*德州仪器TDA4VM:专为汽车ADAS设计,能同时处理多路摄像头和雷达数据,进行传感器融合计算。
这个榜单揭示了一个核心趋势:通用型CPU/GPU正与专用型AI加速器(ASIC)分庭抗礼。通用方案生态成熟、灵活性强;专用方案则在能效比和特定任务性能上优势明显。对于开发者而言,选择哪条路径,取决于产品是追求快速上市还是极致的性能与功耗。
如果说终端芯片是“特种兵”,那么云端和超算芯片就是提供火力支援的“航母编队”。这里的算力单位从TOPS(万亿次)跃升到了PFLOP/s(千万亿次)。
2020年6月,日本理化学研究所和富士通联合开发的超级计算机“富岳”(Fugaku)横空出世,以每秒41.6亿亿次(416 PFLOP/s)的浮点运算速度登顶全球超算排行榜。更有趣的是,在常用于AI训练的半精度(16位)计算中,富岳的峰值性能甚至超过了1 EFLOP/s(百亿亿次),因此也被称为全球首台“准艾级”超算。它采用了富士通自研的ARM架构A64FX处理器,这向世界证明,在顶尖算力领域,x86架构并非唯一选择。
与此同时,在AI训练与推理的专用战场,英伟达的A100(2020年发布)和华为的昇腾910等芯片,正驱动着全球AI模型的研发。这些芯片专注于加速大规模矩阵运算,是训练像GPT-3这样大语言模型的幕后功臣。它们的比较维度更为复杂,涉及内存带宽、互联技术、软件栈完整性等。
回顾2020年的排行榜,我们可以获得比排名更深刻的启示。
首先,“算力”是一个多维度的综合概念。它至少包括:
1.峰值算力:芯片理论上能达到的最高计算速度。
2.实际能效:每瓦特功耗所能产生的有效算力,这对移动和边缘设备至关重要。
3.易用性与生态:配套的软件工具、算法模型库是否丰富,极大影响开发效率。
4.通用性与专用性:是像瑞士军刀一样全能,还是像手术刀一样精准?
其次,排行榜只是瞬间的定格,而技术演进的方向更具指向性。2020年,我们已清晰看到三大趋势:计算精度从高精度向混合精度甚至低精度演进,以换取更高的效率和速度;存算一体、类脑计算等新架构开始从论文走向产业试探;AI芯片的设计越来越需要与算法协同优化。
最后,对于企业和开发者而言,脱离应用场景谈算力是空洞的。选择芯片时,更应思考:我的AI模型主要用于训练还是推理?部署环境是功耗敏感的终端,还是数据中心的机架?预算是多少?没有最好的芯片,只有最适合当下需求的芯片。
2020年的AI芯片算力排行榜,如同一张精彩的赛事成绩单。它记录了骁龙865在移动端的强势,见证了富岳在超算领域的颠覆,也展现了从Movidius到Jetson Nano在边缘侧的创新活力。然而,比记住冠军名字更重要的是理解这场竞赛的规则:这不仅是晶体管数量的竞赛,更是架构创新、软硬协同和生态构建的全面比拼。当时间来到今天,这场竞赛仍在以更快的速度升级,而2020年留下的经验与格局,依然是读懂当下AI硬件浪潮的重要基石。
