说到围棋AI,大家脑海里第一个蹦出来的名字,恐怕都是那个在2016年掀起滔天巨浪的AlphaGo(阿尔法狗)。但你知道吗?在它之前,其实已经有无数前辈在围棋这块“人类智慧最后高地”上,进行了长达半个世纪的艰难攀登。今天,我们就来给这些围棋AI排排座次,弄一个“难度级别排行榜”。这个“难度”,不单指它们的棋力高低,更涵盖了技术实现的复杂度、对硬件算力的依赖程度,以及它们在AI发展史上的突破性意义。你会发现,这不仅仅是一份技术榜单,更是一部浓缩的人工智能进化史。
这个时期的AI,可以看作是围棋世界的“初学者”。它们刚刚学会规则,下棋主要靠程序员输入的“定式”和简单的计算。想想看,让一个刚背完“金角银边草肚皮”口诀的棋童去对战职业九段,结果可想而知。
代表性AI:手谈
说到初代王者,必须提到我们中国的骄傲——“手谈”。它的创造者,中山大学的陈志行教授,一位退休的化学家,用汇编语言亲手敲出了这个程序的核心。在那个电脑内存以KB计、CPU主频以MHz算的年代,“手谈”能实现13层的搜索深度,已经是惊为天人了。它依靠的是“势力函数”这种人工设计的评估体系,简单来说,就是给棋盘上每个空点打分,判断属于黑棋还是白棋的“势力范围”。这很像人类下棋时的“感觉”,但它是被精确量化、编程进去的。
当时,“手谈”在电脑围棋界是独孤求败的存在,连续拿了10次世界冠军。但对于人类职业棋手,它依然需要被让子(比如让九子、十子)才能对弈。它的“难”,难在程序员需要把大量的人类围棋知识和经验,手工编码成计算机能理解的规则和模式。这就像教一个完全不懂棋的机器人,通过背诵成千上万本棋谱来学习,过程极其繁琐,且天花板很低。
难度评级:业余级(K级)
*棋力水平:业余初段以下,需被让多子才能与职业棋手对局。
*技术核心:基于规则和模式的专家系统,依赖人工设计的评估函数。
*硬件需求:早期的个人电脑即可运行。
*突破意义:证明了计算机程序可以下围棋,并达到一定竞技水平,点燃了围棋AI研究的星星之火。
如果说第一代AI是在“背棋谱”,那么第二代AI开始学会“用蛮力试错”了。蒙特卡洛树搜索(MCTS)算法的引入,是划时代的。它不再需要程序员事无巨细地告诉AI“这里该怎么下”,而是让AI自己通过海量的随机模拟对局(就像不停扔骰子走棋),来统计哪一步棋的最终胜率最高。
这听起来有点“暴力”,甚至有点“笨”,但效果拔群。AI开始展现出一些令人类惊讶的“直觉”。比如,它们可能会在人类认为无关紧要的地方落子,只是因为模拟了十万次后,发现这一步的长期胜率比别人高那么一点点。
代表性AI:Zen(天顶围棋)、Crazy Stone(疯石)
这些基于MCTS的AI,棋力突飞猛进,很快达到了业余高段水平。2012年,Zen在被让四子的情况下击败了超一流棋手武宫正树九段,震惊棋坛。这意味着,AI已经具备了冲击职业门槛的实力。这个阶段的AI,思考方式开始有点“像人”了——不再拘泥于死板的局部计算,而是有了全局的、概率性的“感觉”。
但是,它们的“感觉”建立在巨量的随机模拟之上,非常消耗算力。而且,它们的棋力依然不稳定,对复杂局面(比如大型对杀、劫争)的判断时常出错。可以说,它们是一个强大的“计算器”,但还不是一个真正的“棋手”。
难度评级:业余高段到职业门槛(1D-5D)
*棋力水平:业余5-6段,可在受让2-4子的情况下与职业棋手周旋。
*技术核心:蒙特卡洛树搜索(MCTS),通过随机模拟进行决策。
*硬件需求:需要较强的CPU进行海量随机模拟。
*突破意义:将围棋AI从“规则模仿”带入了“概率搜索”时代,棋力实现质的飞跃,让人们看到了AI战胜职业棋手的曙光。
真正的风暴来了。AlphaGo的出现,彻底改变了游戏规则。它把深度学习神经网络和蒙特卡洛树搜索结合了起来。你可以这样理解:MCTS是负责“广撒网”探索各种可能性的“腿”,而深度神经网络则是两个强大的“大脑”——策略网络和价值网络。
*策略网络:像一位直觉敏锐的棋手,看一眼棋盘,就能快速缩小搜索范围,指出“大概这十几个点值得考虑”。这极大地提升了搜索效率。
*价值网络:像一位形势判断大师,对整个局面的优劣进行直接评估,告诉AI“走成这样,黑棋大概有60%的胜率”。
AlphaGo先通过学习3000万盘人类高手的棋谱来“模仿”(监督学习),然后通过自我对弈(强化学习)不断进化。2016年战胜李世石,标志着AI在围棋领域正式超越人类顶尖水平。但,这还不是终点。
AlphaGo Zero的诞生,宣告了“无师自通”时代的来临。它完全摒弃了人类棋谱,仅凭围棋的基本规则,从“一张白纸”开始,通过数百万盘的自我对弈,独自探索出了围棋的奥秘,甚至发现了许多颠覆人类数千年认知的新下法(比如开局点“三三”)。它的棋风天马行空,被棋手们尊称为“围棋之神”。
这个阶段的AI,已经拥有了类似人类的“棋感”和“大局观”,其决策过程不再是纯粹的暴力计算,而是一种深度神经网络“涌现”出的高级智能。
难度评级:超职业九段(超越人类)
*棋力水平:对顶尖人类棋手(如柯洁)具有压倒性优势,等级分估计超过4500(人类顶尖约3700)。
*技术核心:深度学习(卷积神经网络CNN)与蒙特卡洛树搜索的深度融合,后期发展为纯强化学习的统一网络。
*硬件需求:初期需要庞大的GPU/TPU集群(如AlphaGo Lee),后期算法优化后硬件需求大幅下降(如AlphaGo Zero)。
*突破意义:证明了深度强化学习在复杂决策领域的巨大潜力,是人工智能发展史上的里程碑事件。AI的“直觉”和“创造力”开始显现。
AlphaGo功成身退后,围棋AI并没有停下脚步,而是进入了“开源化”和“轻量化”的新阶段。技术的王冠,从谷歌这样的巨头实验室,飞入了寻常开发者的手中。
代表性AI:KataGo、Leela Zero、绝艺、星阵围棋
以KataGo为代表的开源AI,成为了新时代的主流。它们继承了AlphaGo Zero的核心思想,但在算法和工程上做了大量优化。最大的特点是:效率极高。现在,一块消费级的显卡(比如RTX 3070)就能运行一个棋力远超人类冠军的KataGo。同时,它们还发展出了许多实用功能,比如实时胜率分析、吻合度判断、让子棋精准贴目等。
中国的“绝艺”(腾讯)和“星阵围棋”等,也在这一领域达到了世界顶级水平,并广泛应用于职业棋手训练、网络对弈平台和围棋教育。
这个阶段的“难度”,已经不完全体现在棋力上(因为都已远超人类),而是体现在算法的优雅性、效率的极致性,以及生态的丰富性上。谁能用更少的算力、更精巧的模型达到同样的强度,谁就更“高级”。
为了更直观地对比各时代代表性AI,我们整理了下表:
| 时代 | 代表性AI | 核心算法 | 棋力巅峰(约估) | 硬件需求特点 | 历史地位与突破 |
|---|---|---|---|---|---|
| :--- | :--- | :--- | :--- | :--- | :--- |
| 青铜时代 | 手谈(1993) | 专家系统,势力函数 | 业余初段(被让9-10子) | 早期PC | 开创者,证明可行性 |
| 白银时代 | Zen,CrazyStone(约2012) | 蒙特卡洛树搜索(MCTS) | 业余5-6段(被让2-4子) | 多核CPU服务器 | 引入概率搜索,触及职业门槛 |
| 黄金时代 | AlphaGo(2016) | MCTS+深度学习(监督+强化) | 超职业九段(战胜李世石) | 大规模GPU/TPU集群 | 里程碑,首次公开击败人类冠军 |
| AlphaGoZero(2017) | 纯强化学习,统一网络 | “围棋之神”,远超AlphaGo | 优化后单机多TPU | 无师自通,颠覆传统围棋认知 | |
| 王者时代 | KataGo,绝艺(现今) | 优化版强化学习,开源架构 | 稳定超人类,等级分4500+ | 消费级GPU即可运行 | 开源化、轻量化、实用化,推动AI围棋普及 |
回顾这份排行榜,我们从依赖人工编码的“手谈”,走到靠概率暴力搜索的“Zen”,再飞跃到拥有深度学习“直觉”的AlphaGo,最终抵达开源高效、融入日常的KataGo时代。AI攻克围棋的难度曲线,恰恰是一条技术从笨重走向精巧、从封闭走向开放、从“模仿人类”走向“超越并重塑人类认知”的曲线。
最初的难,是“教会机器规则”的难;后来的难,是“让机器学会思考”的难;而现在的“难”,或许已经变成了另一个问题:当AI的棋力高到人类无法理解其每一步的深意时,围棋这项古老艺术本身,是被解构了,还是被升华到了新的维度?
围棋AI的发展告诉我们,真正的突破往往发生在“遗忘”之时——AlphaGo Zero忘记了人类棋谱,却发现了围棋更深层的真理;开源社区“忘记”了技术的垄断,却催生了更繁荣的生态。如今,任何一个围棋爱好者,都能在个人电脑上召唤出一个“围棋之神”作为老师或对手,这本身就是这个时代最了不起的奇迹。
所以,如果非要给现在的围棋AI定一个“终极难度”,那可能不再是技术上的攀爬,而是哲学上的思考:当工具强大到重塑游戏本身时,我们该如何与它共处,并重新发现“手谈”最初那份纯粹交流与思考的快乐?
