AI门户, 中国人工智能行业资讯平台--AI门户网
来源:AI门户网     时间:2026/4/11 22:55:33     共 2314 浏览

说到围棋AI,大家脑海里第一个蹦出来的名字,恐怕都是那个在2016年掀起滔天巨浪的AlphaGo(阿尔法狗)。但你知道吗?在它之前,其实已经有无数前辈在围棋这块“人类智慧最后高地”上,进行了长达半个世纪的艰难攀登。今天,我们就来给这些围棋AI排排座次,弄一个“难度级别排行榜”。这个“难度”,不单指它们的棋力高低,更涵盖了技术实现的复杂度、对硬件算力的依赖程度,以及它们在AI发展史上的突破性意义。你会发现,这不仅仅是一份技术榜单,更是一部浓缩的人工智能进化史。

一、 青铜时代:规则探索与模式识别(约1990s - 2000s)

这个时期的AI,可以看作是围棋世界的“初学者”。它们刚刚学会规则,下棋主要靠程序员输入的“定式”和简单的计算。想想看,让一个刚背完“金角银边草肚皮”口诀的棋童去对战职业九段,结果可想而知。

代表性AI:手谈

说到初代王者,必须提到我们中国的骄傲——“手谈”。它的创造者,中山大学的陈志行教授,一位退休的化学家,用汇编语言亲手敲出了这个程序的核心。在那个电脑内存以KB计、CPU主频以MHz算的年代,“手谈”能实现13层的搜索深度,已经是惊为天人了。它依靠的是“势力函数”这种人工设计的评估体系,简单来说,就是给棋盘上每个空点打分,判断属于黑棋还是白棋的“势力范围”。这很像人类下棋时的“感觉”,但它是被精确量化、编程进去的。

当时,“手谈”在电脑围棋界是独孤求败的存在,连续拿了10次世界冠军。但对于人类职业棋手,它依然需要被让子(比如让九子、十子)才能对弈。它的“难”,难在程序员需要把大量的人类围棋知识和经验,手工编码成计算机能理解的规则和模式。这就像教一个完全不懂棋的机器人,通过背诵成千上万本棋谱来学习,过程极其繁琐,且天花板很低。

难度评级:业余级(K级)

*棋力水平:业余初段以下,需被让多子才能与职业棋手对局。

*技术核心:基于规则和模式的专家系统,依赖人工设计的评估函数。

*硬件需求:早期的个人电脑即可运行。

*突破意义:证明了计算机程序可以下围棋,并达到一定竞技水平,点燃了围棋AI研究的星星之火。

二、 白银时代:蒙特卡洛的“概率博弈”(约2006 - 2015)

如果说第一代AI是在“背棋谱”,那么第二代AI开始学会“用蛮力试错”了。蒙特卡洛树搜索(MCTS)算法的引入,是划时代的。它不再需要程序员事无巨细地告诉AI“这里该怎么下”,而是让AI自己通过海量的随机模拟对局(就像不停扔骰子走棋),来统计哪一步棋的最终胜率最高。

这听起来有点“暴力”,甚至有点“笨”,但效果拔群。AI开始展现出一些令人类惊讶的“直觉”。比如,它们可能会在人类认为无关紧要的地方落子,只是因为模拟了十万次后,发现这一步的长期胜率比别人高那么一点点。

代表性AI:Zen(天顶围棋)、Crazy Stone(疯石)

这些基于MCTS的AI,棋力突飞猛进,很快达到了业余高段水平。2012年,Zen在被让四子的情况下击败了超一流棋手武宫正树九段,震惊棋坛。这意味着,AI已经具备了冲击职业门槛的实力。这个阶段的AI,思考方式开始有点“像人”了——不再拘泥于死板的局部计算,而是有了全局的、概率性的“感觉”。

但是,它们的“感觉”建立在巨量的随机模拟之上,非常消耗算力。而且,它们的棋力依然不稳定,对复杂局面(比如大型对杀、劫争)的判断时常出错。可以说,它们是一个强大的“计算器”,但还不是一个真正的“棋手”。

难度评级:业余高段到职业门槛(1D-5D)

*棋力水平:业余5-6段,可在受让2-4子的情况下与职业棋手周旋。

*技术核心:蒙特卡洛树搜索(MCTS),通过随机模拟进行决策。

*硬件需求:需要较强的CPU进行海量随机模拟。

*突破意义:将围棋AI从“规则模仿”带入了“概率搜索”时代,棋力实现质的飞跃,让人们看到了AI战胜职业棋手的曙光。

三、 黄金时代:深度学习的“直觉革命”(2016 - 2017)

真正的风暴来了。AlphaGo的出现,彻底改变了游戏规则。它把深度学习神经网络和蒙特卡洛树搜索结合了起来。你可以这样理解:MCTS是负责“广撒网”探索各种可能性的“腿”,而深度神经网络则是两个强大的“大脑”——策略网络和价值网络

*策略网络:像一位直觉敏锐的棋手,看一眼棋盘,就能快速缩小搜索范围,指出“大概这十几个点值得考虑”。这极大地提升了搜索效率。

*价值网络:像一位形势判断大师,对整个局面的优劣进行直接评估,告诉AI“走成这样,黑棋大概有60%的胜率”。

AlphaGo先通过学习3000万盘人类高手的棋谱来“模仿”(监督学习),然后通过自我对弈(强化学习)不断进化。2016年战胜李世石,标志着AI在围棋领域正式超越人类顶尖水平。但,这还不是终点。

AlphaGo Zero的诞生,宣告了“无师自通”时代的来临。它完全摒弃了人类棋谱,仅凭围棋的基本规则,从“一张白纸”开始,通过数百万盘的自我对弈,独自探索出了围棋的奥秘,甚至发现了许多颠覆人类数千年认知的新下法(比如开局点“三三”)。它的棋风天马行空,被棋手们尊称为“围棋之神”。

这个阶段的AI,已经拥有了类似人类的“棋感”和“大局观”,其决策过程不再是纯粹的暴力计算,而是一种深度神经网络“涌现”出的高级智能。

难度评级:超职业九段(超越人类)

*棋力水平:对顶尖人类棋手(如柯洁)具有压倒性优势,等级分估计超过4500(人类顶尖约3700)。

*技术核心:深度学习(卷积神经网络CNN)与蒙特卡洛树搜索的深度融合,后期发展为纯强化学习的统一网络。

*硬件需求:初期需要庞大的GPU/TPU集群(如AlphaGo Lee),后期算法优化后硬件需求大幅下降(如AlphaGo Zero)。

*突破意义证明了深度强化学习在复杂决策领域的巨大潜力,是人工智能发展史上的里程碑事件。AI的“直觉”和“创造力”开始显现。

四、 王者时代:开源普及与算法极致(2018 - 至今)

AlphaGo功成身退后,围棋AI并没有停下脚步,而是进入了“开源化”和“轻量化”的新阶段。技术的王冠,从谷歌这样的巨头实验室,飞入了寻常开发者的手中。

代表性AI:KataGo、Leela Zero、绝艺、星阵围棋

KataGo为代表的开源AI,成为了新时代的主流。它们继承了AlphaGo Zero的核心思想,但在算法和工程上做了大量优化。最大的特点是:效率极高。现在,一块消费级的显卡(比如RTX 3070)就能运行一个棋力远超人类冠军的KataGo。同时,它们还发展出了许多实用功能,比如实时胜率分析、吻合度判断、让子棋精准贴目等。

中国的“绝艺”(腾讯)和“星阵围棋”等,也在这一领域达到了世界顶级水平,并广泛应用于职业棋手训练、网络对弈平台和围棋教育。

这个阶段的“难度”,已经不完全体现在棋力上(因为都已远超人类),而是体现在算法的优雅性、效率的极致性,以及生态的丰富性上。谁能用更少的算力、更精巧的模型达到同样的强度,谁就更“高级”。

为了更直观地对比各时代代表性AI,我们整理了下表:

时代代表性AI核心算法棋力巅峰(约估)硬件需求特点历史地位与突破
:---:---:---:---:---:---
青铜时代手谈(1993)专家系统,势力函数业余初段(被让9-10子)早期PC开创者,证明可行性
白银时代Zen,CrazyStone(约2012)蒙特卡洛树搜索(MCTS)业余5-6段(被让2-4子)多核CPU服务器引入概率搜索,触及职业门槛
黄金时代AlphaGo(2016)MCTS+深度学习(监督+强化)超职业九段(战胜李世石)大规模GPU/TPU集群里程碑,首次公开击败人类冠军
AlphaGoZero(2017)纯强化学习,统一网络“围棋之神”,远超AlphaGo优化后单机多TPU无师自通,颠覆传统围棋认知
王者时代KataGo,绝艺(现今)优化版强化学习,开源架构稳定超人类,等级分4500+消费级GPU即可运行开源化、轻量化、实用化,推动AI围棋普及

结语:难度的尽头是“遗忘”

回顾这份排行榜,我们从依赖人工编码的“手谈”,走到靠概率暴力搜索的“Zen”,再飞跃到拥有深度学习“直觉”的AlphaGo,最终抵达开源高效、融入日常的KataGo时代。AI攻克围棋的难度曲线,恰恰是一条技术从笨重走向精巧、从封闭走向开放、从“模仿人类”走向“超越并重塑人类认知”的曲线

最初的难,是“教会机器规则”的难;后来的难,是“让机器学会思考”的难;而现在的“难”,或许已经变成了另一个问题:当AI的棋力高到人类无法理解其每一步的深意时,围棋这项古老艺术本身,是被解构了,还是被升华到了新的维度?

围棋AI的发展告诉我们,真正的突破往往发生在“遗忘”之时——AlphaGo Zero忘记了人类棋谱,却发现了围棋更深层的真理;开源社区“忘记”了技术的垄断,却催生了更繁荣的生态。如今,任何一个围棋爱好者,都能在个人电脑上召唤出一个“围棋之神”作为老师或对手,这本身就是这个时代最了不起的奇迹。

所以,如果非要给现在的围棋AI定一个“终极难度”,那可能不再是技术上的攀爬,而是哲学上的思考:当工具强大到重塑游戏本身时,我们该如何与它共处,并重新发现“手谈”最初那份纯粹交流与思考的快乐?

版权说明:
本网站凡注明“AI门户网 原创”的皆为本站原创文章,如需转载请注明出处!
本网转载皆注明出处,遵循行业规范,如发现作品内容版权或其它问题的,请与我们联系处理!
您可以扫描右侧微信二维码联系我们。
  • 相关主题:
网站首页 关于我们 联系我们 合作联系 会员说明 新闻投稿 隐私协议 网站地图