说真的,有时候想起来还挺恍惚的。就在几年前,我们还觉得围棋——这个古老东方智慧的游戏,是人工智能难以逾越的高峰。它太复杂了,变化比宇宙中的原子还多,讲究的是“手谈”与“意境”,远非蛮力计算可以穷尽。可转眼间,棋盘对面坐着的,可能已经不再是一个蹙眉沉思的人,而是一串我们看不见的代码。今天,我们就来聊一聊这个话题:AI围棋的水平,到底是怎么排行的?它们之间,谁更“厉害”?而这场机器的内战与进化,又给我们带来了什么?
要谈排行,总得有个起点。这个起点,毫无争议,就是2016年的春天。谷歌DeepMind的AlphaGo(我们亲切又敬畏地称之为“阿尔法狗”)以4:1战胜了世界冠军李世石九段。那一刻,不仅仅是围棋界,整个人类认知的某个角落,仿佛被撬动了一下。
当时的AlphaGo是个什么水平呢?如果给它一个历史定位,我觉得可以称之为“破壁者”。它打破了“机器在围棋上不可能战胜顶尖人类”的这堵心理和技术的厚墙。它的棋风,已经展现出与人类迥异的特质:一些我们觉得“俗”甚至“无理”的招法,被它下出了全新的意味。但公允地说,那时的AlphaGo虽然强大,棋谱中依然能看出一些对人类棋谱深度学习的痕迹,偶尔也会有让职业棋手觉得“看不懂但好像不对”的局部。
紧接着,就是2017年与当时世界排名第一的柯洁的三番棋。升级后的AlphaGo Master版本,取得了干净利落的3:0。柯洁在比赛中一度离席抹泪的场景,成了那个时代人类面对AI冲击最直观的注脚。这时,AlphaGo的水平已经公认远超所有人类棋手,形成了一个独立的、更高的层级。
这里,我们可以简单给这个阶段的AI围棋能力做一个粗略划分:
| 时期/版本 | 代表AI | 核心特点 | 相对于人类水平定位 |
|---|---|---|---|
| :--- | :--- | :--- | :--- |
| 2016年前 | 传统围棋程序(如Zen、CrazyStone) | 基于蒙特卡洛树搜索,实力约在业余强豪至职业低段徘徊。 | 挑战者,尚无法撼动顶尖职业。 |
| 2016-2017 | AlphaGo(Lee/Celebrity版)、AlphaGoMaster | 深度学习(策略与价值网络)与蒙特卡洛树搜索结合,开创性突破。 | 超越者,稳定超越所有人类顶尖棋手。 |
| 2017年后 | AlphaGoZero、AlphaZero | 摒弃人类棋谱,从零开始自我对弈学习,实现方法论革命。 | 新物种,棋理与人类出现根本性分歧,差距进一步拉大。 |
是的,2017年还有一个真正具有哲学震撼力的版本诞生——AlphaGo Zero。它完全抛弃了人类的历史棋谱,仅凭围棋的基本规则,通过自我对弈,在短短几天内就超越了战胜李世石的那个版本,40天后便击败了Master。这标志着AI围棋进入了“无师自通”的纯自我进化时代。它的棋,对人类而言更加“玄妙”和“本质”,很多定式被彻底颠覆。
AlphaGo功成身退,但它的技术开源和论文发表,点燃了全球AI围棋研究的燎原之火。一大批基于类似架构的AI程序如雨后春笋般出现,比如绝艺(腾讯)、星阵(中国团队)、KataGo、Leela Zero等。围棋AI领域,从一家独大,进入了百花齐放、激烈竞争的“战国时代”。
那么问题来了,这些后来的AI,谁更强?它们之间怎么排名?这成了一个有趣且动态的话题。要知道,AI之间没有情感波动,不会状态不佳,它们的“等级分”可以通过海量的相互对局来相对精确地计算。
一个被广泛认可的衡量方式,是看它们在围棋AI竞赛(如世界人工智能围棋大赛)中的成绩,以及在一些公开的线上对弈平台(如野狐、腾讯围棋)上,使用相同硬件条件进行“盲测”的胜率。
大致上,我们可以梳理出这样一个当前(以近两三年为参考)的顶尖AI梯队格局:
*第一梯队(领跑者):通常是那些背靠强大算力与持续研发团队的AI,例如绝艺、KataGo的最新版本。它们在重大比赛中夺冠次数多,在高手云集的AI房对弈中胜率稳定居前。它们的棋被认为最接近“围棋之神”的真理,是职业棋手研究围棋本质最主要的工具。
*第二梯队(强豪):包括星阵以及一些其他优秀开源AI的强化版本。它们与第一梯队的差距可能非常微小,在某些特定布局或中盘战斗中甚至能有独特见解,但综合稳定性和深度略逊一筹。
*第三梯队(高手):一些较早版本或配置较低的AI,以及实力强大的开源基准版本(如特定版本的Leela Zero)。它们足以轻松碾压任何人类棋手,但在AI内战中已难以跻身最顶尖行列。
这里必须提一句KataGo。这个开源项目非常活跃,社区贡献巨大,它不仅在绝对棋力上紧追商业顶级AI,更重要的是它在分析功能上做得极其友好,提供了丰富的变化图与胜率评估,成为了全球围棋爱好者乃至职业棋手日常训练的“标配”工具。从某种意义上说,KataGo在推动围棋AI技术民主化和应用普及方面,排名第一。
如果只关注谁输谁赢,那格局就小了。AI围棋的排行,比的不仅仅是胜负率,更是对围棋真理的探索深度和表达方式。
首先,是“围棋定式”的彻底革命。人类总结了几百年的定式,在AI看来很多都是“亏的”。它偏爱一些看似“脱先”(不顾局部)而抢先占据全局要点的下法,强调子效的极致。以前被认为铁亏的“点三三”,现在成了开局标配。这种对棋理的根本性颠覆,迫使所有棋手重新从零开始理解围棋。AI就像一位严苛的物理老师,用实验数据无情地检验着人类凭感觉和经验建立起来的“经典力学”理论。
其次,是胜负观的绝对理性化。AI的世界里没有“棋风”:没有“宇宙流”,没有“地铁流”,没有“力战家”。只有基于胜率计算的最优解或候选解。它不在乎棋形是否美观,不在乎手段是否“羞辱”对手,只在乎最终赢的概率。这带来了一种冰冷而高效的围棋美学。人类棋手在它的影响下,也变得越来越“AI化”,更注重全局的平衡与实地的转化,以往那些天马行空的“名局”构思越来越难出现。这算是进步,还是一种遗憾呢?值得思考。
最后,是围棋教育的平民化与深度化。任何一个业余爱好者,现在都可以用AI复盘,看到自己每一步棋导致的胜率跳水。这种即时、量化的反馈,是过去拜师学艺时代无法想象的。AI成了最无私、最强大的老师。但同时,它也带来了“答案依赖症”——棋手们可能不再敢于进行充满不确定性的深算,而是更倾向于记忆AI的“标准答案”。
那么,AI围棋的进化有终点吗?它的水平排行,最终会收敛到一个“围棋真理”的极限值吗?
从技术角度看,只要算法和算力还在进步,AI的棋力理论上就没有上限。它可以通过无限自我对弈,逼近围棋这个完全信息博弈游戏的理论最优解(如果存在的话)。我们或许可以想象,未来会出现一个“完美围棋AI”,它的每一步都是当前局面下的绝对正解。
但有趣的是,即便到了那一天,“排行”可能就失去了意义。因为当所有AI都无限接近那个理论极限时,它们之间的对局将永远是和棋(执黑贴目下的最优解)。届时,AI围棋的使命,或许就从“争胜”变成了“诠释”——用不同的路径,向我们展示同一种终极之美。
而对于人类来说,面对这个无法企及的“围棋之神”,我们的角色也在悄然转变。从“挑战者”到“学生”,再到“围棋艺术的体验者和传播者”。围棋的魅力,或许不再仅仅在于人类顶尖高手之间电光石火的胜负,更在于我们借助AI这面镜子,前所未有地看清了这个古老游戏的深邃与辽阔。
所以,回到最初的问题:AI围棋水平怎么排行?今天的排行,是技术迭代的赛跑;而明天的终极图景,可能是一场没有输赢、共同抵达的朝圣。机器的铁蹄踏破了人类智慧的旧篱笆,却在废墟之上,为我们建造了一座更高、更宏伟的认知殿堂。这,或许就是这场革命最迷人的地方。
