AI门户, 中国人工智能行业资讯平台--AI门户网
来源:AI门户网     时间:2026/3/27 11:38:45     共 3152 浏览

嘿,聊起AI,大家可能首先想到的是下围棋的AlphaGo,或者能写诗画图的ChatGPT。但你知道吗?在另一个充满刀光剑影、瞬息万变的虚拟战场上,一个名为“绝悟”的AI,也悄悄完成了一系列令人瞠目的壮举。它不仅在《王者荣耀》里击败了顶尖职业选手,还在国际足球AI竞赛中夺了冠,甚至跨界到了医疗图像诊断领域。今天,咱们就好好掰扯掰扯,这个“绝悟”背后的开源框架,究竟藏着怎样的玄机,它又是如何一步步从一个“游戏高手”成长为一个具备通用潜力的“多面手”的。

一、起源:游戏,最复杂的AI训练场

要说清楚绝悟,还得从它的“出生地”说起——腾讯的《王者荣耀》。这可不是个简单的游戏。它属于MOBA(多人在线战术竞技)类,其复杂程度,说实话,比围棋还要高上几个量级。为什么这么说呢?你想啊,围棋棋盘是静态的,信息是完全公开的。但《王者荣耀》呢?地图是动态的,视野有战争迷雾,英雄技能五花八门,还要和四个队友实时配合去对抗五个敌人。这里面包含了不完全信息、实时决策、多智能体协作与对抗等一系列AI领域的顶级难题。

当初绝悟1v1版本面世时,在两千多场与高端玩家的对局中取得了超过99%的胜率,甚至能用人类选手擅长的英雄击败他们。这背后,靠的可不是穷举所有可能(那根本不可能),而是一套强大的深度强化学习框架。简单理解,就是让AI在虚拟环境里通过不断地“试错”和“复盘”来学习,打赢了有奖励,打输了就扣分,从而自己摸索出最优策略。这个框架,是绝悟所有能力的基石。

二、核心:一个可迁移的通用架构

绝悟真正厉害的地方,在于它的框架设计从一开始就考虑了通用性。它不是一个只能玩《王者荣耀》的“特化”AI。研究人员构建了一套异步分布式强化学习框架,这使得它具备很强的灵活性和扩展性。

我们可以用一个简单的表格来看看这个框架在面对不同任务时的“变”与“不变”:

特性维度在《王者荣耀》中的体现在足球AI(WeKick)中的迁移与调整在病理诊断(RLogist)中的创新应用
:---:---:---:---
核心学习范式深度强化学习+自博弈(Self-Play)保持强化学习与自博弈将强化学习迁移至图像分析(状态-动作框架)
架构基础异步分布式训练框架基于绝悟完全体架构迁移,调整以适应11智能体环境受游戏AI观测决策过程启发,技术迁移
奖励设计经济、经验、推塔、击杀等密集信号重大调整,足球进球信号稀疏,结合GAIL(生成对抗模拟学习)拟合专家行为重新设计,将病理学家阅片决策过程转化为奖励信号
观测特征英雄状态、地图信息、技能冷却等115维向量扩展特征维度,纳入更多球场位置、队友动向等特征根本性改变,从游戏像素/数据转为病理全片扫描图像
动作空间移动、施法、购买装备等复杂组合转化为带球、传球、射门等足球动作转化为对数字病理图像的聚焦、缩放、诊断等阅片动作

从表格里我们能清晰地看到,绝悟框架的“骨架”——即其深度强化学习和异步分布式训练的核心思想——是稳定的、可迁移的。就像一棵树,主干是强化学习这棵大树,当需要解决新问题时,不是重新种一棵,而是修剪和嫁接新的“枝条”(如调整奖励函数)和“树叶”(如改变输入特征)。

比如,在Kaggle足球AI竞赛中,绝悟的WeKick版本就是基于其完全体架构迁移而来。足球和MOBA游戏差别巨大:奖励极其稀疏(基本只有进球得分),需要11个智能体协同。框架通过引入多头价值估计来更精准地评估不同战术的价值,并创新性地结合了模仿学习,让AI能先从人类专家或传统算法的比赛中“学个样子”,再通过自我博弈不断精进。这恰恰证明了该框架处理不同模态、不同规则复杂任务的能力。

三、飞跃:跨界赋能,从虚拟到现实

如果说在游戏领域的成功证明了绝悟框架的强大,那么它在医疗领域的应用,则真正展现了其技术迁移的巨大实用价值。这就是“绝悟RLogist”项目。

病理学家在显微镜下看组织切片,是一个漫长而耗神的过程,需要不断地移动视野、调整焦距、寻找可疑病灶。研究人员灵光一现:这个过程,和绝悟在游戏里“观察地图、寻找敌人、决定行动”何其相似!于是,他们将训练绝悟的深度强化学习技术迁移了过来。

RLogist框架将整张数字病理切片视为一个“环境”,AI的“动作”就是移动视野和缩放,“奖励”就是是否能高效、准确地找到病灶区域。结果令人振奋:在诊断性能接近专业水平的前提下,将传统的人工全片浏览效率提升了惊人的400%。这意味着,AI可以像一位不知疲倦的助手,快速完成初筛,将最关键的区域标注出来,从而极大地解放了医生的精力,让他们能更专注于最终的诊断决策。这一步,堪称从“感知智能”到“决策智能”的华丽转身,也是AI技术落地产业的核心范式。

四、开源:构建生态,推动通用人工智能前行

绝悟团队最令人敬佩的一点,是其开放的态度。从早期论文被顶级会议AAAI收录,到后续将RLogist等项目代码在GitHub上开源,再到宣布未来将开放《王者荣耀》的游戏环境作为研究平台,并联合推出“开悟”AI+游戏开放平台,邀请全球高校和研究机构共同挑战——这一系列动作表明,腾讯AI Lab的目光早已超越了单纯的竞技胜负。

他们意识到,游戏是攻克通用人工智能(AGI)难题的绝佳沙盒。在这里练就的“十八般武艺”——如多智能体协作、长期规划、在不完全信息下推理等——正是未来AI融入现实世界所必需的能力。通过开源框架和开放平台,他们正在集结全球智慧,共同推动底层技术的突破。这或许比赢得任何一场比赛都更有意义。

结语:不止于“悟”,更在于“通”

回顾绝悟的历程,它从一个在游戏世界里“悟”透战法的智能体,逐步成长为一个能够“通”往不同领域的通用框架。它的故事告诉我们,今天在虚拟世界中训练出的AI能力,绝非屠龙之技。其背后的强化学习框架、决策模型、多智能体协同算法,正成为一把把钥匙,为我们打开医疗、机器人、智慧交通、工业仿真等无数扇大门。

绝悟的开源,不仅仅开放了一套代码,更是开放了一种思路:以游戏为起点,以通用智能为星辰大海。这条路还很长,但无疑,它已经为我们点亮了一盏挺亮的灯。未来,当AI助手能像绝悟分析战局一样,为我们规划城市交通、管理电网,甚至辅助科学发现时,我们或许会想起,这一切的萌芽,始于峡谷中的一次击杀,或是绿茵场上的一脚传球。想想,是不是还挺酷的?

版权说明:
本网站凡注明“AI门户网 原创”的皆为本站原创文章,如需转载请注明出处!
本网转载皆注明出处,遵循行业规范,如发现作品内容版权或其它问题的,请与我们联系处理!
您可以扫描右侧微信二维码联系我们。
  • 相关主题:
网站首页 关于我们 联系我们 合作联系 会员说明 新闻投稿 隐私协议 网站地图