AI门户, 中国人工智能行业资讯平台--AI门户网
来源:AI门户网     时间:2026/4/28 11:39:41     共 2313 浏览

说真的,当得知自己获得了吴文俊人工智能奖的时候,我正对着电脑屏幕上跑了一半、结果看起来不太对劲的实验代码发呆。手机震动,邮件提示音响起,我扫了一眼标题,心里咯噔一下——“祝贺您……” 后面几个字没看清,或者说,是不敢仔细看。我深吸了一口气,把邮件点开,从上到下快速浏览了一遍。然后……我关掉了邮件窗口,继续盯着那段出错的代码。大概愣了有五分钟吧,脑子里一片空白,既没有想象中的狂喜,也没有如释重负,就是一种非常奇怪的、悬浮的状态。直到同事路过,问我在发什么呆,我才喃喃地说:“好像……中奖了。” 他凑过来看,然后惊呼起来,办公室这才一下子热闹了。

你看,这就是故事的开始,一点都不戏剧化,甚至有点狼狈。吴文俊奖,这个以中国数学大师、人工智能先驱命名的奖项,在国内AI圈子里分量有多重,我心里是清楚的。它表彰的是在基础理论、关键技术或应用推广上做出“突出贡献”的工作。我的获奖项目,是关于在复杂开放环境中,让智能体进行高效且可解释的常识推理与决策的一套框架。听起来很拗口对吧?简单说,就是想让AI不仅仅会识别猫猫狗狗,或者下棋打游戏,而是能在信息不全、规则模糊的真实世界里,像人一样,利用一些基本的常识和逻辑,去做出相对合理的选择。

一、 研究的起点:从“愚蠢”的问题开始

一切得从好多年前说起。那时候,深度学习正火得一塌糊涂,刷榜、刷分是常态。我也在做相关的研究,但心里总有个疙瘩:我们训练的模型,在特定数据集上表现惊人,可一旦环境稍有变化,或者遇到一个它没“见过”的情况,就可能做出非常荒谬的判断。这就像一个考了满分的学生,却不会处理生活中最简单的问题。这真的叫“智能”吗?

我开始问一些看起来很“愚蠢”的问题:AI怎么知道“玻璃杯是易碎的”?怎么理解“赶时间的时候通常不会选择步行去很远的地方”?这些对人类来说近乎本能的常识,对机器却如同天书。我的导师当时听了我的困惑,沉默了一会儿,说:“这是个硬骨头,可能啃很久都出不了‘漂亮’的成果。” 我知道他的意思。在追求论文发表数量和模型精度的浪潮里,去研究这种底层、吃力不讨好的问题,风险很大。

但我还是决定跳进这个“坑”。研究的核心挑战,在于如何将难以形式化的常识,与可计算的数据、模型连接起来。我们不是要建立一个包罗万象的常识数据库(那几乎不可能),而是想让AI学会在遇到新情境时,主动调用和组合有限的常识“积木”,进行推理。

二、 突破与瓶颈:在黑暗中摸索

过程当然不顺利。最痛苦的不是技术难题,而是那种漫长的、看不到明确进展的孤独感。有将近一年时间,我们的各种尝试都收效甚微。团队里弥漫着焦虑情绪。我记得有一次,我们设计了一个模拟环境,测试智能体在简单家务场景(比如“准备早餐”)中的决策能力。结果令人啼笑皆非:为了“拿到冰箱里的牛奶”,智能体可能会选择“先把冰箱拆了”,因为它从数据中学到的“获取封闭空间内物体”的成功案例,很多都涉及“破坏障碍物”。它完全缺失了“冰箱是贵重物品,应该打开门而不是破坏它”这个常识。

这个例子让我们意识到,光有数据驱动不够,必须引入结构化的约束和逻辑引导。我们转向了符号主义与连接主义结合的路径,也就是现在常说的“神经符号AI”。我们设计了一个双通道系统:

系统模块功能类比主要职责特点
:---:---:---:---
直觉感知网络人的“系统1”快速处理感知信息(图像、文本),生成初步的候选动作或假设。速度快,基于深度神经网络,善于从数据中学习模式,但可解释性差。
常识推理引擎人的“系统2”对候选动作进行基于常识和逻辑规则的校验、推理和排序。速度相对慢,基于符号逻辑和知识图谱,可解释性强,提供决策依据。

两个模块互相“辩论”、协同工作。比如,面对一扇关着的门,直觉网络可能直接输出“撞开”;但推理引擎会调用知识:“门通常可以打开”、“撞门可能损坏门和自身”、“先尝试旋转门把手是低成本动作”,从而否决“撞开”,生成“尝试开门”的指令。这个过程,我们尽可能让它可视化,让研究者能看到AI的“思考”链条。

关键的转折点,来自于我们对“常识”的粒度进行分层处理。我们把常识分为物理常识(物体属性、空间关系)、社会常识(人情世故、习俗)和任务常识(完成某事的常规步骤)。不同层级的常识,用不同的方式进行建模和注入。这就像给AI搭建了一个多层次的“思维脚手架”。

三、 获奖之后:荣誉是集体的,困惑是自己的

项目最终在一些国际标准的测试基准上取得了不错的成绩,也发表了论文。但我必须坦白,直到获奖通知发来,我依然觉得这个工作离“解决”常识问题还非常遥远。它只是一个初步的、粗糙的框架。所以,奖项带来的,除了肯定和鼓励,更多的是压力和责任。

我经常被问到:“你们的方法,离真正的通用人工智能(AGI)还有多远?” 我的回答通常是:“我们可能连起点都还没完全找对。” 当下的AI,包括我们做的工作,很大程度上还是在解决“特定能力”的问题。而人类智能最迷人的地方,恰恰在于它的通用性、创造性和对本质的理解。我们是否过于关注让AI“表现”得更智能,而忽视了让它“理解”为何要这样做?

获奖后,我有机会接触到更多领域外的专家,比如哲学家、认知科学家。他们的视角让我警醒。一位哲学家朋友问我:“你在教AI用常识,但你想过没有,人类的常识本身是稳定不变的吗?它在不同文化、不同历史背景下都在流动和变化。你今天固化进模型的‘常识’,会不会成为它明天理解世界的枷锁?” 这个问题,我至今没有很好的答案。

四、 对未来的冷思考:热潮中的“减速带”

AI领域的发展太快了,每天都有新模型、新突破,让人眼花缭乱,也容易让人浮躁。吴文俊先生当年做机器证明,坐的是冷板凳,走的是少有人走的路。今天,我们获得以他名字命名的奖项,更应该继承这种精神:在热潮中保持冷静,在喧嚣中坚守本质。

我认为,未来几年,AI研究可能需要一些“减速带”:

1.从“性能驱动”回归“问题驱动”。少问“我的模型比SOTA高几个点”,多问“这个研究究竟解决了什么真实世界的问题?增进了我们对智能的何种理解?”

2.高度重视可解释性与安全性。尤其是当AI应用于医疗、司法、金融等关键领域时,一个“黑箱”模型哪怕精度再高,其潜在风险也是巨大的。可解释性不是锦上添花,而是规模化应用的基石

3.拥抱跨学科深度合作。AI的下一步突破,很可能不再局限于计算机科学内部,而是需要与神经科学、心理学、语言学乃至哲学进行更深度的碰撞。

获奖,像是一束突然打过来的聚光灯,让我和我们的工作被看见。但灯光之外,是无边无际的未知黑暗。我知道,这束光迟早会移开。而我和我的同行们,终将继续伏案,面对那些最根本、最棘手也最迷人的问题。这条路,道阻且长。但就像吴文俊先生等前辈们所践行的那样,科学的探索,其价值和魅力,往往就在这“阻且长”的过程之中。奖项是路上的一个里程碑,提醒我们走了多远,也提醒我们,前方还有更长的路。

也许有一天,AI真的能理解我们所谓的“常识”。到那时,它可能又会发展出属于它自己的、全新的“常识”体系。那会是一幅怎样的图景呢?我不知道。但我确信,保持好奇,保持敬畏,保持独立思考,是我们作为研究者,在智能时代洪流中,最不该丢失的“常识”。

版权说明:
本网站凡注明“AI门户网 原创”的皆为本站原创文章,如需转载请注明出处!
本网转载皆注明出处,遵循行业规范,如发现作品内容版权或其它问题的,请与我们联系处理!
您可以扫描右侧微信二维码联系我们。
  • 相关主题:
网站首页 关于我们 联系我们 合作联系 会员说明 新闻投稿 隐私协议 网站地图