人工智能(AI)早已不是科幻电影里的遥远概念,它正以前所未有的速度融入我们的日常生活与千行百业。然而,当普通创业公司或传统企业试图拥抱AI时,往往会面临两大现实困境:高昂的算力成本与专业人才壁垒,以及高质量训练数据的稀缺与获取难题。动辄上亿元的初期投入和漫长的回报周期,让许多探索者望而却步。那么,有没有一条路径,能让AI技术的应用像使用水电一样便捷、高效且成本可控呢?本文将带你走近一家在AI浪潮中坚持了十年的中国公司——商汤科技,看它是如何通过独特的战略与技术创新,试图为行业提供一份可行的答卷。
要理解商汤的当下,有必要先回顾AI发展的脉络。过去十年,大众对AI的认知经历了三次关键的跃升。最初是“感知AI”的爆发,即让机器学会“看”和“听”。2012年左右,深度学习在图像识别领域取得突破,使得AI能在安防、金融等领域进行人脸识别、物体检测。这个阶段的AI更像一个“专业工具”,能力依赖于海量的人工标注数据。例如,训练一个早期的图像识别模型,可能需要标注千万张图片,其背后是极其庞大的人力成本。
紧接着,以2018年Transformer架构为标志,我们进入了“生成式AI”时代。AI不再仅仅识别内容,而是开始“创造”内容,能够撰写文章、生成图片、编写代码。这一飞跃的关键在于,模型学会了从互联网海量的、未经标注的文本中自主学习知识。文本的知识密度极高,这成为了大模型涌现出通用能力的基石。然而,新的瓶颈也随之出现:据行业预测,互联网上高质量的语言文本数据可能在不久的将来被消耗殆尽。AI学习的“粮食”面临短缺。
于是,行业将目光投向了下一个前沿——“具身AI”或“世界模型”。其核心思想是让AI像婴儿一样,通过与物理世界的直接交互来学习和进化,而不仅仅是从已有的文字或图片中获取二手知识。这被认为是通向更高级、更通用智能的关键路径。商汤科技董事长徐立曾用一个生动的“主动猫与被动猫”实验来比喻:两只猫看到同样的画面,但能主动探索环境的那只猫,其大脑发育和学习速度远快于那只只能被动观看的猫。这揭示了主动交互与探索对于智能生成的根本性价值。
面对数据与成本的双重挑战,商汤科技提出了自己的解决方案,其核心可以概括为“一加X”战略与“原生多模态”技术路径。
首先,“一加X”战略是一个精巧的商业与生态设计。这里的“一”,指的是商汤的核心AI能力基座,包括其强大的AI基础设施“SenseCore商汤AI大装置”和“日日新”大模型。这个基座如同航空母舰,提供强大的算力、算法和平台支持。而“X”,则代表围绕这个基座孵化出的众多垂直领域生态企业,如智能汽车“绝影”、家庭机器人“元萝卜”、智慧医疗等。这些“子舰”能够灵活地深入具体行业,利用母舰的通用能力,快速开发出贴合场景的解决方案。
这种模式带来了显著的优势:
*极大降低创新门槛与成本:生态企业无需从零搭建昂贵的算力平台和研发基础模型,可以直接调用商汤的“AI工厂”能力,将资源和精力聚焦于产品定义与市场落地。据公开信息,这种协同模式为生态伙伴节省了高达数亿元的重复研发投入。
*加速技术落地与商业化:“子舰”在各自领域深耕,能更快地理解行业痛点,将AI技术转化为实际产品。同时,它们的成功又能反哺核心基座,形成数据与场景的闭环,推动“母舰”能力的持续进化。
*分散风险并激发活力:每个“X”公司都拥有独立的运营和融资能力,机制更灵活,能更好地吸引人才和应对市场变化。
在技术路径上,商汤押注于“原生多模态融合”。当前许多多模态AI是将视觉、语言等不同模块“拼接”在一起,而商汤的NEO架构是从底层进行设计,让模型原生就能理解和生成图文、音频乃至视频等多模态信息。这被徐立视为“突破智能上限的高效路径”。一个有趣的发现是,当模型接受了大量高质量的图文关联数据训练后,不仅多模态能力增强,其纯文本的推理能力也获得了显著提升。这意味着,通过视觉与语言的深度融合,AI能从更丰富的世界信息中提炼知识,从而变得更“聪明”。
再先进的技术,如果不能解决实际问题,也只是空中楼阁。商汤的AI能力正通过“一加X”的生态网络,渗入城市、医疗、教育等领域的毛细血管。
在城市治理中,商汤的AI系统已部署在全国近200座城市,每天处理超过亿级次的感知任务。它如同城市的“数字神经网络”,让管理从“被动响应”转向“主动预判”。例如,在地铁站,AI可以实时监测客流密度、识别安全隐患,保障运营安全与效率。
在医疗领域,出海成为亮点。商汤的“SenseCare胸部X光智能分析解决方案”成功落地印尼最大的私立医疗集团,这是中国AI影像产品首次以普惠方案的形式走向海外。在国内,其“大医”医疗大模型正助力河南等地的医疗机构构建智慧医院,辅助医生进行诊断和临床决策。
在教育场景,AI的价值在于“把时间还给老师”。商汤的“智能批阅”系统能精准批改全学科手写作业,甚至对数学题进行步骤级诊断,将教师从繁重的机械劳动中解放出来。其“AI讲解大脑”则能在博物馆、企业展厅等场所提供媲美专业讲解员的互动服务。
这些案例表明,AI的核心价值不在于实验室的参数竞赛,而在于能否走进“柴米油盐”的现实,成为支撑社会高效、平稳运转的“基础设施”。
进入2026年,商汤管理层判断,AI正迎来“规模化的爆发阶段”。生成式AI业务收入已占其总营收的77%,成为绝对的增长引擎。未来的发力点清晰而明确:继续深耕原生多模态技术、打造智能体(Agent)时代的应用入口、将单位智能成本压到极致,并推动国产算力从“可用”到“好用”。
其中,国产算力的规模化应用是一个关键且艰巨的任务。商汤披露,其总算力规模已达到4.04万P(1P=每秒千万亿次计算),其中国产算力超过5500P。通过与国产芯片厂商的深度联合优化,商汤已在万卡规模的国产GPU集群上实现了大规模异构训练,算力利用率高达80%。这不仅仅是商业选择,更是构建自主可控AI产业体系的战略必需。
从更宏观的视角看,商汤的十年历程,折射出中国AI产业从技术追赶到局部领先的探索。其“一加X”的生态化打法,以及坚定投入原生多模态和国产算力的技术路线,为我们观察AI如何从尖端技术转化为普遍生产力,提供了一个极具参考价值的样本。这条路绝非坦途,但正如其使命所言——“坚持原创,让AI引领人类进步”,这种在核心技术上的长期主义,或许正是穿越周期、赢得未来的关键。
