在2025世界机器人大会上,中国科学院计算技术研究所研究员、中国工程院院士、广东院士联合会会员倪光南做了题为《“AI +空间计算”让机器看懂世界》的演讲,他指出,AI与空间计算的融合,是当前落实国家“人工智能+”行动的关键核心技术,它正在重构三维物理世界,拓展大模型通向物理世界的桥梁。
倪光南认为,机器人产业正处在从自动化工具向智能化主体发展的关键时期。要实现这一跨越,核心在于提升机器人的智能水平,让机器人能够真正地“看见世界、理解世界、行动于世界”。
他在演讲中强调,视觉是智能的起点。倪光南引用数据指出,一个4岁小孩通过视觉在四年中学到的视频信息量,与一个典型大语言模型学习的互联网全部公开文本信息量相当,这说明要让AI真正认识和理解世界,仅靠文本信息是远远不够的,必须重视视觉信息。
“空间计算是对物理世界的重构,而不是像大语言模型那样去生成。”倪光南表示,AI与空间计算的融合,能够让机器人通过低成本的纯视觉解决方案,精准感知三维空间、识别目标物体,并进行高精度的自主移动与生产作业。
倪光南将当前制造业的发展分为传统工业化(工业4.0)和新型工业化(工业5.0)两个阶段。他指出,在新型工业化阶段,机器人将从被动的自动化工具,转变为能够自主决策的智能化主体;控制方式从实时操作系统,演进为“脑、眼、行动”一体化的具身智能系统;工作模式也从固定工位发展为多工位移动作业。
为实现这一目标,倪光南提出了构建机器人“脑、眼、行动”一体化具身智能系统的构想。
● 脑 即基于大模型的机器人大脑,使其能够接受任务、自主规划并适应各种场景需求。
● 眼 即机器人的视觉系统,他建议采用“AI+空间计算”的技术路线,通过普通单目摄像头与神经网络学习的结合,实现高性价比、高精度的三维视觉感知。
● 操作 即机器人的操作系统,他推荐使用由中国科学院软件所支持的开源机器人操作系统AgileROS,通过开源开放、协同创新,为智能机器人发展打下坚实基础。
展望未来,倪光南认为构建自主的AI机器人生态系统至关重要。他类比PC时代的Wintel联盟和移动时代的安卓+ARM联盟,提出未来AI机器人时代应构建基于RISC-V芯片架构与AgileROS等开源系统的“脑、眼、行动”一体化智能系统新生态。
“在人工智能引领科技和产业变革的时代,发展AI机器人的关键在于提升其智能水平。”倪光南总结说,通过构建“脑、眼、行动”的具身智能系统,才能让机器人真正看懂世界,从而更好地发挥其作为新质生产力的核心作用。

来源丨院士+、21世纪经济报道
