在2025世界机器人大会上，中国科学院计算技术研究所研究员、中国工程院院士、广东院士联合会会员倪光南做了题为《“AI +空间计算”让机器看懂世界》的演讲，他指出，AI与空间计算的融合，是当前落实国家“人工智能+”行动的关键核心技术，它正在重构三维物理世界，拓展大模型通向物理世界的桥梁。
倪光南认为，机器人产业正处在从自动化工具向智能化主体发展的关键时期。要实现这一跨越，核心在于提升机器人的智能水平，让机器人能够真正地“看见世界、理解世界、行动于世界”。

他在演讲中强调，视觉是智能的起点。倪光南引用数据指出，一个4岁小孩通过视觉在四年中学到的视频信息量，与一个典型大语言模型学习的互联网全部公开文本信息量相当，这说明要让AI真正认识和理解世界，仅靠文本信息是远远不够的，必须重视视觉信息。

“空间计算是对物理世界的重构，而不是像大语言模型那样去生成。”倪光南表示，AI与空间计算的融合，能够让机器人通过低成本的纯视觉解决方案，精准感知三维空间、识别目标物体，并进行高精度的自主移动与生产作业。

倪光南将当前制造业的发展分为传统工业化（工业4.0）和新型工业化（工业5.0）两个阶段。他指出，在新型工业化阶段，机器人将从被动的自动化工具，转变为能够自主决策的智能化主体；控制方式从实时操作系统，演进为“脑、眼、行动”一体化的具身智能系统；工作模式也从固定工位发展为多工位移动作业。

为实现这一目标，倪光南提出了构建机器人“脑、眼、行动”一体化具身智能系统的构想。

● 脑 即基于大模型的机器人大脑，使其能够接受任务、自主规划并适应各种场景需求。

● 眼 即机器人的视觉系统，他建议采用“AI+空间计算”的技术路线，通过普通单目摄像头与神经网络学习的结合，实现高性价比、高精度的三维视觉感知。

● 操作即机器人的操作系统，他推荐使用由中国科学院软件所支持的开源机器人操作系统AgileROS，通过开源开放、协同创新，为智能机器人发展打下坚实基础。

展望未来，倪光南认为构建自主的AI机器人生态系统至关重要。他类比PC时代的Wintel联盟和移动时代的安卓+ARM联盟，提出未来AI机器人时代应构建基于RISC-V芯片架构与AgileROS等开源系统的“脑、眼、行动”一体化智能系统新生态。

“在人工智能引领科技和产业变革的时代，发展AI机器人的关键在于提升其智能水平。”倪光南总结说，通过构建“脑、眼、行动”的具身智能系统，才能让机器人真正看懂世界，从而更好地发挥其作为新质生产力的核心作用。

来源丨院士+、21世纪经济报道

6151线路检测中心