6151线路检测中心


EN

行业动态

当前您的位置: 首页 > 产教生态 > 行业动态 > 正文

院士观点丨AI与空间计算融合,让机器人看懂、理解世界

发布日期:2025-08-15 浏览量:

在2025世界机器人大会上,中国科学院计算技术研究所研究员、中国工程院院士、广东院士联合会会员倪光南做了题为《“AI +空间计算”让机器看懂世界》的演讲,他指出,AI与空间计算的融合,是当前落实国家“人工智能+”行动的关键核心技术,它正在重构三维物理世界,拓展大模型通向物理世界的桥梁。

倪光南认为,机器人产业正处在从自动化工具向智能化主体发展的关键时期。要实现这一跨越,核心在于提升机器人的智能水平,让机器人能够真正地“看见世界、理解世界、行动于世界”。

他在演讲中强调,视觉是智能的起点。倪光南引用数据指出,一个4岁小孩通过视觉在四年中学到的视频信息量,与一个典型大语言模型学习的互联网全部公开文本信息量相当,这说明要让AI真正认识和理解世界,仅靠文本信息是远远不够的,必须重视视觉信息。

“空间计算是对物理世界的重构,而不是像大语言模型那样去生成。”倪光南表示,AI与空间计算的融合,能够让机器人通过低成本的纯视觉解决方案,精准感知三维空间、识别目标物体,并进行高精度的自主移动与生产作业。

倪光南将当前制造业的发展分为传统工业化(工业4.0)和新型工业化(工业5.0)两个阶段。他指出,在新型工业化阶段,机器人将从被动的自动化工具,转变为能够自主决策的智能化主体;控制方式从实时操作系统,演进为“脑、眼、行动”一体化的具身智能系统;工作模式也从固定工位发展为多工位移动作业。

为实现这一目标,倪光南提出了构建机器人“脑、眼、行动”一体化具身智能系统的构想。

●  脑    即基于大模型的机器人大脑,使其能够接受任务、自主规划并适应各种场景需求。

●  眼    即机器人的视觉系统,他建议采用“AI+空间计算”的技术路线,通过普通单目摄像头与神经网络学习的结合,实现高性价比、高精度的三维视觉感知。

●  操作    即机器人的操作系统,他推荐使用由中国科学院软件所支持的开源机器人操作系统AgileROS,通过开源开放、协同创新,为智能机器人发展打下坚实基础。


展望未来,倪光南认为构建自主的AI机器人生态系统至关重要。他类比PC时代的Wintel联盟和移动时代的安卓+ARM联盟,提出未来AI机器人时代应构建基于RISC-V芯片架构与AgileROS等开源系统的“脑、眼、行动”一体化智能系统新生态。

“在人工智能引领科技和产业变革的时代,发展AI机器人的关键在于提升其智能水平。”倪光南总结说,通过构建“脑、眼、行动”的具身智能系统,才能让机器人真正看懂世界,从而更好地发挥其作为新质生产力的核心作用。

图片

来源丨院士+、21世纪经济报道

图片

  • 微信公众号

  • 微信视频号

版权所有:6151线路检测中心产业学院 地址:广东省广州市从化区经济开发区高技术产业园广从南路548号

XML 地图