群核科技空间理解模型SpatialLM正式开源

上证报中国证券网讯 3月19日,群核科技微信公众号发文称,在GTC 2025上,公司正式开源空间理解模型SpatialLM。  据介绍,SpatialLM模型能够基于从视频中提取的点云数据,准确认知和理解其中的结构化场景信息,并将它以脚本语言的形式呈现出来。也就是说,给SpatialLM看一段视频,它便能生成物理正确的3D场景布局。  这意味着,SpatialLM突破了大语言模型对物理世界几何与空间关系的理解局限,让机器具备空间认知与推理能力,为具身智能等相关领域提供空间理解基础训练框架。  如果说SpatialLM模型的作用是让机器人更好地感知世界,那么群核科技去年推出的群核空间智能解决方案(SpatialVerse)则是通过合成数据方案为机器人搭建起接近物理真实的“数字道场”,帮助它们在仿真环境下完成例如叠被子、递送水杯、开关冰箱门等行动的交互训练。  通过结合SpatialLM模型和SpatialVerse,机器人将获得从认知理解到行动交互的完整闭环训练——既能“看懂”世界,又能学会行动决策,进而在真实世界里顺利“上岗”,更好地完成人类指令。  目前,SpatialLM模型已在HuggingFace、Github、魔搭社区等平台开源,全球开发者均可免费下载并进行部署。(郑维汉)