让机器人“上学” 群核科技如何打造机器人数字道场?丨机器人产业链一线调研
“用多大力气可以打开一个柜子?”“捡起一个玩具从哪个角度可以放进筐里?”这些我们日常看起来平平无奇的操作,对机器人而言,却是一件难事。机器人往往需要在数字世界的虚拟场景中,一次次操作和训练,才能在真实的现实世界中完成这些动作。
作为新兴的未来产业,机器人产业链发展迎来了一轮新机遇。但技术快速迭代背后,人形机器人行业目前仍有一大痛点:缺乏可交互三维数据。
生成式语言大模型丰富了人形机器人的大脑,但当人形机器人走进物理世界,对力量的感知、对温度和气味的识别,生成式语言大模型仍难以解决,对空间智能需求应运而生。斯坦福教授李飞飞提出,空间智能是机器人和AI的未来基石。
创业14年,杭州群核信息技术有限公司(以下简称群核科技)积累了3.62亿个3D模型,空间设计平台“酷家乐”为群核科技的空间智能沉淀了大量的三维可交互数据,当时代的风口来到具身智能时,给人形机器人做数字道场的群核科技,也开启了空间智能的赛道角逐。
每日经济新闻《机器人产业链一线调研》第一期实地探访群核科技,近距离了解机器人的数字道场是如何诞生的。
数字世界的训练道场
2月初,英伟达和卡耐基梅隆大学研究团队研发的ASAP新框架运用在宇树机器人上,成功模仿了科比投篮的动作,令网友惊奇。但细看ASAP新框架,要复现科比的经典投篮动作,离不开机器人在模拟环境中的训练:第一阶段,研究团队使用经过调整的人类运动数据在模拟环境中预训练运动跟踪策略;第二阶段,将这些策略应用到真实世界,并收集真实数据来训练一个“残差”动作模型,用来弥补模型与真实世界物理动态之间的差距。
“目前的人形机器人(在)运动控制和小脑技术(方面),基本处于领先地位,但(在)机器人智能化开发过程中,数据往往是瓶颈,所以需要利用海量可交互三维数据集做机器人的训练道场,提升机器人的大脑能力。”群核科技首席科学家唐睿向《每日经济新闻》记者介绍,目前可交互的三维数据是制约人形机器人发展的瓶颈之一。
人形机器人的大脑主导上层的逻辑推理、决策、规划,以及用自然语言来和其他智能体、环境进行交流。“小脑”更多关注机器人的运动控制和平衡调节。人工智能技术的突破,让人形机器人拥有了更“聪明”的大脑。
然而,光有数据还远远不够,机器人还需要在数字世界里训练,进行学习强化。唐睿提到要做好机器人数字世界的训练道场,有两个非常核心的要素:首先,虚拟世界的数据是不是足够物理正确;其次,仿真的虚拟空间,是否足够接近真实世界。
“譬如我们做光线追踪,在虚拟世界中要模拟真实世界的光线传播,而在虚拟世界里,通过物理仿真引擎,要尽可能计算还原光线的仿真表现。”在唐睿看来,要在数字世界中还原真实的物理世界,如何保障数据的高精度和高准确性是空间智能的关键。
群核空间智能平台(SpatialVerse)是唐睿带领团队构建的一套空间智能解决方案,专为通过逼真的虚拟模拟训练复杂模型而设计,由于全球范围内具备物理正确属性的室内空间数据非常稀少,群核空间智能平台的合成虚拟数据生成能力吸引了硅谷等全球科技巨头们的主动合作。
一封陌生海外邮件叩开“空间智能”大门
根据群核科技招股书(申报稿),截至2024年年底,群核科技已经拥有超过3.62亿个3D模型,其平台上平均每月有8630万活跃访问者。公司是全球最大的空间设计平台,平台合作客户超4.5万家,服务覆盖200多个国家和地区。
这份数据的积累,和空间设计平台“酷家乐”密不可分。群核科技创始人黄晓煌等人最开始的创业方向是“用GPU(图形处理器)做云端的图形图像快速渲染”,最终的一大技术应用场景是在空间设计软件“酷家乐”上。
从53秒减少至1.2秒,这是“酷家乐”处理一张典型2K图像GPU渲染的最新速度。不少买房装修的业主体验过“酷家乐”的空间设计功能,但其实空间设计的概念并不新鲜。当创新叙事追逐赛博霓虹,随着时间和实践的积累,留存下来的物理正确的三维数据,在现实的反复捶打中,又再次为机器人注入灵魂觉醒的生存韧性。
3.62亿个3D模型及空间设计元素,是“酷家乐”积累下来的数据,正是得益于家装场景空间设计的大量实践和应用数据,群核科技才从空间设计平台迈向空间智能赛道。
2017年,群核科技的科研团队一直在批判性反思,为什么群核积累的大量高逼真三维交互数据仅能应用于家装场景中,还有没有其他应用价值?
还有没有其他可能?这个问题一直在群核科技的科研团队中反复出现,在还没有想到更多可能性之前,他们联合国外知名高校进行了一次科研合作。
2018年,群核科技和帝国理工学院、南加利福尼亚大学展开了一项科研合作:发布全球最大的室内场景认知深度学习数据集InteriorNet。
谁也没想到,这份在家装领域积累的室内设计数据,因为一封陌生邮件,为群核打开了一个全新的赛道。
2019年的一天,公司某位算法工程师打开邮箱时,一度怀疑自己收到了诈骗邮件。在这封全英文的邮件里,硅谷某家家喻户晓的万亿级硬件巨头主动向当时名不见经传的群核科技发出了合作邀约。彼时,该巨头正苦于缺乏大量物理正确的合成数据做机器人训练,而当他们在寻找这方面数据时,群核科技此前联合发布的InteriorNet数据集吸引了他们的目光,因此发来邮件寻求合作。
尽管一度被认为是诈骗邮件,但再三确认后,双方很快达成合作,群核科技的数据集也第一次应用在了空间智能训练上。
唐睿发现,这一次国内企业和国外企业并不存在认知代差。有了第一次合作之后,国外和国内的不少机器人企业也纷纷找来寻求合作。“AI行业的出海,我们和国外不存在认知代差。以往国外用户可能会存在认知屏障,譬如谈及汽车产业,海外用户会对德国制造和日本汽车有强认知,但AI是全新的技术,用户的刻板成见还未形成,国内在AI领域甚至具备领先优势。”唐睿表示。

机器人的未来基石:道阻且长
在“GTC2025全球大会”上,群核科技宣布开源其自主研发的空间理解模型SpatialLM。该模型仅通过一段视频即可生成物理正确的3D场景布局。据了解,SpatialLM突破了传统大语言模型对物理世界几何与空间关系的理解局限,让机器具备空间认知与推理能力,将为具身智能等相关领域提供空间理解基础训练框架。据悉,该模型接下来还将迭代自然语言和场景交互功能。
当前,群核科技的三大核心技术能力主要在于专门构建的GPU高性能计算集群、以多模态CAD大模型为代表的空间认知理解技术以及结构化合成虚拟数据生成。
在空间智能领域,群核科技希望搭建数字仿真与物理现实之间的桥梁,但要架起这样一座桥梁,有许多看不见、摸不着的难点。“比如说空气流体力学的仿真,我们现在在数字世界还做不到。”但AI的技术变革正在以非线性的速度推进,唐睿发现他很难预判未来几年空间智能的发展速度。“GPT、视频和图像等多模态人工智能技术的发展,颠覆了我对科技发展以往的认知。保守估计的话,预计3~5年内,空间智能会快速落地到泛娱乐或者消费级的应用中去。未来10年内,空间智能有望在工业领域获得巨大的成就。在具身智能领域,空间智能数据能够帮助机器人加速智能化。”
近50%的研发投入占比、80%左右的毛利率,“酷家乐”成为群核科技最主要的营收来源,可群核科技目前仍暂时处于亏损状态。不过,有分析认为前沿科技企业前期的技术研发投入会比较大,后期随着技术商业化落地,边际成本会逐渐大幅降低。
投资未来,是群核科技目前重仓的一件事情。
科技的竞争,核心还在于人才的竞争,所以群核科技加大了人才储备力度。
2月底,群核科技发布“星核人才计划”,招募岗位覆盖多模态大模型与AIGC(人工智能生成内容)研究、Sim2Real与具身智能研究、AI驱动的图形渲染引擎研究方向、三维几何算法与造型平台研究、智能空间设计领域研究等。
最高百万元级别的薪酬待遇,加之杭州“六小龙”的曝光效应,招聘信息发布后,群核科技迅速吸引了众多优质高校的毕业生。公司拥有615名研发人员,占员工总数的44.3%。创始团队中,群核科技多位高管毕业于名校。
独木难成林,在杭州创业的群核科技,也成为杭州全力打造人工智能全产业链的代表企业之一。从生态体系来看,梁文峰创办的DeepSeek大模型,打开了“用算法换算力”的新路径,带来了国内开源生态的大繁荣;宇树科技、云深处等机器人企业受益于大模型技术的进步,迭代速度加快;群核科技的空间智能则在一定程度上弥补了机器人三维数据的匮乏。在杭州的城市物理空间上,这些企业构筑了一个彼此咬合的生态系统。
流量和高曝光,带来了耀眼的光环。对群核科技来说,它需要用更多的能力证明自身价值。
公司爆红之后,唐睿既高兴又倍感压力:“这个世界变化得太快了。所以进一步地坚定了我们的团队理念:和有批判视角、有活力的小伙伴们一起工作,一起创新。”
他觉得群核还远远不能满足于现状,科研团队更需要具备批判性的思维进行自我批判,发挥创造性思维改变自己、改变行业。
唐睿说:“我们希望击败我们的,是我们自己,而不是其他人。”
(海报设计:刘阳)