近日,群核科技在首届技术开放日(TechDay)上正式发布其空间大模型最新成果:新一代空间语言模型SpatialLM 1.5与空间生成模型SpatialGen。SpatialLM 1.5支持用户通过对话交互系统SpatialLM-Chat进行可交互场景的端到端生成,它打破传统大语言模型对物理世界几何与空间关系的理解局限,可生成物理正确的结构化场景。SpatialGen是一款基于扩散模型架构的多视角图像生成模型,可生成3D高斯(3DGS)场景和渲染漫游视频。
在TechDay 的现场,一个养老场景的演示让在场观众眼前一亮:工作人员在 SpatialLM-Chat 对话系统中输入 “去客厅餐桌拿药”,短短几秒后,系统不仅识别出 “客厅”“餐桌”“药” 三个关键对象,还自动调用路径规划工具,生成了一条避开茶几、椅子的最优行动路线。
SpatialLM的空间参数化生成能力,可以高效创建具备物理准确性的训练场景:首先基于自然语言描述生成结构化空间方案,继而自动匹配素材库构建三维环境,最终输出可供机器人进行路径仿真的可交互场景。
图说:SpatialLM 1.5 机器人训练演示demo
从技术迭代的角度来看,SpatialLM 1.5 的进步是建立在 SpatialLM 1.0 的基础上的。今年 3 月,群核开源 SpatialLM 1.0 后,该模型迅速登上 Hugging Face 趋势榜前三,成为空间大模型领域的 “热门工具”。更关键的是,已有初创企业基于 SpatialLM 1.0 的代码和架构,训练出了适合自身场景的空间模型。
SpatialLM技术突破的背后,是群核构建的「空间智能飞轮」正加速转动。基于酷家乐这一全球最大的空间设计平台,群核科技构建了“空间编辑工具-空间合成数据-空间大模型”的空间智能飞轮,让工具沉淀数据,用数据加速模型训练,用模型提升工具体验,再在工具的广泛应用中沉淀更为丰富的场景数据。正如快手依托短视频生态推动可灵迭代一样,群核凭借酷家乐沉淀的海量室内物理数据,正在空间智能领域复现“工具—数据—模型”的技术增强回路。
数据显示,截至2025年6月30日,群核科技拥有包含超过4.41亿个3D模型及超过5亿个结构化3D空间场景。从酷家乐的数据积累到群核空间大模型的战略升级,群核的技术飞轮效应正在持续兑现。