具身智能第一步:机器人学会"空间辨识"!科学家用虚拟世界打造空间推理神器
假设:你让机器人帮你拿冰箱里的可乐,它却对着微波炉发呆——这不怪它,现在的AI就像个"空间路痴"。但最近科学家搞了个骚操作:用虚拟世界+3D场景说明书,硬生生给AI装上了"空间脑"!
▌AI特训班:在《我的世界》里学几何
意大利理工学院和阿伯丁大学的科学家们开了个"虚拟补习班":
1️⃣ 用游戏引擎NVIDIA Omniverse造了个极简版《我的世界》,里面只有悬浮的彩色立方体
2️⃣ 让虚拟摄像头围着方块360°狂拍,每张照片都配上"说明书"(比如:"这是个边长2米的红方块,摄像头在它东南方3米处")
3️⃣ 还附赠数学秘籍——4x4变换矩阵(相当于给AI的GPS坐标贴)
论文第一作者Joel Currie博士说这就像:"我们批量生产了数万张‘几何题卡’,AI不用真实碰壁就能学会空间思维。"
▌机器人突然开窍了?
训练后的视觉-语言模型(VLM)突然get到这些超能力:
✓ 能判断"你看到的字是不是反的"
✓ 知道"奶茶杯其实被笔记本挡住了"
✓ 甚至预判"你伸手够不到书架顶层"
(这不就是学霸做立体几何题的既视感吗?)
▌幕后黑手是谁?
原来这是FAIR*项目的成果,两支神仙团队联手:
意大利理工的"人机社交认知天团"(掌门人:Agnieszka Wykowska教授)
阿伯丁大学的"行为预测实验室"(带头大哥:Patric Bach教授)
团队技术大佬Davide De Tommaso透露:"我们发现人类会和机器人‘尬舞’——下意识觉得它们有思想!所以要教AI读懂你的眼神暗示和空间暗号。"
▌接下来要玩大的?
研究员Gioele Migno剧透后续计划:
把虚拟世界升级成《黑客帝国》画风(毕竟现在场景像乐高积木)
让真·机器人进虚拟世界"留学"
最终目标:和人类玩真人版"躲猫猫"时能预判走位!
(结尾突然正经)这项研究就像给AI装了空间想象力补丁,或许未来某天,机器人帮你递剪刀时不会再把刀尖对着你了呢~
更多信息: Joel Currie 等,《通过基于空间的合成世界实现机器人的具身认知》,arXiv (2025)。DOI :10.48550/arxiv.2505.14366