AI大语言模型、AGI

扎克伯格AI豪赌：世界模型+数据标注双管齐下

#虚拟现实VR #计算机视觉 #AI人工智能指南 #元宇宙

2025-06-12 1 2K banq

Meta新AI模型V-JEPA 2：让机器人“先思考再行动”，开启具身智能性新方向！

Meta推出全新AI模型V-JEPA 2，赋予机器人类似人类的“观察-思考-行动”能力。它能预测物体运动（如冰球飞行轨迹）、绕开障碍物、精准抓取或摆放物体，即使面对未见过的新物体也游刃有余，堪称AI界的“预判外挂”！

为什么这么强？
V-JEPA 2通过“狂刷视频”自学物理世界规律，如重力、碰撞和人类动作，相当于AI的“生活常识训练营”。它无需人工标注数据，像婴儿通过观察学习“牛顿定律”般，自主理解世界。

三大核心能力

理解：看懂周围环境，识别精细动作（如区分“真放笔”和“假装放笔”）。
预测：推测下一步发生的事，如杯子倒下水会洒。
规划：提前制定最优行动方案。

独特训练方式

高效学习：通过“视频猜谜”训练，模型观看部分遮盖的视频，猜测中间内容，聚焦抽象概念而非像素细节，学习效率比传统模型高1.5-6倍。
无监督学习：无需人工标注，纯靠视频自学。
一专多能：同一模型可处理动作识别、物体追踪等多种任务。
快速适配：新任务只需微调，无需从头训练。

应用场景

增强现实（AR）：为AR眼镜提供场景理解能力。
机器人操作：让机器人学会复杂动作，如徒手开易拉罐。
未来愿景：打造《钢铁侠》中“贾维斯”式的全能AI助手。

为大语言模型（LLM）加“视觉”
V-JEPA 2不是直接面向用户的ChatGPT式产品，而是为LLM提供“视频理解”能力的工具。它将视频压缩成精简的“嵌入向量”，让LLM像解读文字一样推理视频内容。未来，LLM可：

分析监控视频，自动检测异常。
根据教学视频生成图文教程。
甚至看懂影视剧并讨论剧情。

技术亮点

高效训练：通过“猜谜”机制（遮盖视频部分让AI脑补）提升学习效率。
抽象理解：聚焦动作和概念，而非像素级细节。
即插即用：训练好的模型可快速适配多种AI任务。

当前进展与未来
目前，V-JEPA 2仅处理视觉信息（暂不支持声音），Meta已通过非商用开源协议公开模型，邀请全球科学家共同完善。Meta首席AI科学家Yann LeCun表示，这标志着向“人类级AI”迈进了一步。

配套测试
Meta发布三套基准测试，专门评估AI的“物理直觉”，为全球研究者提供PK平台，助力模型优化。

总结
V-JEPA 2是AI领域的“视频翻译器”，为大语言模型赋予视频理解能力。它通过自监督学习高效掌握物理世界规律，适用于机器人、AR和未来智能助手开发。目前开源供研究使用，未来有望让AI像人类一样“看懂”世界！

劲爆消息！Meta砸千亿抢AI天才少年
Meta居然掏了1066亿人民币（149亿美元）的天价，买下一家叫Scale AI的公司49%的股份！更劲爆的是，这家公司的创始人——19岁就创业的华裔天才王同学（Alexandr Wang），直接被Meta挖去当"AI超级智能小组"的老大！

扎克伯格亲自坐在王同学旁边，身边被这些AI天才围绕，让自己沉浸在AI氛围感中。

这笔买卖让王同学和团队狂赚74亿美元（约530亿人民币）！对比一下：谷歌当年收购DeepMind才花了6亿，这简直是钞能力碾压！

小扎在内部信里热血沸腾："我们要一起打造AI的未来！"但明眼人都懂——Meta的AI团队最近疯狂离职，自家Llama 4模型又被曝用垃圾数据训练（30%资料来自网友瞎扯），被GPT-4.5甩开几条街，急得小扎头发都要薅秃了！

这位王同学堪称硅谷"端水大师"——一边当Meta的AI掌门，一边继续做Scale AI的CEO。网友吐槽："这是给脚踏两条船开出了天价船票！"不过Scale AI确实牛：5年估值冲到138亿美元，专治AI的"垃圾数据病"，连美军都是它客户（接单2亿美元）。Meta工程师私下吐槽："我们30%算力浪费在洗数据，用他家的能省40%时间！"

Meta的AI逆袭算盘
1️⃣ 数据翻身：Scale AI标注错误率仅0.3%（行业平均5%），手握1.2亿条人体动作数据，简直是AI界的"数据洗衣店"
2️⃣ 抢B端生意：Meta计划把Scale AI的数据服务卖给微软/亚马逊，学微软搞"AI军火商"
3️⃣ 对赌协议：传闻Scale AI未来三年收入增速若低于80%，Meta就能低价吞掉剩余股份

OpenAI吓得赶紧找Scale AI的对手合作，但短期内谁都离不开这家"数据黑帮"。网友辣评："当大家都在造跑车时，Meta直接买下了加油站！"现在压力给到谷歌和微软——这位95后天才少年+千亿资金的组合，会不会把Meta从AI吊车尾变成领跑员？

世界模型+数据标注双管齐下，目标是虚拟现实？