扎克伯格AI豪赌:世界模型+数据标注双管齐下


Meta新AI模型V-JEPA 2:让机器人“先思考再行动”,开启具身智能性新方向!

Meta推出全新AI模型V-JEPA 2,赋予机器人类似人类的“观察-思考-行动”能力。它能预测物体运动(如冰球飞行轨迹)、绕开障碍物、精准抓取或摆放物体,即使面对未见过的新物体也游刃有余,堪称AI界的“预判外挂”!

为什么这么强?
V-JEPA 2通过“狂刷视频”自学物理世界规律,如重力、碰撞和人类动作,相当于AI的“生活常识训练营”。它无需人工标注数据,像婴儿通过观察学习“牛顿定律”般,自主理解世界。

三大核心能力

  1. 理解:看懂周围环境,识别精细动作(如区分“真放笔”和“假装放笔”)。
  2. 预测:推测下一步发生的事,如杯子倒下水会洒。
  3. 规划:提前制定最优行动方案。

独特训练方式

  • 高效学习:通过“视频猜谜”训练,模型观看部分遮盖的视频,猜测中间内容,聚焦抽象概念而非像素细节,学习效率比传统模型高1.5-6倍。
  • 无监督学习:无需人工标注,纯靠视频自学。
  • 一专多能:同一模型可处理动作识别、物体追踪等多种任务。
  • 快速适配:新任务只需微调,无需从头训练。

应用场景

  • 增强现实(AR):为AR眼镜提供场景理解能力。
  • 机器人操作:让机器人学会复杂动作,如徒手开易拉罐。
  • 未来愿景:打造《钢铁侠》中“贾维斯”式的全能AI助手。

为大语言模型(LLM)加“视觉”
V-JEPA 2不是直接面向用户的ChatGPT式产品,而是为LLM提供“视频理解”能力的工具。它将视频压缩成精简的“嵌入向量”,让LLM像解读文字一样推理视频内容。未来,LLM可:

  • 分析监控视频,自动检测异常。
  • 根据教学视频生成图文教程。
  • 甚至看懂影视剧并讨论剧情。

技术亮点

  • 高效训练:通过“猜谜”机制(遮盖视频部分让AI脑补)提升学习效率。
  • 抽象理解:聚焦动作和概念,而非像素级细节。
  • 即插即用:训练好的模型可快速适配多种AI任务。

当前进展与未来
目前,V-JEPA 2仅处理视觉信息(暂不支持声音),Meta已通过非商用开源协议公开模型,邀请全球科学家共同完善。Meta首席AI科学家Yann LeCun表示,这标志着向“人类级AI”迈进了一步。

配套测试
Meta发布三套基准测试,专门评估AI的“物理直觉”,为全球研究者提供PK平台,助力模型优化。

总结
V-JEPA 2是AI领域的“视频翻译器”,为大语言模型赋予视频理解能力。它通过自监督学习高效掌握物理世界规律,适用于机器人、AR和未来智能助手开发。目前开源供研究使用,未来有望让AI像人类一样“看懂”世界!

劲爆消息!Meta砸千亿抢AI天才少年
Meta居然掏了1066亿人民币(149亿美元)的天价,买下一家叫Scale AI的公司49%的股份!更劲爆的是,这家公司的创始人——19岁就创业的华裔天才王同学(Alexandr Wang),直接被Meta挖去当"AI超级智能小组"的老大!

扎克伯格亲自坐在王同学旁边,身边被这些AI天才围绕,让自己沉浸在AI氛围感中。

这笔买卖让王同学和团队狂赚74亿美元(约530亿人民币)!对比一下:谷歌当年收购DeepMind才花了6亿,这简直是钞能力碾压!

小扎在内部信里热血沸腾:"我们要一起打造AI的未来!"但明眼人都懂——Meta的AI团队最近疯狂离职,自家Llama 4模型又被曝用垃圾数据训练(30%资料来自网友瞎扯),被GPT-4.5甩开几条街,急得小扎头发都要薅秃了!

这位王同学堪称硅谷"端水大师"——一边当Meta的AI掌门,一边继续做Scale AI的CEO。网友吐槽:"这是给脚踏两条船开出了天价船票!"不过Scale AI确实牛:5年估值冲到138亿美元,专治AI的"垃圾数据病",连美军都是它客户(接单2亿美元)。Meta工程师私下吐槽:"我们30%算力浪费在洗数据,用他家的能省40%时间!"

Meta的AI逆袭算盘
1️⃣ 数据翻身:Scale AI标注错误率仅0.3%(行业平均5%),手握1.2亿条人体动作数据,简直是AI界的"数据洗衣店"
2️⃣ 抢B端生意:Meta计划把Scale AI的数据服务卖给微软/亚马逊,学微软搞"AI军火商"
3️⃣ 对赌协议:传闻Scale AI未来三年收入增速若低于80%,Meta就能低价吞掉剩余股份

OpenAI吓得赶紧找Scale AI的对手合作,但短期内谁都离不开这家"数据黑帮"。网友辣评:"当大家都在造跑车时,Meta直接买下了加油站!"现在压力给到谷歌和微软——这位95后天才少年+千亿资金的组合,会不会把Meta从AI吊车尾变成领跑员?

世界模型+数据标注双管齐下,目标是虚拟现实?