特斯拉Optimus引领人形机器人革命


特斯拉的Optimus有望成为下一个革命性产品,将超越智能手机,成为我们这个时代的标志性技术。

Optimus不仅仅是一个人形机器人,它代表了基于行动的计算机时代的开始,将自主性无缝融入日常生活。通过扩展人类的能力,超越了以前的极限,它标志着技术采用的一个转折点。

这篇文章将Optimus视为一个联网设备。随着世界朝着无处不在、高带宽、低延迟的互联网接入方向发展,每个设备——无论在哪里——都可以持续连接。这种连接为Optimus解锁了强大的计算可能性,我们将在这里探讨。

Optimus在互联网上
从一开始,Optimus将是一个连接的设备。作为一个完全集成的物联网(IoT)设备,Optimus将可以访问互联网资源并连接到特斯拉云。就像特斯拉汽车一样,Optimus将支持空中(OTA)软件更新。它将通过WiFi或蜂窝连接保持互联网连接。

独特的是,Optimus将支持SpaceX Starlink DTC(Direct-to-Cell)进行连接。这使特斯拉能够在全球范围内运营Optimus,甚至在偏远地区。

连接的机器人
无处不在的互联网连接开启了一个充满可能性的世界。让我们浏览一组可能的特性和功能。下面的讨论不是特斯拉的路线图。我不是特斯拉员工,也没有任何内幕信息。一些方面概述了可能的前进道路,而另一些方面则根据假设的挑战和机遇提出了新的功能。

Optimus的移动记忆
当Optimus与它的主人、其他人和它的环境互动时,它会建立一个记忆。这种记忆是丰富的,包括所有的对话(通过语音交互),其活动的视觉记录,以及它所做的每一个动作。就像人类一样,记忆是一个关键的定义元素。

在谈话中,Optimus的记忆提供了上下文。例如,

  • 如果你问,“我的泳衣你带了吗?",它可以响应,“是的,在你的随身行李里。"
  • 或者如果你问“上周我们用了多少鸡蛋?",它可以作出反应,“我们总共用了15个鸡蛋,12个是早餐用的,剩下的是我周四烤的蛋糕。我们每周平均吃10个鸡蛋。"

作为联网设备
Optimus连接到Tesla Cloud,使其能够将其内存状态与基于云的存储同步。这不仅仅是一个备份-这是一个接近实时同步的特斯拉Optimus的内存状态。在某些情况下,让Optimus亲自出现可能不方便或不可能。特斯拉可以提供一个移动的配套应用程序,允许用户下载和访问他们的Optimus内存状态。这个应用程序的功能就像一个虚拟的Optimus,即使没有物理机器人,也可以进行对话和互动,进一步改善其记忆状态。

每个Optimus都保持着独特的记忆状态。在任何时候,Optimus要么是活跃的(使用当前内存运行)或休眠的(等待以存储器状态激活)。休眠的Optimus可以使用另一个Optimus的内存状态激活。这允许Optimus的内存在物理单元之间无缝传输-在原始Optimus不可用、损坏或用户旅行时非常有用。例如,用户可以在旅行目的地租用Optimus并恢复其记忆状态,确保体验的连续性。

将Optimus的内存状态同步到Tesla Cloud或移动终端应该是快速无缝的。对于未启动的设备(如另一台Optimus),可能需要几分钟,但对于最近使用的设备,可能不到1分钟。

共享存储器
全球舰队或Optimus机器人的子舰队可以共享观察记忆。共享内存涉及选择性的内存模式,而不是整个内存状态。这指的是观察记忆--从环境观察中获得的知识。例如,每个Optimus机器人都可以观察其驻扎位置的天气,并与集体舰队和其他数据系统共享这些观察结果。同样,Optimus机器人可以实时跟踪人口密度,使数据系统能够识别机场、商场和城市街道等地点的高峰活动时间。

基于云的分布式推理
Optimus的大脑本质上是一个基于人工智能的操作系统。其感知和规划活动的决策框架基于神经网络。因此,其大部分计算资源专用于推理。推理涉及通过AI模型处理输入数据以生成动作。神经网络模型由在训练过程中建立的大量参数(数字)组成。该处理不对称:使用云中的大量计算资源创建模型,之后将其加载到进行推理处理的目标设备上。

虽然推理的计算密集度低于训练,但它仍然需要大量资源。在某些情况下,单靠设备上的推断是不够的。Optimus可以利用云辅助推理,在网络延迟较低时将某些流程卸载到云。除了云辅助推理之外,Optimus机器人和特斯拉汽车还可以在分布式推理系统中协同工作。虽然Optimus可能经常处于活跃使用状态,但也有一些时间段(例如充电期间)其计算资源保持大部分空闲。同样,特斯拉汽车也经历了长时间的有限使用,使其车载计算能力可用于分布式推理。

随着Optimus变得越来越先进,许多推理任务将转移到施事推理- 异步运行,而不是真实的运行,其中网络延迟不太重要。例如,你可以要求Optimus支付你的账单或安排一个约会。这些非实时任务非常适合分布式推理。

局部学习
到目前为止,我们已经讨论了网络连接Optimus的上下文中的推理。但是学习呢?在标准的人工智能模型中,“训练”-学习过程-集中发生在数据中心。这个培训过程建立了一个模型,然后将其下载到设备(作为OTA更新的一部分)。一旦在设备上,推理就可以发生--为预期的结果运用模型。

然而,Optimus可以在本地设备上学习。这个学习过程有效地建立了一个技能或子技能。例如,主人可以教Optimus用一只手打鸡蛋,即使它最初需要两只手。或者Optimus可以学习如何选择性地给花园除草,让有益的植物不受影响。这些调整,本质上是对车载模型的改进,可以传输到特斯拉云,以包含在全局模型中。

组学习
但并不是所有的地方学习都应该重新纳入全球模式。当企业购买或租赁Optimus时,它将训练机器人执行符合其运营需求的任务。例如,星巴克可能会部署Optimus作为咖啡师,训练它准备各种咖啡饮料。经过培训后,Optimus机器人学习到的技能可以立即与其工作人员中的其他机器人共享-这是全球舰队的一个子集。然而,这些在当地获得的技能中有许多被认为是专有的。制造业和服务业经常开发独特的生产和服务技术。因此,他们希望Optimus只在自己的舰队内共享培训,以确保专有知识保密。

群组操作
到目前为止,Optimus采取的所有行动都被认为是单独集中的-由一个Optimus机器人完成。但是网络中有力量;连接的机器人可以组织集体推理并协调群体行动。群体行动使Optimus机器人能够协作,利用其网络智能来处理超出单个单元能力的任务。例如,在制造环境中,多个Optimus机器人可以在装配线上一起工作,一些机器人处理组件放置,而另一些机器人进行实时质量检查。通过共享数据和动态调整,他们确保了精度和效率,同时减少了错误和生产延迟。在建筑物安全场景中,Optimus机器人网络可以在没有冗余的情况下巡逻不同的区域,协调它们的路线以确保全面覆盖,同时共享有关潜在安全威胁的实时警报。如果一个机器人检测到异常,它可以立即通知其他机器人做出相应的响应,防止不必要的重叠并提高态势感知能力。

这种作为统一系统的能力突出了集体智慧的力量,使Optimus能够在复杂的多智能体环境中无缝运行。

网络上
网络连接使Optimus能够以新颖而强大的方式发挥作用。如前所述,Optimus可以远程存储、传输和共享其内存。它还可以将其推理处理扩展到云端,并在整个网络中分配计算任务。此外,Optimus在当地学习的技能可以与指定的车队或团队共享,从而在不损害专有知识的情况下促进专业培训。最后,网络连接使Optimus单元能够协调和执行群体行动,从而实现超越单个单元能力的协作努力。

结论
第三次革命现在正向我们走来。

  • 个人电脑是在一个网络无处不在的时代出现的。直到1985年,随着Macintosh Office的出现,“网络”的概念才进入消费者的意识。
  • 互联网出现在20世纪90年代初,各地的消费者开始浏览万维网。
  • 到2000年代中期,智能手机已经初具规模。2007年,苹果推出了iPhone,作为一个持续连接的网络设备首次亮相-依赖并假设网络连接。从2007年到现在,网络连接不断改善,消费者现在将其视为技术的基本组成部分。全世界都期待着近网络的普及,而像SpaceX的Starlink这样的产品,这种普及现在已经延伸到了我们星球的每个角落。

Optimus不一样。它是在一个连接性是绝对的世界中出现的第一个主要的新产品类别。与智能手机不同,我们已经开始将其理解为网络端点,Optimus集成到网络的结构中。这标志着一个关键的转变-下一个大的事情不仅仅是另一个设备,而是一个新的范式,其中技术和网络是不可分割的。