数据科学如何在Kubernetes与Amazon ECS之间选择?


在本文中,我们将从有抱负的新数据科学家的角度介绍两个容器管理解决方案:Kubernetes和Amazon Elastic Container Service(ECS)。
  
两种选择均支持部署机器学习模型
 如果您有兴趣在作为数据科学家的工作中建立和使用机器学习模型,可以使用教程来指导您在这两个平台上进行操作。亚马逊针对数据科学家提供了分步演练
然后,有一个面向Kubernetes用户的机器学习工具包,称为Kubeflow。这是一个开源,可移植且可扩展的解决方案。人们可以将其应用于任何新的或现有的Kubernetes部署。
 
两者都是可靠的选择
 当您查看Kubernetes和ECS之间的比较时,不要惊讶地找到有关可用性区域和整体可靠性的详细信息。选择可靠的服务可以帮助您避免可能导致数据科学项目暂时中断的中断。
ECS在69个可用区和22个地区中运行。此外,ECS属于Amazon Web Services(AWS)旗下。这意味着它可以保证至少99.99%的正常运行时间
Kubernetes通过在节点之间分布Kubernetes Pod的方法来强调可靠性,以使它们更能容忍应用程序故障。此外,Kubernetes的高可用性扩展到基础架构和应用程序级别。
此外,随着Kubernetes 1.2的发布,支持在云提供商提供的多个可用性区域中运行单个集群。但是,所选区域必须位于同一区域中,并由同一云服务提供。
Kubernetes版本自动为AWS和Google Compute Engine(GCE)用户提供了多个区域选择。但是,将适当的标签应用于节点和卷可创建对其他云服务的支持。
 
锁定性
ECS具有很高的供应商锁定级别,会阻止您将容器化的应用程序迁移到任何其他提供商或平台。相反,Kubernetes是一个开放源代码解决方案,可以将容器移动到其他地方,包括混合和多云提供商。
 
现有以数据科学为中心的Kubernetes教程
数据科学家可以轻松找到有关使用ECS的一般信息,但是有关如何在其工作中使用ECS的细节并不那么普遍。
另一方面,您可以快速找到针对数据科学家的Kubernetes解释器。这些使您更容易设想为什么要在其他服务上使用它。同样,内容创建者提供了将Kubernetes应用于数据科学项目的真实示例,例如预测客户流失率。