#大数据

你的新苹果电脑并不是你自己的! - Jeffrey Paul

20-11-14 332 2 banq

2020年11月12日,苹果发布了macOS Big Sur。该版本上线后的几个小时内,在线证书状态协议(OCSP)请求负载增加到苹果基础设施无法承受的水平。OCSP是现代公钥基础结构(PKI)的关... 详细

使用Storm、Kafka和ElasticSearch处理实时数据 -javacodegeeks

20-10-23 632 1 banq

这是使用Storm,Kafka和ElasticSearch处理实时数据的文章和 源码 批处理和流处理的区别: 批处理:批处理是要一起处理的数据的集合(请参... 详细

如何在Spring中使用JobRunr实现后台作业? - Baeldung

20-10-17 321 1 banq

在本教程中,我们将研究使用JobRunr在Java中进行分布式后台作业调度和处理,并将其与Spring集成。 JobRunr 是一个我们可以嵌入到应用程序中的库,它使我们可以使用Java 8 l... 详细

Netflix如何使用bulldozer从数据仓库批处理数据转移到键值存储?

20-11-01 208 banq

Netflix拥有超过1.95亿用户,每天生成数PB的数据。数据科学家和工程师从我们的订户和视频中收集这些数据,并实施数据分析模型以发现客户行为,以最大程度地提高用户满意度。 通常,数据科学家和工程... 详细

数字时代:什么是数据工程? -Techin3

20-10-13 262 banq

在LinkedIn的2020年新兴工作报告和Hired的2019年软件工程师状况报告中,他们将数据工程师的职位排在了紧挨数据科学家和机器学习工程师的位置。 数字时代利用数据可以实现很多事情,从个性化... 详细

Netflix Mantis简介 - Baeldung

20-10-24 206 banq

Mantis是一个用于构建流处理应用程序(作业)的平台。它提供了一种简便的方法来管理作业的部署和生命周期。此外,它有助于这些作业之间的资源分配,发现和通信。 因此,开发人员可以始终专注于实际的业务逻... 详细

Hadoop生态系统中各种组件介绍 - theinsaneapp

20-10-21 225 banq

Hadoop生态系统是一套可以共同解决大数据问题的服务。四个核心组件是MapReduce,YARN,HDFS和Common。让我们详细讨论这个话题。在此之前,我们将列出大数据生态系统中使用的所有组件... 详细

Apache Spark:数据框,数据集和RDD之间的区别 - Baeldung

20-10-21 210 banq

Apache Spark 是一个快速的分布式数据处理系统。它执行内存中的数据处理,并使用内存中的缓存和优化的执行,从而实现快速性能。它为流行的编程语言(例如Scala,Python,Java和R... 详细

共有 1291 2 3 4 ... 17 下一页