Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
中台数据工程教程
企业事件驱动架构指南 - wiprodigital
企业严重依赖技术来构建可扩展,敏捷和高可用性的业务。事件驱动架构正在成为使现代企业实时运行,快速适应变化并做出明智业务决策的关键基石。 “事件驱动架构(EDA)是一种设计范例,其中软件组件响应收到一个或多个事件通知而执行。”–加特纳<
Hadoop生态系统中各种组件介绍 - theinsaneapp
Hadoop生态系统是一套可以共同解决大数据问题的服务。四个核心组件是MapReduce,YARN,HDFS和Common。让我们详细讨论这个话题。在此之前,我们将列出大数据生态系统中使用的所有组件 :
使用Storm、Kafka和ElasticSearch处理实时数据 -javacodegeeks
这是使用Storm,Kafka和ElasticSearch处理实时数据的文章和
三种大数据流处理框架选择比较:Apache Kafka流、Apache Spark流和Apache Flink - quora
所有这些框架(Kafka Streams,ksqlDB,Flink,Spark)对于特定的用例和需求都是很棒的。决策选择真的很难,因为涉及许多因素。以下是一些常见问题和准则,可帮助您做出正确的决定: 您是否已在另一个项目中使用这些框架之一?已经经历过?然后评估它是否也
Java可以用于机器学习和数据科学吗? - kdnuggets
机器学习,数据科学和人工智能是近年来最受关注的技术,理所当然的。科技领域的这些进步已将自动化和业务流程提升到了一个新水平。各种规模的组织都在研究和人员上投入数百万美元,以构建这些功能强大的数据驱动应用程序。有许多不同的编程语言可用于开发机器学习和数据科学应用程序。尽管Python和<
你的新苹果电脑并不是你自己的! - Jeffrey Paul
2020年11月12日,苹果发布了macOS Big Sur。该版本上线后的几个小时内,在线证书状态协议(OCSP)请求负载增加到苹果基础设施无法承受的水平。OCSP是现代公钥基础结构(PKI)的关键,用于验证身份文件的有效性,这些称为X.509证书的文档将附加到用户在Mac上启动的每个经过
如何将Apache Druid,Flink和Cassandra用于实时流分析和用户评分?
在Deep.BI上,我们能够解决的最艰巨的挑战之一就是如何基于数十亿个数据点实时提供可自定义的洞察力,这些洞察力可以从单个角度全面扩展到多达数百万个用户。在Deep.BI,我们跟踪用户习惯,参与度,产品和内容性能-每天处理多达TB或数十亿个事件。我们的目标是根据来自各种自行创建维度的
基于Spring Batch的Spring Boot的教程 - Baeldung
在本文中,我们将学习如何使用Spring Boot创建一个简单的Spring Batch作业。首先,我们从定义一些基本配置开始。然后,我们将看到如何添加文件读取器和数据库写入器。最后,如何应用一些自定义处理并检查我们的作业是否成功执行。可以
数字时代:什么是数据工程? -Techin3
在LinkedIn的2020年新兴工作报告和Hired的2019年软件工程师状况报告中,他们将数据工程师的职位排在了紧挨数据科学家和机器学习工程师的位置。数字时代利用数据可以实现很多事情,从个性化营销活动到为自动驾驶汽车提供动力。数据科学家负责分析数据并将其用于各种目的。但是
大数据分析的具体处理??
大家好:有这样一个问题怎么处理分析了,大致情况如下: 一个组集群服务器(server1 ,server2 ,server3 ,server3),每天产生很产生很多日志(记录了IP,时间。。。),4台服务器会生成一个500G的大日志。现在需要对这500G的日志继续分析,找到出现IP最
使用Flink SQL进行实时性能监控:AdTech广告用例
广告技术(Ad Tech)是一个统称,它描述用于管理和分析程序化广告活动的系统和工具。数字广告的目标是尽可能多地吸引相关受众。因此,广告技术本质上与处理大量数据有关。在此博客文章中,我们将研究如何关联两个事件流-广告投放(所谓的展示次数)和点击次数,并计算重要的广告技术指标-点击率(
企业数据库的选择通常由系统架构师主导决策 - thenewstack
忘了开发人员吧,今天的王国创造者被称为架构师,而且研究继续表明,如果按照架构师的偏好会采用不同的技术。一个典型的例子是数据库。根据
Apache Flink复杂事件处理指南 - softwaremill
如今,流处理是一个非常流行的话题。公司处理成千上万个需要实时或近实时处理的事件。企业需要分析客户的行为,交易,股票价格变化甚至自动驾驶汽车传感器读数。但是,今天,我们要专注于
关于库存查询与领域建模
本人正在做库存管理,在看了大量设计模式,ddd,企业设计模式相关资料,并基本参考了dddsample后,使用spring mvc+spring+hibernate,对库存管理系统进行了初步的领域建模(可能由于理角不深,模型还有问题,但基本思想是ddd的)并实现了数据输入和简单的查询功能,
Netflix Mantis简介 - Baeldung
Mantis是一个用于构建流处理应用程序(作业)的平台。它提供了一种简便的方法来管理作业的部署和生命周期。此外,它有助于这些作业之间的资源分配,发现和通信。因此,开发人员可以始终专注于实际的业务逻辑,同时始终获得强大且可扩展的平台的支持,以运行其高容量,低延迟,无阻塞的应用程序。
Apache Spark:数据框,数据集和RDD之间的区别 - Baeldung
Apache Spark是一个快速的分布式数据处理系统。它执行内存中的数据处理,并使用内存中的缓存和优化的执行,从而实现快速性能。它为流行的编程语
Netflix如何使用bulldozer从数据仓库批处理数据转移到键值存储?
Netflix拥有超过1.95亿用户,每天生成数PB的数据。数据科学家和工程师从我们的订户和视频中收集这些数据,并实施数据分析模型以发现客户行为,以最大程度地提高用户满意度。通常,数据科学家和工程师使用大数据计算技术(例如
服务网格网络对于企业人工智能AI解决方案的重要性 - datasciencecentral
在企业AI架构,Kubernetes是一个优选的可供选择容器配器和自动化计算机应用程序部署,缩放,和管理。 服务网状网络的背景和起源Kubernetes和Istio分隔了流量流: 与业务相关的流量通过数
上页
下页
关闭