#数据工程

Java可以用于机器学习和数据科学吗? - kdnuggets

20-11-02 1417 2 banq

机器学习,数据科学和人工智能是近年来最受关注的技术,理所当然的。科技领域的这些进步已将自动化和业务流程提升到了一个新水平。各种规模的组织都在研究和人员上投入数百万美元,以构建这些功能强大的数据驱动应... 详细

使用Storm、Kafka和ElasticSearch处理实时数据 -javacodegeeks

20-10-23 1451 1 banq

这是使用Storm,Kafka和ElasticSearch处理实时数据的文章和 源码 批处理和流处理的区别: 批处理:批处理是要一起处理的数据的集合(请参见图1)。批处理允许您将不同的数据点... 详细

设计一个接口支持各种查询条件

03-08-19 4 1106 1 mooncui

有没有什么比较好的模式?. 详细

企业数据库的选择通常由系统架构师主导决策 - thenewstack

20-11-03 638 1 banq

忘了开发人员吧,今天的王国创造者被称为 架构 师,而且研究继续表明,如果按照架构师的偏好会采用不同的技术。 一个典型的例子是数据库。根据 Percona的“ 2020年开源数据管理软件调查”, ... 详细

Netflix如何使用bulldozer从数据仓库批处理数据转移到键值存储?

20-11-01 786 banq

Netflix拥有超过1.95亿用户,每天生成数PB的数据。数据科学家和工程师从我们的订户和视频中收集这些数据,并实施数据分析模型以发现客户行为,以最大程度地提高用户满意度。 通常,数据科学家和工程... 详细

Netflix Mantis简介 - Baeldung

20-10-24 872 banq

Mantis是一个用于构建流处理应用程序(作业)的平台。它提供了一种简便的方法来管理作业的部署和生命周期。此外,它有助于这些作业之间的资源分配,发现和通信。 因此,开发人员可以始终专注于实际的业务逻... 详细

Hadoop生态系统中各种组件介绍 - theinsaneapp

20-10-21 2680 banq

Hadoop生态系统是一套可以共同解决大数据问题的服务。四个核心组件是MapReduce,YARN,HDFS和Common。让我们详细讨论这个话题。在此之前,我们将列出大数据生态系统中使用的所有组件... 详细

Apache Spark:数据框,数据集和RDD之间的区别 - Baeldung

20-10-21 827 banq

Apache Spark 是一个快速的分布式数据处理系统。它执行内存中的数据处理,并使用内存中的缓存和优化的执行,从而实现快速性能。它为流行的编程语言(例如Scala,Python,Java和R... 详细

数字时代:什么是数据工程? -Techin3

20-10-13 1897 banq

在LinkedIn的2020年新兴工作报告和Hired的2019年软件工程师状况报告中,他们将数据工程师的职位排在了紧挨数据科学家和机器学习工程师的位置。 数字时代利用数据可以实现很多事情,从个性化... 详细

关于库存查询与领域建模

10-09-08 3 1218 cleanearth

本人正在做库存管理,在看了大量 设计模式 ,ddd,企业设计模式相关资料,并基本参考了 DDD sample后, 使用spring mvc+spring+hibernate,对库存管理系统进行... 详细

老声常谈,分页查询的实现就是不分页

05-11-11 5 1075 cats_tiger

分页查询是经常遇到的问题,几乎每个项目都会遇到,如此常见的问题,我们的数据库却没有提供现成的解决方法,例如Oracle提供Rownum字段,SQLServer提供TOP关键字,MySQL提供Limit... 详细

如何建立自己的O/R Map?

02-12-14 12 1304 lsj

banq,现在我就碰到了必须自己建立一层O/R Map的问题,我必须将关系数据库中的取得的大量数据转换成对象,我没有用EJB,那么这个O/R Map该如何去建立呢?请指点一下实现思路. 还有就是这样合... 详细

共有 267 上一页 1 ... 15 16 17 18