#大数据

      更多分类

与Google Spanner跨越数据库世界的对话 - nextplatform

19-01-17 16 banq

随着时间的推移变得越来越复杂和越来越苛刻。 Google的Spanner是有史以来最复杂,最灵活,最具扩展性的数据库之一 ,它催生了一个名为CockroachDB的克隆产品,后者也在企业中引起关注,... 详细

Apache Spark编程教程

19-01-12 21 banq

Apache Spark是一个分布式计算平台,在当今非常流行,特别是因为与Hadoop mapreduce相比性能要好得多,Spark比基于磁盘的hadoop mapreduce 快了近100倍。让... 详细

Hazelcast JET在Spring Boot上运行

19-01-10 18 banq

Hazelcast JET目前是分布式计算框架领域的新成员。根据Hazelcast团队的说法,他们甚至比 Apache Spark 和 Apache Flink 更快。查看 . 详细

Apache Spark 2一些使用案例

19-01-08 10 banq

1. registerTempTable 与createOrReplaceTempView 以下面数据JSON为案例people.json: {      "name" . 详细

用断路器驯服数据质量

18-12-17 25 banq

在微服务架构中使用断路器模式,在出现数据质量问题时,断路器会打开,防止低质量数据传播到下游进程。结果是报告中的低质量数据将在某个时间段内丢失,但如果存在,则保证肯定是正确的。本文描述了实施和部署断路... 详细

Trivagoj为何从Hive/SQL迁移到PySpark/Python?

18-12-17 21 banq

Trivago是一个以拍卖为基础的市场。广告商可以通过拍卖购买指定酒店的查询结果页面中的重要位置,trivago的拍卖机制将几个因素:价格、点击率和出价本身,以确定拍卖获胜者。当您访问trivago... 详细

什么是数据流?

18-12-12 36 banq

数据流是一种数据分发技术,数据生成器将数据记录写入有序数据流,数据使用者可以从该数据流以相同的顺序读取数据。这是一个简单的数据流图,说明了数据生成器,数据流和数据使用者: 数据流有很多种变化 ... 详细

优步是如何实现打车行程的会话状态机?

18-12-06 182 1 banq

优步如何实时根据打车者的要求有效匹配到对应司机?这项挑战算法归为如何收集,存储和逻辑排列数据的问题。 通过预测打车者的需求,能够确保他只要很短的等待时间就能打到车,同时通过考虑流量和其他因素使司机... 详细

AutoML如何让业务分析师BA掌握AI的力量?

18-12-05 9 banq

将人工智能和机器学习融入业务应用程序并非易事。特别是,当涉及到处理关键任务型的企业应用时,将ML与现有应用程序集成成为一项具有挑战性的工作。 从组织决定将机器学习纳入完全训练模型的实际部署开始,有多... 详细

自动机器学习和AI初学者指南

18-12-04 18 banq

AI供应商总是试图说服公司购买他们的机器学习平台和工具,原因之一是声称它的产品是自动化的。这是一个关键的卖点,因为大多数公司都敏锐地意识到他们无法雇用足够的数据科学家(甚至他们已经设法聘请任何数据科... 详细

使用Elasticsearch作为主数据存储

18-12-01 70 banq

荷兰和比利时最大的电子商务公司 bol.com开始了为期4年的重新思考和重建其整个ETL(提取,转换,加载) 管道的过程,该管道一直在阴暗的甲骨文 Oracle PL / SQL黑客的地牢中呼吸,处... 详细

如何从MySQL中将变化的事件数据发布到Kafka?

18-11-26 87 banq

如何使用Debezium向Kafka提交MySQL的更改数据事件?  CDC(变更数据捕获) 是将OLTP数据库系统与其他系统(如数据仓库,缓存,Spark或Hadoop)互连的最佳方式之一。 ... 详细

在Java Stream实现大量数据查询

18-11-18 187 1 banq

Spring JdbcTemplate从1.0版开始就一直在使用这个类,并且它的发展很好,但我希望在版本5中它会包含一些流式处理功能,用于查询很大数据结果,可惜没有发生。 尽管如此,有时我需要执行返... 详细

Presto如何带来最好的大数据分析师

18-11-14 26 banq

如果您的职位类似于Data Analyst,VP Analytics,分析主管等,您就知道您的角色在公司中的重要性。 你开始工作时,会面临无数的报告。管理层会议正在召开,客户的数据由您的组织管理,他... 详细

使用Spring Cloud Data Flow实现批量数据处理ETL

18-11-08 442 1 banq

文件摄取是一种ETL应用程序,它逐行读取文件,验证每个行条目,并经常执行某种类型的数据转换。生成的条目放在数据存储中,这些转换后的数据可以被其他应用程序使用。这种类型的处理经常出现在B2B集成领域,... 详细

共有 721 2 3 4 ... 5 下一页