#大数据

      更多分类

Kafka Streams+SpringBoot之探索:统计计数 - mydeveloperplanet

19-10-17 6 banq

本示例接上一个 案例 ,其中有发送消息的案例,这里只是消费者举例,我们将从Tweets my-kafka-streams-topic中读取流,创建一个以#标签为值的新中间流,将其转换存都KTable... 详细

Hazelcast IMDG和Spark 2实现大数据项目 — tomask79

19-10-15 20 banq

将HBase中的数据放入Hazelcast IMDG,从Spark以RDD方式访问,这是一个非常广泛使用的解决方案。 先决条件 Spring Boot演示应用程序(入门版1.5.9),其数据存... 详细

Kafka如何实现实时流处理 Part 1 - André Melo

19-07-29 62 banq

Apache Kafka可能主要被称为消息传递中间件,其结构比队列更灵活,但它也使团队能够更低地进入实时数据管道。 使用Kafka的所谓流应用程序具有可扩展性,容错性,并且显示强大的排序和交付保证,... 详细

在数据可访问方面避免人为愚蠢 ·Mapflat

19-07-16 44 banq

该文以宜家王者很多人为的愚蠢的设计体验为例子,说明数据对产品经理的重要(数据用于领域建模),让大部分相关人员可访问才有创新: 在购物的几乎所有互动中,宜家都可以使用数据来改善我的体验并降低购买摩擦。... 详细

13种数据类型 - forbes

19-07-16 49 banq

这十三种数据类型其实就是不同业务领域中的数据: 1 . 大数据 大数据被定义为:大量的数据实际上不适合标准(关系)数据库进行分析和处理,大数据是由人和机器生成的大量信息引起的过程。 虽然'大数据'的... 详细

使用无服务器实现文件处理的批处理 - DZone Cloud

19-06-23 19 banq

按计划的时间间隔处理批量文件是当今企业应用程序系统中最常用的自动化任务之一。这种类型的批处理文件处理可用于各种用例,例如创建备份,分析日志,执行计算等。 在本文中,我们将构建一个满足以下要求的批处... 详细

经历12个机器学习初创公司的经验分享 - Daniel Shenfeld

19-06-15 47 banq

我和12家初创公司合作过。它们涵盖了从金融科技和医疗保健到ed-tech和biotech的垂直行业,从种子前到收购后,我的角色也各不相同,从深入到杂草的一号员工到数据科学和战略顾问的负责人。在所有这... 详细

下一代企业数据平台架构 - martinfowler.com

19-05-15 498 1 banq

下一代企业数据平台是使用分布式数据网格包含无处不在的数据!是分布式领域驱动架构,自助平台设计和产品思维与数据的融合。 面向领域的数据分解和所有权​​​​​​​ Eric Evans的书“  ... 详细

什么是人工智能AI偏差 - Benedict Evans

19-04-24 140 1 banq

机器学习是当今技术最重要的基本趋势之一,也是未来十年科技将在更广阔的世界中改变事物的主要方式之一。作为其中的一部分,机器学习的各个方面引起关注 - 例如,它对就业的潜在影响,以及它用于我们可能认为不... 详细

优步Uber向Apache软件基金会提交了一个开源大数据库Hudi

19-04-23 144 banq

Hudi目前管理着超过4,000个表,在Uber存储了数PB的数据,同时将Apache Hadoop仓库访问延迟从几小时降低到30分钟以下。Hudi还以比公司以前使用的解决方案更低的成本和更高的效率... 详细

从数据库读取许多实体,JAVA 8流或反应流哪个有更好的性能?

19-03-24 134 banq

吞吐量性能取决于底层实现。在返回Stream之前将所有行收集到List的查询可能比从ResultSet中按元素读取要慢。 Reactive目前会有更多开销,因此较小的结果会产生更高的总查询持续时间。... 详细

Spring Cloud Stream对Kafka Streams的深度支持

19-03-13 600 banq

在编写流处理应用程序时,Spring Cloud Stream提供了另一个 专门用于Kafka Streams的绑定器 。与常规Kafka绑定器一样,Kafka Streams绑定器也专注于开发人员... 详细

与Google Spanner跨越数据库世界的对话 - nextplatform

19-01-17 71 banq

随着时间的推移变得越来越复杂和越来越苛刻。 Google的Spanner是有史以来最复杂,最灵活,最具扩展性的数据库之一 ,它催生了一个名为CockroachDB的克隆产品,后者也在企业中引起关注,... 详细

Apache Spark编程教程

19-01-12 304 banq

Apache Spark是一个分布式计算平台,在当今非常流行,特别是因为与Hadoop mapreduce相比性能要好得多,Spark比基于磁盘的hadoop mapreduce 快了近100倍。让... 详细

Hazelcast JET在Spring Boot上运行

19-01-10 185 banq

Hazelcast JET目前是分布式计算框架领域的新成员。根据Hazelcast团队的说法,他们甚至比 Apache Spark 和 Apache Flink 更快。查看 . 详细

共有 841 2 3 4 ... 6 下一页