五十种大数据分析工具和软件(2)

22-01-18 banq

28. SiSense

SiSense是一个很好的选择,很多经验丰富的商业智能 (BI) 工具用户都接受它,因为它具有如此多的综合功能。这是满足您几乎所有需求的绝佳选择。
SiSense 由几个不同的部分组成。它有一个非常直观的网络界面,还使用了 ElastiCube,这是他们用于分析数据的专有数据库。您必须下载 ElastiCube 并在本地计算机上运行它,但它非常易于使用。
 
29.Plotly

Plotly是可用的最具视觉吸引力的数据分析工具之一。它是一种基于云的数据科学和解释解决方案,允许您以可以与网络上任何地方交互的方式以图形方式修改、合成和分发您的信息。
Plotly 使用 Python 框架运行,因此它可以轻松处理分析、可视化等。它拥有大量设备来帮助您绘制统计数据以便于分析。它还可以处理科学图形库。Arduino、Python、REST、Perl、R、MATLAB 和 Julia 都与 Plotly 兼容。
 
30.ThoughtSpot

ThoughtSpot是提供下一代搜索的数据分析工具之一。该工具拥有众多引人注目的功能,尤其是在基于 AI 的推荐系统方面。此外,此功能还具有利用众包的潜力。
 
31. Trifacta
在数据争论方面,Trifacta是最受欢迎的数据分析工具之一。这些功能可以被个人、团队和组织使用。Trifacta 可以完成从清理到转换数据的所有工作。
 
32.Lumify

Lumify是一个免费的开源工具,用于大数据融合/集成、分析和可视化。
其主要功能包括全文搜索、2D 和 3D 图形可视化、自动布局、图形实体之间的链接分析、与地图系统的集成、地理空间分析、多媒体分析、通过一组项目或工作空间进行实时协作。
 
33.HPCC
HPCC 代表高性能计算集群。这是一个基于高度可扩展的超级计算平台的完整大数据解决方案。HPCC 也称为 DAS(数据分析超级计算机)。该工具由 LexisNexis Risk Solutions 开发。
 
34.Datawrapper

Datawrapper是一个用于数据可视化的开源大数据分析工具。它使用户能够轻松地生成清晰、准确和嵌入的图表。它广泛用于世界各地的新闻编辑室。
 
35.HCATALOG

HCatalog是一个开源大数据分析工具,允许专家对大规模数据集进行交互式分析。Drill 由 Apache 开发,旨在扩展 10,000 多台服务器,并在几秒钟内处理 PB 级数据和数百万条记录。它支持大量文件系统和数据库,例如 MongoDB、HDFS、Amazon S3、Google Cloud Storage 等。
 
36.弹性搜索

Elasticsearch是开源的企业搜索引擎,基于 Java 开发并在 Apache 的许可下发布。它的最佳功能之一在于支持具有超快速搜索功能的数据发现应用程序。
 
37. Azure Databricks

Azure Databricks是一个统一的大数据分析平台,通过与 Apache Spark 的集成为企业提供数据管理、机器学习和数据科学。它与大量数据源集成,从各种来源中提取数据,进行转换,然后通过可视化进行分析。除了设置 ETL 流程外,它还使企业能够创建用于预测分析、预测和未来规划的数据模型。
  
38.Apache Airflow

Airflow是一个开源 Python 框架,允许为大数据管道创作、调度和监控复杂的数据源任务。与“配置即代码”的DevOps口号相一致,它允许开发人员编排工作流并以编程方式处理执行依赖关系,例如作业重试和警报。通过使用有向无环图 (DAG),开发人员可以根据需要使用多步工作流自定义管道流程。他们可以随时运行部分工作流程,即使任务正在实时更新。
 
39.BIRT
商业智能和报告工具 ( BIRT ) 项目提供数据提取、探索和数据处理,以通过数据可视化和仪表板进行分析。它包括两个主要组件——报表设计器和运行时。借助用于设计和部署数据可视化的富文本和图形组件,它使企业能够创建企业级报告。
 
40.Domo

Domo是一个基于云的业务管理套件,可加速各种规模企业的数字化转型。它执行微观和宏观层面的分析,为团队提供对其业务指标的深入洞察,并更智能、更快地解决问题。
 
41.Apache Drill

Apache Drill一种开源大数据分析工具,允许专家对大规模数据集进行交互式分析。Drill 由 Apache 开发,旨在扩展 10,000 多台服务器,并在几秒钟内处理 PB 级数据和数百万条记录。它支持大量文件系统和数据库,例如 MongoDB、HDFS、Amazon S3、Google Cloud Storage 等。
 
42.Apache OOZIE
作为最好的工作流处理系统之一,Apache Oozie允许您定义跨多种语言编写或编程的各种作业。此外,这个大数据分析工具还将它们相互链接,方便用户提及依赖关系。
 
43.Orange

Orange是面向新手和专家的开源数据可视化和数据分析,并提供带有大型工具箱的交互式工作流来创建交互式工作流来分析和可视化数据。Orange 包含不同的可视化,从散点图、条形图、树到树状图、网络和热图。
 
44.Weka

Weka是一款开源软件,是用于数据挖掘任务的机器学习算法的集合。这些算法既可以直接应用于数据集,也可以从您自己的 JAVA 代码中调用。它也非常适合开发新的机器学习方案,因为它完全用JAVA 编程语言实现,并且支持几个标准的数据挖掘任务。
 
45.NodeXL

NodeXL是一个关系和网络的数据可视化和分析软件。NodeXL 提供精确的计算。它是一个免费(不是专业版)和开源的网络分析和可视化软件。它是用于数据分析的最佳统计工具之一,包括高级网络指标、访问社交媒体网络数据导入器和自动化。
 
46.Gephi

Gephi也是一个在 NetBeans 平台上用 Java 编写的开源网络分析和可视化软件包。想想你看到的代表linkedin 或Facebook 连接的巨大友谊地图。Gelphi 通过提供精确的计算更进一步。
 
47.Adverity

Adverity是一个灵活的端到端营销分析平台,使营销人员能够在单一视图中跟踪营销绩效,并毫不费力地实时发现新见解。
由于来自 600 多个来源的自动数据集成、强大的数据可视化和 AI 驱动的预测分析,Adverity 使营销人员能够在单一视图中跟踪营销绩效,并轻松地实时发现新见解。
 
48.Dataddo

Dataddo是一个无编码、基于云的 ETL 平台,将灵活性放在首位 - 具有广泛的连接器以及选择您自己的指标和属性的能力,Dataddo 使创建稳定的数据管道变得简单而快速。
Dataddo 无缝插入您现有的数据堆栈,因此您无需向您的架构中添加您尚未使用的元素,或更改您的基本工作流程。Dataddo 的直观界面和快速设置让您专注于集成数据,而不是浪费时间学习如何使用另一个平台。
 
49.Solver

Solver专注于提供世界一流的财务报告、预算和分析,通过按钮访问所有数据源,从而推动公司范围内的盈利能力。Solver 提供 BI360,可用于云和本地部署,专注于四个关键分析领域。
 
50.Skytree

Skytree是一款出色的数据分析工具。它允许用户和数据科学家非常快速地创建极其准确的模型。他们的预测机器学习模型非常直观,使实验和数据操作变得非常容易。
Skytree 提供了大量的强大功能。他们的算法非常可扩展。这意味着,无论您是小型企业、企业家还是大型企业,您都可以使用他们的模型,并且知道它们会扩展以适应您输入的数据的大小。
 
51.谷歌Fusion表

Google Fusion 表格是用于数据分析、大型数据集可视化和映射的出色工具。毫不奇怪,谷歌令人难以置信的地图软件在将该工具推上榜单的过程中发挥了重要作用。以这张地图为例,我制作这张地图是为了查看墨西哥湾的石油生产平台。
 
52.Infogram

Infogram提供超过 35 个交互式图表和 500 多个地图,以帮助您精美地可视化您的数据。创建各种图表,包括柱形图、条形图、饼图或词云。您甚至可以将地图添加到您的信息图或报告中,以真正打动您的听众。