与所有工具兼容成为永无止境的数据流的一部分。已经能够台来部署完整的数据分析环境使我们无需离开环境即可执行几乎任何操作。现代分析架构图来源对于数据流从存储在工作区中的数据源开始。数据科学家工程师和数据分析师协同工作转换和分析数据这些数据一旦准备好就可以存储在数据仓库或数据湖中或导出到分析和商业智能平台例如。这些数据还可以应用于同一环境中。
的机器学习项目。从到开源的商业 克罗地亚电话号码列表 化汇集了和的功能。事实上最初是是年在加州大学伯克利分校创建的开源大规模数据处理引擎。多年来在取得初步成功之后不断更新版本不断改进。然而在企业级使用存在几个问题它需要一个具有大量节点的分布式存储系统来执行。例如有必要拥有其他技术例如或。绩效管理的组成部分有限且过程相当复杂。没有用于容量管理和成本优化的工具。为了解决这些困难并能够为企业。

提供高效的服务的创始人于年创立了公司。由此成为的商业版本解决了开源版本的局限性。多年后随着和的结合巩固了自己作为市场上最强大的云大数据处理平台之一的地位将引擎的速度与云环境的优势相结合。单一平台的数量多样性和速度自从大数据成为现实以来重点就放在了现在著名的大数据上容量多样性和速度任何大数据技术解决方案都必须满足的要求。在出现之前都是使用独立的工具开发的这意味着大数。