Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架()对吗

发布时间:2019-08-08 12:40:38

Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架( )对吗

推荐回答

这句话是对的。

Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。最初由雅虎的Doug Cutting创建,Hadoop的灵感来自于 MapReduce ,MapReduce是谷歌在2000年代初期开发的用于网页索引的用户定义函数。它被设计用来处理分布在多个并行节点的PB级和EB级数据。   

Hadoop集群运行在廉价的商用硬件上,这样硬件扩展就不存在资金压力。Hadoop现在是Apache软件联盟(The Apache Software Foundation)的一个项目,数百名贡献者不断改进其核心技术。基本概念:与将海量数据限定在一台机器运行的方式不同,Hadoop将大数据分成多个部分,这样每个部分都可以被同时处理和分析。 

以上问题属网友观点,不代表本站立场,仅供参考!