您好,今天光辉来为大家解答以上的问题。hadoop原理剖析,hadoop原理相信很多小伙伴还不知道,现在让我们一起来看看吧!

1、hadoop原理:其最底部是 Hadoop Distributed File System(HDFS),它存储 Hadoop 集群中所有存储节点上的文件。


(资料图片仅供参考)

2、HDFS的上一层是MapReduce 引擎,该引擎由 JobTrackers 和 TaskTrackers 组成。

3、通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。

4、Hadoop这个名字不是一个缩写,而是一个虚构的名字。

5、该项目的创建者,Doug Cutting解释Hadoop的得名 :“这个名字是我孩子给一个棕黄色的大象玩具命名的。

6、我的命名标准就是简短,容易发音和拼写,没有太多的意义,并且不会被用于别处。

7、小孩子恰恰是这方面的高手扩展资料Hadoop是一个能够让用户轻松架构和使用的分布式计算平台。

8、用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。

9、它主要有以下几个优点:1.高可靠性。

10、Hadoop按位存储和处理数据的能力值得人们信赖 。

11、2.高扩展性。

12、Hadoop是在可用的计算机集簇间分配数据并完成计算任务的,这些集簇可以方便地扩展到数以千计的节点中 。

13、3.高效性。

14、Hadoop能够在节点之间动态地移动数据,并保证各个节点的动态平衡,因此处理速度非常快 。

15、4.高容错性。

16、Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配[4]。

17、5.低成本。

18、与一体机、商用数据仓库以及QlikView、Yonghong Z-Suite等数据集市相比,hadoop是开源的,项目的软件成本因此会大大降低 。

19、参考资料来源:百度百科-Hadoo。

本文就为大家分享到这里,希望小伙伴们会喜欢。

标签: 分布式计算 这个名字 数据仓库