Hadoop区别

Hadoop区别Hadoop是Apache软件基金会发起的一个项目,在大数据分析以及非结构化数据蔓延的背景下,Hadoop受到了前所未有的关注 

Hadoop是一种分布式数据和计算的框架

它很擅长存储大量的半结构化的数据集

数据可以随机存放,所以一个磁盘的失败并不会带来数据丢失

Hadoop也非常擅长分布式计算——快速地跨多台机器处理大型数据集合 

MapReduce是处理大量半结构化数据集合的编程模型

编程模型是一种处理并结构化特定问题的方式

例如,在一个关系数据库中,使用一种集合语言执行查询,如SQL

告诉语言想要的结果,并将它提交给系统来计算出如何产生计算

还可以用更传统的语言(C++,Java),一步步地来解决问题

这是两种不同的编程模型,MapReduce就是另外一种 

MapReduce和Hadoop是相互独立的,实际上又能相互配合工作得很好 

以上内容由大学时代综合整理自互联网,实际情况请以官方资料为准。

相关