hadoop 课程好用吗(hadoop零基础入门)

小伙伴们,大家好! 欢迎大家来到数据与智能小课堂,今天的课程内容为《Hadoop生态系统》。 本次内容将分为四个部分为大家讲解:Hadoop简介、Hadoop的特点、Hadoop1.0与2.0的区别、Hadoop生态系统的组成。 1.Hadoop简介 说到hadoop不得不提起一个人——DougCutting,他是hadoop之父、ApacheLucene的创始人。 Hadoop是Apache旗下…

小伙伴们,小伙伴们好!

热烈欢迎各位赶到数据信息与智能化小课堂,今日的教学内容为《Hadoop生态系统》。

此次內容将分成四个一部分为我们解读:Hadoop介绍、Hadoop的特性、Hadoop1.0与2.0的区别、Hadoop生态系统的构成。

1. Hadoop介绍

说到hadoop迫不得已提及一个人——Doug Cutting,他是hadoop鼻祖、Apache Lucene的创办人。

Hadoop是Apache集团旗下的开放源码的分布式存储服务平台,它可以运作在电子计算机群集以上,给予靠谱的、可拓展的分布式存储作用。Hadoop的核心内容是分布式文件系统(HDFS)和并行处理程序编程架构MapReduce。

Hadoop与三遍毕业论文紧密联系:

① 2003年,谷歌公布的分布式文件系统GFS的毕业论文,可以用以处理海量信息储存的问题。

② 2004年,谷歌公布了MapReduce的毕业论文,可以用以处理海量信息测算的问题。

③ 2006年,谷歌公布了BigTable的毕业论文,它是以GFS为最底层数据储存的分布式数据库系统软件。

年代 谷歌
2003年 谷歌分布式文件系统GFS的毕业论文
2004年 谷歌MapReduce的论文
2006年 谷歌BigTable的毕业论文

GFS、MapReduce、BigTable便是人们常常说的“三辆马车”。

Hadoop与这三篇毕业论文的相互关系是如此的:

Hadoop中的HDFS是GFS的开源系统完成;Hadoop中的MapReduce是谷歌MapReduce的开源系统完成;Hadoop中的HBase是谷歌BigTable的开源系统完成。

2. hadoop的特性

① 混合开发性:hadoop是根据java语言开发设计的,有不错的混合开发性,可以运作在Linux平台上;

② 可靠性高:hadoop中的HDFS是分布式文件系统,可以将海量信息遍布多余储存在不一样的设备连接点上,即使是某一设备团本上产生常见故障,别的的设备团本也可以正常的运作;

③ 高容错性:HDFS把把文档遍布储存在许多不一样的设备连接点上,能完成全自动储存好几个团本,因而某一连接点上的工作不成功后也可以完成全自动分配;

④ 精确性:hadoop的关键部件HDFS和MapReduce,一个负责分布式系统一个负责分布式解决,可以解决PB级其他数据信息;

⑤ 成本低与高拓展:hadoop在便宜的电子计算机群集上就可以运作,因而成本费非常低,而且可以扩大到好几千个电子计算机连接点上,进行大数据的存放和测算。

3. Hadoop1.0和2.0的区别

Hadoop1.0与2.0的较大区别便是,hadoop2.0在1.0的基本上提升了一个yarn架构。

① Hadoop1.0的构成包括:hdfs、MapReduce和其它部件。

Hdfs负责数据储存,MapReduce负责数据信息测算及其資源生产调度(在开展数据处理方法的过程中是要开展资源配置的,例如用是多少CPU、运行内存、硬盘这些)

「大数据入门」2.Hadoop生态系统

② Hadoop2.0的构成包括:hdfs、MapReduce、yarn和其它部件。

Hdfs负责数据储存,MapReduce负责数据信息测算,yarn负责資源生产调度

「大数据入门」2.Hadoop生态系统

4. Hadoop生态系统的构成

Hadoop除开有两个关键部件HDFS 和MapReduce以外,还包含yarn、hbase、hive、pig、mahout、zookeeper、sqoop、flume、Apache Ambari等作用部件。

「大数据入门」2.Hadoop生态系统

① HDFS:hadoop分布式文件系统,可以运作在中大型的便宜电子计算机群集上,并且以流的方法载入和解决大量文档。HDFS要熟练掌握的基本概念有NameNode、DataNode和Secondary Namenode,后边会出现专业章节目录为我们解读。

② Yarn:資源生产调度和监管架构,在其中包括ResourceManager、ApplicationMaster和NodeManager。ResourceManager负责资源优化配置,ApplicationMaster负责线程同步和监控器,NodeManager 负责执行任务。

③ MapReduce:分布式系统并行处理程序编程架构,核心内容是“分而治之”。MapReduce=Map Reduce。Map函数公式负责分块的工作中,reduce函数负责融合归约。

④ HBase:是谷歌bigtable的开源系统完成。它区别于传统式关系型数据库的一点是:根据列式储存。传统式数据库查询是根据行的储存,而HBase是根据列的储存,具备高效率稳定的解决关系型数据库的工作能力。

⑤ Hive:是根据hadoop的数据库管理专用工具,能对数据开展简易解决,它有着相近SQL語言的数据库架构hive-sql。

⑥ Pig:是一种数据流分析语言表达,给予了相近sql的语言表达pig latin,可以用于查看半非结构化数据集。

⑦ Mahout:是Apache的一个开源软件,给予一些归类、聚类分析、过虑这些人工神经网络行业经典算法。

⑧ Zookeeper:是个高效率的靠谱的分布式系统协调工作系统软件。

⑨ Sqoop:sql-to-hadoop的简称,含意便是在关系型数据库与hadoop中间做数据传输。

⑩ Flume:大量日志搜集、汇聚、传送系统软件。它也可以对数据资料开展简洁的解决。

⑪ Apache Ambari:是一种适用Apache Hadoop群集的安裝、布署、配备和管控的专用工具。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

(0)
上一篇 2022年5月11日 上午10:59
下一篇 2022年5月11日 上午11:00

相关推荐

  • 一般纳税人是什么意思,一分钟带你了解纳税人的定义

    一般纳税人是指年应征增值税销售额(包括一个公历年度内的全部应税销售额)超过财政部规定的小规模纳税人标准的企业和企业性单位,其特点是增值税进项税额可以抵扣销项税额。什么样的纳税人叫做一般纳税人?成为一般纳税人又有哪些好处呢?接下来就跟誉商小编一起来看一看吧。 其实我们现在所说的一般纳税人和小规模纳税人这两个说法其实是营改增之后的产物,以前的营业税是没有这个区分的。现在想要认定为一般纳税人,一般需要企…

    2022年9月26日
    500
  • 怎么获得root权限,两个方法教你快速获得手机权限

    什么是root权限 root权限是系统权限的一种,它高于管理者权限。就好比人体的中枢神经系统,(比喻不恰当还望指正)拥有root权限可以对系统中的任何文件(包括系统文件)进行访问和修改。 如何获取root权限(小白教程略显啰嗦——勿喷) 一、操作准备 1、首先要刷入三方recvoery——参照前文 2、准备好需要刷入的文件——superSU2.16 手机打开usb调试插电脑,插电脑,安装驱动。打开…

    2022年9月24日
    540
  • 如何找回qq好友,找回已删qq好友方法

    如果我们误删了QQ中的好友,或者删除之后,又想把他加回来,这个时候就可以通过QQ好友找回功能进行恢复了。具体操作步骤请看以下内容: 软件版本:软件大小:软件授权:适用平台:http://dl.pconline.com.cn/download/359460.html 具体恢复方法步骤如下所示: 1.因为我的QQ目前没有被误删的好友,所以现在只能牺牲一下,从我的好友中删掉一个,然后演示给大家看。这一步…

    2022年7月6日
    530
  • 云服务器是什么,一文带你快速了解其作用

    近十年来,云计算概念大肆崛起,而作为一个新兴概念很多专业概念还不为人熟知,比如云服务器ecs就是其中一个。云服务器ecs作为一个专有名词频繁出现在搜索榜单中。那么今天笔者就与大家聊一聊这看似高深莫测的云服务器ecs究竟是什么鬼? 为了更好地了解云服务器ecs,我们可以想一下平时这个专业名词的应用场景。仔细回想,你会发现,似乎和云服务器没什么太大的差别。的确如此。 云服务器ecs的概念与作用 云服务…

    2022年10月5日
    510
  • 适合中学生的手机有哪些,适合学生的十款手机品牌

    初中可以说是孩子们心智发育的一个重要阶段,不仅要从学校的课本知识中获取对世界的认知,还需要互联网来开拓自己的眼界。智能手机可以说是最佳工具之一,小巧便携、海量功能,并且现在的智能手机在基本功能上已经高度完善,成为全能的移动终端。在这里不要纠结“该不该给上初中的孩子买手机”的问题,买了手机总是利大于弊,今天迪信通就给大家推荐几款最适合初中生的手机,在“618”大促期间还会有各种精彩优惠等你来! 华为…

    2022年7月29日
    620
  • 旅行社营销新模式是什么,旅行社营销成功案例分享

    随着国民经济的迅速发展、人民生活水平的不断提高, 旅游市场日益繁荣,假日游、特色游、农家游等各种旅游产品层出不穷, 旅游市场具有很大的市场空间! 生活水平的提高、消费观念的转变、对健康的追求, 使得人们已经不再满足于现在的生活方式。而旅游业的发展使旅游这一概念深入人心, 人们很想走出去,工作之余出去看一看,走一走。 这就使得旅游业蕴涵着巨大的市场潜力和发展空间。 下面是某旅行社市场企划商业策划方案…

    2022年5月20日
    690
  • 怎样设计logo软件,在线制作logo图标教程

    LOGO设计其实特别考验设计师的功力,它需要设计师具备一定的理论知识与实践,同时还要有很强的观察力和表现力。下面就给大家介绍一些我们在进行logo设计是有哪些种类技巧? 1.纯中文LOGO 以纯中文为品牌LOGO的企业比较多,它最大的特点是直观、简单粗暴,识别度高。纯中文LOGO设计其实就是一种字体设计,它常用的技法是在现有的字体基础上去做变形与创意 2.正负形LOGO 正负形LOGO在设计中算是…

    2022年8月28日
    580
  • sql文件怎么导入数据库,sql导入外部数据库方法

    数据库的导入与导出 2018年07月13日02:24:48 阅读数:6 1、首先linux下查看mysql相关目录 whereismysql mysql: /usr/bin/mysql—-mysql的运行路径 /etc/mysql /usr/lib/mysql—–mysql的安装路径 /usr/bin/X11/mysql /usr/share/mysql /usr/share/man/m…

    2022年9月4日
    600
  • 网站推广的方式和方法,教你如何免费推广一个网站

    网站已经成为每个企业必不可少的宣传渠道,所以网站建设是很多企业必然会做的事,但网站建好容易,推广起来就有难度了。那么,在南宁网站建设中,网站推广都有哪些方式呢? 第一,要重视网站营销工作,把网站的SEO优化提到重要工作中来。用户其实在查找资料时,如果不是事先知道企业网站,都会先在搜索引擎中搜索。不同搜索引擎有不同的算法和规则,只有权重比较高的网站才有可能出现在搜索结果中,进一步被用户关注到。想要权…

    2022年6月26日
    560
  • 第五人格人格加点工具,第五人格所有天赋介绍

    第五人格屠夫天赋加点攻略分享,屠夫在游戏中想要玩好还是有一定难度的,合理加点也是其中的一方面。那么娃娃怪/小丑/杰克/鹿头怎么加点?不少玩家还不清楚加点方案了,那下面就来和小编一起看下加点攻略吧。 娃娃怪: 小丑(也可以适用于鹿头): 鹿头: 杰克: 加点就给大家介绍到这里,现在要跟大家讲讲这个版本的监管者技巧了,鉴于现在已经是公测了,各大平台各个车队都开始在排位祸害我们可怜的监管者了,这个版本我…

    2022年8月24日
    490

发表回复

登录后才能评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信