【干货】图解HDFS工作机制,面试必不可少的技能之一!

3894
3

牛掰BI 初学数据Lv2

发表于2018-5-16 09:27

楼主
本帖最后由 小亿 于 2018-5-16 10:35 编辑

1、hdfs的核心工作原理
namenode元数据管理要点

1、什么是元数据?

hdfs的目录结构及每一个文件的块信息(块的id,块的副本数量,块的存放位置<datanode>)

2、元数据由谁负责管理?

namenode!

3、namenode把元数据记录在哪里?

namenode的实时的完整的元数据存储在内存中;

namenode还会在磁盘中(dfs.namenode.name.dir)存储内存元数据在某个时间点上的镜像文件;

namenode会把引起元数据变化的客户端操作记录在edits日志文件中;



secondarynamenode会定期从namenode上下载fsimage镜像和新生成的edits日志,然后加载fsimage镜像到内存中,然后顺序解析edits文件,对内存中的元数据对象进行修改(整合)

整合完成后,将内存元数据序列化成一个新的fsimage,并将这个fsimage镜像文件上传给namenode

上述过程叫做:checkpoint操作

提示:secondary namenode每次做checkpoint操作时,都需要从namenode上下载上次的fsimage镜像文件吗?

第一次checkpoint需要下载,以后就不用下载了,因为自己的机器上就已经有了。


下面是图解HDFS工作机制流程

1.客户端写数据到HDFS的流程


2.客户端从HDFS中读数据的流程


3.namenode元数据管理机制



  未完待续...(请持续关注)
本文来源:CSDN


最近看过此主题的会员

pcoye

3AFG0SKPTRUW

fetion98

liqing720

admin

暮然回首脖子疼

人帅被人欺

wangrr

小亿

挨踢妹

3个回答

只看楼主

wangrr 初学数据Lv2

发表于2018-5-18 09:01

只看该作者

取消 关注该作者的回复

沙发

这这 宝宝要哭了

人帅被人欺 初学数据Lv2

发表于2018-5-18 09:03

只看该作者

取消 关注该作者的回复

板凳

厉害了我的哥

暮然回首脖子疼 初学数据Lv2

发表于2018-5-18 09:09

只看该作者

取消 关注该作者的回复

地板

看不懂 不开心

登录后可回答问题,请登录注册

快速回复 返回顶部 返回列表

小时

全天响应

分钟

快速处理问题

工程师强势助力

明星产品
解决方案
联系合作

400咨询:400-0011-866

技术支持QQ:400-0011-866(工作日9:00-18:00)

产品建议邮箱yixin@esensoft.com

关注我们

扫TA学习更多干货

一对一专家交流

版权所有© 2006-2024 北京亿信华辰软件有限责任公司 京ICP备07017321号 京公网安备11010802016281号