欢迎投稿

今日深度:

hadooop-HDFS,镜像:

hadooop-HDFS,镜像:


文章目录

  • 一、
    • 单机处理大数据
    • 分布式处理
    • HDFS 模型架构
    • 持久化原理
    • 副本放置策略


一、

单机处理大数据

单机运行瓶颈在IO
查找重复行:hashCode
全排序:外排序,内排序

分布式处理

HDFS 模型架构



持久化原理

基于内存存储,都需持久化

数据持久化
日志文件:日志大,加载慢。
镜像:时间间隔,恢复速度快,文件缺失

HDFS:EditsLog:日志。FsImage:镜像,快照。最近时点的FsImage+增量的EditLog


非HA下,流程SNN

副本放置策略


NameNode触发副本放置策略


www.htsjk.Com true http://www.htsjk.com/Hadoop/44207.html NewsArticle hadooop-HDFS,镜像 文章目录 一、 单机处理大数据 分布式处理 HDFS 模型架构 持久化原理 副本放置策略 一、 单机处理大数据 单机运行瓶颈在IO 查找重复行hashCode 全排序外排序内排序 分布...
评论暂时关闭