hadoop,
转载地址:http://www.cnblogs.com/ggjucheng/archive/2012/04/22/2465625.html hadoop笔记本
|
海量数据 大数据量,海量数据 处理方法总结 布隆过滤器应用 悉数那些“巨型”数据仓库 Hadoop在业界的使用情况 淘宝Hadoop集群的概况 分布式 Paxos在大型系统中常见的应用场景 |
hadoop的实现 序 HDFS的基本概念 HDFS 读写流程 HDFS namenode源码分析 HDFS datanode源码分析 HDFS dfsclient读文件过程 源码分析 HDFS dfsclient写文件过程 源码分析 MapReduce源码分析总结
mapreduce作业流程概论 How MapReduce Works
基于hadoop的crc校验谈hadoop的离线设计思想 Hadoop在MapReduce中使用压缩详解 HDFS数据的Checksum Hadoop开发常用的InputFormat和OutputFormat Hadoop之failed task和killed task Hadoop的调度器总结 管理 hadoop集群部署 hadoop部署注意项 hadoop配置文件说明 hadoop集群默认配置和常用配置 hadoop集群测量 Hadoop管理员的十个最佳实践 Hadoop 权限管理
Hadoop FS Shell Hadoop Shell 讲解 hadoop fs -count的结果含义
Hadoop添加节点datanode Hadoop删除节点 hadoop SecondaryNameNode和NameNode hadoop 根据SecondaryNameNode恢复Namenode hadoop机架感知
HDFS 安全模式 hadoop的dfs.replication Hadoop回收站trash hadoop升级
Hadoop计算能力调度器算法解析 Hadoop计算能力调度器应用和配置
hadoop和kerberos的整合总结 hadoop的dfs.umask
NFS服务对Hadoop(hdfs)集群影响测试 Facebook团队关于Hadoop/HBase在SSD上的实验和讨论 调优 架构设计 Hadoop使用场景 |
hive Hive体系架构 应用 Hadoop和Hive的数据处理流程 管理 hive部署手册 hive元数据中utf8的修改 hive并发调用的运行方式-个人经验篇
hive Cli常用操作(翻译自Hive wiki) hive数据类型(翻译自Hive Wiki)
hive 创建/删除/截断 表(翻译自Hive wiki) hive数据操作(翻译自Hive wiki+实例讲解) hive原生和复合类型的数据加载和使用 hive修改 表/分区语句
hive select操作(翻译自Hive wiki) hive GroupBy操作(翻译自Hive wiki) hive 中 Order by, Sort by ,Dristribute by,Cluster By 的作用和用法 Hive Join(翻译自Hive wiki) hive lateral view语句(翻译自Hive wiki) Hive Union(翻译自Hive wiki) Hive子查询(翻译自Hive wiki) hive实例讲解实现in和not in子句 Hive Explain(翻译自Hive wiki) Hive虚拟列(翻译自Hive wiki) hive 锁定(翻译自Hive wiki)
hive函数(Hive wiki) hive udf开发流程(Hive wiki) hive udaf开发入门和运行过程详解 hive中UDTF编写和使用 hive属性(Hive wiki)
hive中分组取前N个值的实现
hive sql遇到的问题 优化 hive大数据倾斜总结 hive join详解
hive文件存储格式
hive怎样决定reducer个数 hive的hive.exec.parallel参数说明 hive local hadoop特性 |
hbase 管理 Hbase配置手册 pig 介绍入门 Apache Pig入门 –介绍/基本架构/与Hive对比 管理 pig部署手册 教程 Apache Pig中文教程集合
|