hadoop,
http://www.infoq.com/cn/articles/hadoop-intro分布式计算开源框架Hadoop介绍 这篇文章说明hadoop是分布式计算和分布式存储的结合(含类似mapreduce和hdfs)
分布式文件系统很多,包括GFS,HDFS,淘宝开源的TFS,Tencent用于相册存储的TFS (Tencent FS,为了便于区别,后续称为QFS),以及Facebook Haystack。其中,TFS,QFS以及Haystack需要解决的问题以及架构都很类似,这三个文件系统称为Blob FS (Blob File System)。http://www.nosqlnotes.net/archives/119这个博主专注于分布式存储和计算机技术
OceanBase分布式系统负载均衡案例分享
http://blog.sina.com.cn/kern0612OceanBase 0.3.1在Github开源了 (2013-03-05 19:49)
分布式计算开源框架Hadoop入门实践(一)
http://www.infoq.com/cn/articles/hadoop-intro
分布式计算开源框架Hadoop入门实践(二)http://www.infoq.com/cn/articles/hadoop-config-tip;jsessionid=49025240E37D46598D089690E341C323
分布式计算开源框架Hadoop入门实践(三)http://www.infoq.com/cn/articles/hadoop-process-develop
作者介绍:岑文初,就职于阿里软件公司研发中心平台一部,任架构师。当前主要工作涉及阿里软件开发平台服务框架(ASF)设计与实现,服务集成平台(SIP)设计与实现。没有什么擅长或者精通,工作到现在唯一提升的就是学习能力和速度。个人Blog为:http://blog.csdn.net/cenwenchu79。
随想
“云计算”热的烫手,就和SAAS、Web2及SNS等一样,往往都是在搞概念,只有真正踏踏实实的大型互联网公司,才会投入人力物力去研究符合自己的分布式计算。其实当你的数据量没有那么大的时候,这种分布式计算也就仅仅只是一个玩具而已,只有在真正解决问题的过程中,它深层次的问题才会被挖掘出来。
这三篇文章(分布式计算开源框架Hadoop介绍,Hadoop中的集群配置和使用技巧)仅仅是为了给对分布式计算有兴趣的朋友抛个砖,要想真的掘到金子,那么就踏踏实实的去用、去想、去分析。或者自己也会更进一步地去研究框架中的实现机制,在解决自己问题的同时,也能够贡献一些什么。
前几日看到有人跪求成为架构师的方式,看了有些可悲,有些可笑,其实有多少架构师知道什么叫做架构?架构师的职责是什么?与其追求这么一个名号,还不如踏踏实实地做块石头沉到水底。要知道,积累和沉淀的过程就是一种成长。
在前面的章节里,提到过分布式系统通常都采用key/value的形式存储数据。比如爬虫抓取页面后,页面的存储就是采用key/value形式。针对这一特点,Google在GFS文件系统的基础上,设计了一种名为BigTable的key/value型分布式数据库系统。应用程序通常都不会直接操作GFS文件系统,而直接操作它的上一级存储结构--BigTable