Kettle 5.x使用指南,kettle5.x使用指南
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。
Kettle中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。
Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。
Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
Kettle可以在http://kettle.pentaho.org/网站下载到。
注:ETL,是英文Extract-Transform-Load 的缩写,用来描述将数据从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。
Kettle 5.x使用指南下载网址:http://download.csdn.net/detail/fan_hai_ping/8030177
本教程使用的软件版本信息如下:
1)Hadoop(1.2.1)
2)Pantaho DataIntegration(5.2.0)
3)HBase(0.94.19)。注:如果在教程的阅读或实际使用中遇到问题,欢迎一起讨论!!
请注册CSDN.NET,那里有很多学习资料可以下载。
大哥 你说这玩意 估计没几个人能知道 我用kettle已经快2年了 但是odi基本没用过
你要说区别我还能知道点 你要具体点还真具体不了 光kettle里面的东西就够研究了
百度百科就是坑货 现在 odi和kettle有几本书啊 补充下还老是审批不通过
我说下kettle的特点 你和odi对比下吧
1,kettle是纯java 对各种平台都支持
2,kettle对java开发api 在项目中集成也方便
3,提供图形化界面 拖拖拽拽搞开发 轻松
4,提供数据库已经文件2种形式的资源库 使用起来灵活
5,使用组件形式进行逻辑处理
6,支持各种数据接口:主流数据库就不说了 扁平文件,xml文件,excel文件甚至xbase的数据库文件都可以轻松读取
7,辅助功能强大:支持各种对文件的操作(移动,删除等),邮件功能,ftp,ssh2等等
8,组件包含 公式,js,java class等 语法简单轻松
在就想不起来了 上面说的都是我用过的(ftp,ssh2除外) 其中xbase当时是坑死我了 开始用ojdbc去弄死活弄不了 后来才发现可以直接读文件
然后就是与weblogic的jar包冲突 其他问题都好说
odi Oracle Data Integrator公司之所以没用他 就是感觉太麻烦 而且在项目中集成也很麻烦
存手打 求采纳 希望能帮到你