kettle使用文档 下载本文

Kette

目录

1、输入 ..................................................................................................................................... 2 1.1 文本输入 ..................................................................................................................... 2 1.2 表输入 ............................................................................................................................ 3 2、输出 ..................................................................................................................................... 3 2.1 文本输出 ........................................................................................................................ 3 2.2)输出表 ............................................................................................................................. 3 3、连接 ..................................................................................................................................... 5 3. 1 “Merge” ....................................................................................................................... 5 3.2 Sorted Merge ................................................................................................................... 5 3.3 合并记录 ........................................................................................................................ 7 3.4 ........................................................................................................................................ 8 4、

转换.............................................................................................................................. 10

4.1)split field to rows ........................................................................................................... 10 4.2)去掉重复记录 ............................................................................................................... 11 4.3 增加常量 ...................................................................................................................... 11 4.4

增加序列 .............................................................................................................. 12

4.5 字段选择 ...................................................................................................................... 12 4.6)拆分字段 ....................................................................................................................... 13 4.7

排序记录 .............................................................................................................. 14

4.8 换转列 .......................................................................................................................... 14 4.9)计算器 ........................................................................................................................... 15 4.10)值映射 ......................................................................................................................... 16 4.11)number range .............................................................................................................. 17 5、flow .................................................................................................................................... 19 5.1)switch/case .................................................................................................................... 19 5.2)过滤记录 ....................................................................................................................... 20

6、statistics ............................................................................................................................. 21 6.1)分组 ............................................................................................................................... 21 7、Uitlity ................................................................................................................................. 22 7.1)If field value is null......................................................................................................... 22 7.2)Null if... .......................................................................................................................... 24 8、查询 ................................................................................................................................... 25 8.1)Check if a column exists ................................................................................................ 25 8.2 File exists ....................................................................................................................... 26 8.3)Table exists .................................................................................................................... 27 8.4 数据库查询 .................................................................................................................. 28 8.5 数据库连接 .................................................................................................................. 30 8.6 流查询 .......................................................................................................................... 31 9、脚本 ................................................................................................................................... 33 9.1) Modified Java Script Value ........................................................................................... 33 9.2)执行SQL脚本............................................................................................................... 34 9.3 Regex Evaluation ........................................................................................................... 35

1、输入

1.1 文本输入:就是程序读取文本文件里边的东西, 我现在用到的是自己到处去

的文件。

给拉出来的文本起名文件卡里边

先浏览 选着自己用到的文本,点击添加,选中的文件会到“选中的文件”框里边图中的“1”

就是我选中的文件之后点击“字段卡”在下边有个“会出现你导出时候的字段名称,下边有“

” 点击它

”可以查看里边的记录

1.2 表输入

“编辑”就是选着数据库

“获得sql查询语句”就是得到数据,下边可以预览

然后会出现在

你可以对语句进行编辑 ,去掉你不要的字段,或者加条件 去掉的字段不会在导出的文件中出现,

2、输出

2.1 文本输出

“步骤名称”是给选着的文本文件的加名字的

“文件卡”中的“浏览”中是选着文本输出的地方和起名字的

“字段卡”点击这个 你会看见下边有“获取字段”这个是得到输出的字段的名称 ,默认的是全部输出

2.2)输出表

“步骤名称”kettle起名用的

“数据库连接” 是选着数据库 “编辑”是修该数据库 “目标表”是选着存入的表

“Specify datebase fileds”挑勾 它说明说上说选 没说为什么 “Datebase fileds卡”中点击“ enter filed mapping”

第一个文本框是读进来的表的字段 第二个文本框是写数据库中的字段 第三个是他们的对应关系

在这你可以选择自己要的字段 然后点add(注意数据库表的字段类型一定要一样,

要不报错 ,你也可以选择guess ,这个是根据字段的名字去猜,如果你的字段类型不一样 ,报错,出现在第三个文本框中的才是写如表的字段