DataTheater培训手册1.2 下载本文

DataTheater培训手册

DataTheater是一款数据流分发平台,纯java编写,绿色无需安装,数据抽取高 效稳定。DataTheater中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

DataTheater 部署运行

将DataTheater文件夹拷贝到本地路径,例如D 盘根目录。

双击运行DataTheater文件夹下的DT-Start.bat文件,出现DataTheater欢迎界面:

登陆时可以选择”没有资源库”即可进入DataTHeater,此时所定义的转换和工作将只能存储在本地磁盘上,以.ktr文件和.kjb文件的方式。若使用资源库登录,则所有定义的转换和工作将会存储到资源库里。实际上,资源库就是一个数据库,比如ORACLE数据库,里面存储了Kettle定义的元素的相关元数据,简单而言,就是元数据库。如果资源库创建完毕,则资源库的相关信息将存储在文件 “reposityries.xml”中,它位于你的缺省home 目录的隐藏目录“.datatheater”中。如果是windows 系统,这个路径就是 c:\\Documents andSettings\\\\.datatheater。

1.1 新建资源库

1)新建到资源库的的数据库连接点击”新建”按钮,弹出以下对话框: \\

新建一个数据库(ORACLE为例)

点击Test按钮:

说明正确连接到数据库CRM1

点击关闭则退出创建资源库的过程,点击clear cache 则清空数据库缓存,点击Excetue 则 执行这些sql 语句,创建资源库:

我们回过头来看这些 sql 语句,我们发现它不仅创建了表,还向表中插入了相关的数据,我

们看到有几行语句是,

CREATE TABLE R_PROFILE (

ID_PROFILE BIGINT PRIMARY KEY , NAME VARCHAR(255)

, DESCRIPTION VARCHAR(255) ) ;

INSERT INTO R_PROFILE(ID_PROFILE, NAME, DESCRIPTION) VALUES (1,'Administrator','Administrator profile, manage users');

INSERT INTO R_PROFILE(ID_PROFILE, NAME, DESCRIPTION) VALUES (2,'User','Normal user, all tools');

INSERT INTO R_PROFILE(ID_PROFILE, NAME, DESCRIPTION) VALUES (3,'Read-only','Read-only users');

我们再看创建完资源库后数据库中表的情况: R_Profile 表

CREATE TABLE R_USER (

ID_USER BIGINT PRIMARY KEY , ID_PROFILE INT , LOGIN VARCHAR(255) , PASSWORD VARCHAR(255) , NAME VARCHAR(255)

, DESCRIPTION VARCHAR(255) , ENABLED CHAR(1) ) ;

INSERT INTO R_USER(ID_USER, ID_PROFILE, LOGIN, PASSWORD, NAME, DESCRIPTION, ENABLED) VALUES

(1,1,'admin','2be98afc86aa7f2e4cb79ce71da9fa6d4','Administrator','User manager','Y');

INSERT INTO R_USER(ID_USER, ID_PROFILE, LOGIN, PASSWORD, NAME, DESCRIPTION, ENABLED) VALUES (2,3,'guest','2be98afc86aa7f2e4cb79ce77cb97bcce','Guest account','Read-only guest account','Y');

我们再看创建完资源库后数据库中表的情况:

R_User 表

R_User 和R_Profile 两个表是存储登陆资源库的用户信息的,包括登陆名、密码和用户权 限,我们必须先弄清R_User 表的这些信息,因为它已经插入了信息,我们在登陆时需要用 到这些用户信息。关于用户信息即如何登陆在“资源库登陆和用户管理”中详细描述。