1.你工作过几年,你做过几个完整的项目?
答“我做过2个完整项目 现在在这个公司做外部顾问。 2.你主要负责哪一快?
答:我主要负责BW上面的FI和HR模块,对其他模块有所了解。 3.什么是DELTA机制?
答:答:delta机制分为两部分:数据源的delta机制、BW的delta机制:
数据源的delta分后勤数据源的delta机制、其他数据源的delta机制,后勤数据源的delta是通过extraction Q和delta Q、V3JOB来实现,首先通过IP whit out data打标,然后setup,通过full抽取从setup抽取数据,对于以后的增量数据,是ECC把业务数据自动push到extraction Q,然后通过V3job的方式把数据抽取到delta Q中,通过增量的ip从delta Q抽取数据实现增量;
其他数据源的delta机制,是通过时间戳打标,通过IP根据时间增量抽取数据; BW的delta机制,通过DSO的recordmodule实现 前像 冲销以前的数据,再产生一个后像,在往上上述的时候通过before inmage冲销,通过after inmage产生修改的后的数据;
Dso 往上上述一个dso时如果写的是在DTP中写的是全量更新则从dso的有效表中抽取数据,如果写的delta更新,则是通过changelog表抽取数据上述的上层的dso;
4.不同模块事务数据DELTA加载的操作过程一样吗?
答:不一样,MM有MM的DELTA機制,FI有FI的機制。 5.什么是数据源增强?
答:DATASOURSE的增强其实就是在标准DATASOURSE上面,修改结构,然后在EXTRACT数据的时候通过写ABAP命令取到自己要的数据放到DATASOURSE中。COMDE中有四个部分分别写代码:001业务数据 002 主数据属性 ;003主数据文本 ;004层次结构;
分两部分:数据源的增强;自定义需要提取的字段新建一个数据源,在BW侧再关联实现自己的需求;
6.CUBE和ODS最大的区别是?
答:最大的区别是CUBE的KEYFIGURE是累加的,但是ODS是可以OVERWRITE的,一般ODS用来放ITEM LEVEL的数据。 Cube可以对数据做压缩、聚集
Cube 是多维的星型模型,提高数据处理速度,减少冗余;dso :二维的存明细数据;dso上述需要激活、cube上述不需要激活; 7.你是怎么理解性能调优的?
答:CUBE优化包括压缩,分区,聚集和查询优化。
性能调优分两部分:query层面(数据提取出来后在query中整理展示)、DB层面(从的DB把数据提取处理啊)
DB层面:cube 的压缩使DB层面的数据尽量减少,压缩requst;压缩存在问题:压缩后不能根据request区分和删除数据;如果选择了with zero ,把数据里真的是0的数据压缩没了;
压缩可以设置到处理链中(compression of the cube)
创建压缩(rollup)时可以系统推荐创建运行时间大于某个值的查询,可以自己创建;(能在数据链中要增加roll up这个环节;在cube中执行 roll up)
聚集:设置聚集,按照用户的使用习惯把用户的查询维度设置成一个个的小的cube,这是在提取数据的时候直接从小的cube中提取数据;
Query层面的优化:想一些公式、选择、条件等放在query里处理的数据的会影响到query的速度;
分区:可以安装逻辑分区,把数据按照一定的条件分开,放在不同的cube中;创建分区步骤:选择cube(修改)--附加-数据库性能—分区:cube的数据中有日期字段,可以按照日期进行分区;
手工创建两个cube比如:3个月内的cube、3个月之前的cube,在上述是在transformation中写把当前数据放入3个月内的cube,把3个月之前的数据移入到3个月之前的cube里;
广播的方式也可提供查询速度,每天需要把用户执行的查询条件提前执行,并放到内存中,在白天用户使用报表时直接从内存中读取数据; 分区:
8.什么是清洗表?在哪里用?
答:就是自建一张表,里面有关键字段和数据字段,然后例程中会利用这张表来清洗数据 ,在转换的例程中用的比较多,用这个表的好处就是表里的内容可以随着业务变化随时
变,不用总是改程序。
9.BI CONTENTS激活后有没有自动加上INFOPACKAGE?
答:在DATASOURCE下面,先INSTALL好所有的東西之後,再手工去創建INFOPACKAGE,
INFOPACKAGE都是要自己手工去創建的。
10.你知道REAL-TIME有什么作用?
答:BW一般都是对历史数据分析用的,如果模型中需要实时的数据就要用到这种技术,但是这样系统效率很低,一般很少用到。
RDA(实时数据抽取)创建一个实时的cube,并加快delta抽取的时间,但是对于logistic数据源,V3job的抽取时间一定要和实时数据抽取一致或者短,要不实现不了实时;创建cube时选择实时:
基于功能模块就是通过写代码的方式,实时数据抽取; 11.R3目前有哪几种常见的数据提取方法?
答:LO提取:后勤数据提取,通用提取,CO-PA提取:财务里CO-PA,提取需要的字段和数据提取。
12.通用提取的数据来源有哪几种,是否可以DELTA加载?
答:TABLE/VIEW,INFOSET,FUNCTION MODULE,可以DELTA加载:。
13.LO提取的UPDATE MODE有哪几种?
答:Direct Delta:直接更新; Unserilized V3 update:无序的V3job, Queued Delta:队列增量, Serialized V3 Update。
14. RSA5, RSA 6, RSA 7各代表什么意思?
答:RSA 5:显示Delivery版本的BI CONTENT,可以激活BI CONTENT。 RSA 6:显示Active版本的BI CONTENT。 RSA 7:用来查看Delta Queque中的内容。
15. BI3.5和BI7.0加载数据步骤的区别?
答:BI3.5. 复制DATASOURSE3.x,创建Infosource, 建立DATASOURSE3.x和Infosource之间的Transfer rule,建立INFOCUBE/ods,建立Infosource和
INFOCUBE/ods之间的update rule,创建Inpackage加载数据。
BI7.0. 复制DATASOURSE,建立INFOCUBE/DSO,建立DATASOURSE和INFOCUBE/DSO之间的Transformation,针对DATASOURSE创建Infopackage,将数据加载到PSA,创建DTP,将数据从PSA加载到INFOCUBE/DSO.
16.LO抽取的步骤? 答:
一.传输DATASOURSE 二.维护提取结构
三.维护生成DATASOURSE
四.复制和激活SAP BI中的DATASOURSE
五.维护数据目标(DATASOURSE对象,INFOCUBE) 六.维护DATASOURSE和数据目标之间的转换 七.创建数据传输流程 八.激活提取结构
九.删除设置表/执行设置提取 十.选择更新方法
十一.增量初始化的infopackage 十二.必要时,计划V3集中运行 十三.增量上载的infopackage
17.数据源增强步骤?
答:一.在附加到DATASOURSE提取结构的附加结构定义要求的字段 二.写入你的功能出口以调用DATASOURSE的相关数据源 三.在BI中复制此DATASOURSE, 激活对应的DATASOURCE 四.为增强的DATASOURSE提取数据
18.什么是增量队列?(delta queue) 答:增量队列是新建或已更改数据记录的数据储存形式(上次数据请求以来出现的数据记录)。从系统收到数据请求时,会使用源系统中的更新流程或录入自动写入增量队列。
19.infopackage几种更新模式?
答:1完全更新2初始化增量流程(initial whit data,initial whitout data )3增量更新
20.什么是增量更新?
答:增量更新仅为源系统中的请求上次加载以来已创建或已更改(或已删除)的数据记录。
21.各个增量流程都支持哪些记录类型?
答:后像 空格;前像 X;反转象 R; 新象N;删除 D; ADD A。
22.平面文件的增量流程原理是怎么样的?
答:如果增量流程使用平面文件,数据不会通过增量队列传输到BI ,而是直接