PowerCenter的工作流程

来源:百度文库 编辑:神马文学网 时间:2024/04/27 13:20:17
PowerCenter基本工作原理
 Informatica是基于元数据驱动的,所有的元数据都保存在Repository(知识库)中,该知识库可以创建在所有主流数据库当中,充分体现了它元数据的开放性。
? Repository Server用来管理所有客户端以及Informatica Server跟Repository的交互, 并且一个Repository Server可以管理多个Repository,而Repository Server可为每个Repository分配一个Repository Agent来处理所对有元数据操作的响应。
? Informatica Server是实际处理ETL任务的后台服务,它是基于内存运行、高效的ETL服务,不需要产生任何的代码,每次执行任务之前都会从Repository中读取最新的ETL规则。
? Informatica的客户端提供了无编码、完全图形化的设计和管理调度界面,可实现快速开发和部署。
? 一个基本的ETL任务设计和部署的大致步骤如下:
A) 使用Designer客户端,获取源数据表的元数据。
B) 使用Designer客户端,获取目标数据表的元数据。
C) 使用Designer客户端,设计一个Mapping,其中就是源->目标的ETL规则。
D) 使用Workflow Manager客户端,针对上面实现的Mapping,实例化为一个Session,为其指定实际的数据源、目标连接,以及其他属性。
E) 使用Workflow Manager客户端,创建一个Workflow,其中包含上述的Session以及其他的Task,在Workflow中可实现复杂的流程控制。
F) 运行上述Workflow,使用Workflow Monitor客户端,监测最终的任务运行结果。