什么是SSIS ?

来源:百度文库 编辑:神马文学网 时间:2024/04/30 16:26:22

什么是SSIS ?

Microsoft SQL Server 2005 Integration Services (SSIS) 是生成高性能数据集成解决方案(包括数据仓库的提取、转换和加载 (ETL) 包)的平台。

Integration Services 包括用于生成和调试包的图形工具和向导;用于执行工作流函数(如 FTP 操作)、执行 SQL 语句或发送电子邮件的任务;用于提取和加载数据的数据源和目标;用于清理、聚合、合并和复制数据的转换;用于管理 Integration Services 的管理服务 Integration Services 服务;以及用于对 Integration Services 对象模型编程的应用程序编程接口 (API)。

SQL Server 2005 Integration Services (SSIS) 提供一系列支持业务应用程序开发的内置任务、容器、转换和数据适配器。您无需编写一行代码,就可以创建 SSIS 解决方案来使用 ETL 和商业智能解决复杂的业务问题,管理 SQL Server 数据库以及在 SQL Server 实例之间复制 SQL Server 对象。

下列情况说明了 SSIS 包的典型用途。

合并来自异类数据存储区的数据
数据通常存储在很多个不同的数据存储系统中,从所有源中提取数据并将其合并到单个一致的数据集中确实有一定的难度。这种情况的出现有多个原因。例如:

许多单位要对存储在早期数据存储系统中的信息进行归档。这些数据在日常操作中可能不重要,但对于需要收集过去很长一段时间内的数据的趋势分析来说很重要。


单位的各个部门可能会使用不同的数据存储技术来存储操作数据。包可能需要先从电子表格以及关系数据库中提取数据,然后才能合并数据。


数据可能存储在对相同数据使用不同架构的数据库中。包可能需要先更改列的数据类型或将多个列的数据组合到一列中,然后才能合并数据。


Integration Services 可以连接到各种各样的数据源,包括单个包中的多个源。包可以使用 .NET 和 OLE DB 访问接口连接到关系数据库,还可以使用 ODBC 驱动程序连接到多个早期数据库。包还可以连接到平面文件、Excel 文件和 Analysis Services 项目。

Integration Services 包含一些源组件,这些组件负责从包所连接的数据源中的平面文件、Excel 电子表格、XML 文档和关系数据库中的表及视图提取数据。

然后,通常要用 Integration Services 包含的转换功能对数据进行转换。数据转换为兼容格式后,就可以将其物理合并到一个数据集中。

数据在合并成功且应用转换后,通常会被加载到一个或多个目标。Integration Services 包含将数据加载到平面文件、原始文件和关系数据库时所用的目标。数据也可以加载到内存中的记录集中,供其他包元素访问。

填充数据仓库和数据集市
数据仓库和数据集市中的数据通常会频繁更新,因此数据加载量通常会很大。

Integration Services 包含一个可直接将数据从平面文件大容量加载到 SQL Server 表和视图中的任务,还包含一个目标组件,该组件可以在数据转换过程的最后一步将数据大容量加载到 SQL Server 数据库中。

SSIS 包可配置为可重新启动。这意味着可以从某个预先确定的检查点(包中的某个任务或容器)重新运行包。重新启动包这一功能可节省很多时间,尤其是包需要处理来自一大批源的数据时。

可以用 SSIS 包加载数据库中的维度表和事实数据表。如果维度表的源数据存储在多个数据源中,包可以将该数据合并到一个数据集中,并在单个进程中加载维度表,而不是为每个数据源使用单独的进程。

更新数据仓库和数据集市中的数据可能很复杂,因为这两种类型的数据存储区通常都包含可能难以通过数据转换过程管理的渐变维度。由于能够动态创建用于插入和更新记录、更新相关记录以及向表添加新列的 SQL 语句,因此,渐变维度向导可自动支持渐变维度。

此外,Integration Services 包中的任务和转换可以处理 Analysis Services 多维数据集和维度。包更新了建立多维数据集所基于的数据库中的表后,您可以使用 Integration Services 任务和转换来自动处理多维数据集和维度。自动处理多维数据集和维度有助于使以下两种环境中的用户始终获得最新的数据:访问多维数据集和维度中信息的用户和访问关系数据库中数据的用户。