Giới thiệu SSIS

Discussion in 'Tableau' started by tableau, Aug 2, 2017.

  1. tableau

    tableau Well-Known Member

    SSIS là viết tắt của SQL Server Integration Services, một trong các thành phần chính của Microsoft SQL Server Enterpise Edition.

    Tiền thân của SSIS là DTS (Data Trasformation Services). SSIS được tung ra trong phiên bản SQL Server 2005.

    [​IMG]
    Các tính năng chính của SSIS:

    • ETL (Extract, Transform, Loading) data
    • Kết hợp, chuẩn hóa, phân chia và phân tích dữ liệu.
    • Chuyển hóa các kiểu dữ liệu khác nhau (Ví dụ: chuyển từ excel sang SQL Server)
    • Thực hiện bảo trì dữ liệu và các nghiệp vụ về database: Backup, rebuild indexes,…
    • Chuyển các đối tượng SQL Server
    • Hỗ trợ workflow
    • Thực hiện Analysis services và các truy vấn về Data-Mining
    • Dùng như là một datasource cho các báo cáo của Reporting Services
    • Thực hiện FTP
    • Có thể tạo các thành phần theo ý của lập trình viên
    • Sử dụng các ScriptTask để viết các mã lệnh bằng C# trong VSTA
    • Gửi mail
    • Truy cập Web Services qua cổng HTTP
    • Xử lý các file: xóa, sửa, …
    Kiến trúc của SSIS

    [​IMG]

    SSIS có 2 thành phần chính

    1. Data Transformation Run-time engine (màu vàng): Quản lý các control flow và package
    DataFlow engine:

    1. Data Sources
    2. Transformations
    3. Destinations.
    [​IMG]



    Giới thiệu package

    Package giống như một ứng dụng trong Winform application. SSIS sẽ chạy các nhiệm vụ từ file package này.

    Khi tạo ra 1 solution bằng BIDS (Business Intelligent Development Studio). Sinh ra 1 pakage (giống như 1 project mặc định trong Winform application) có đuôi là dtsx (package1.dtsx).

    1. Một package sẽ gồm:
    • Control Flow: gồm các task và container
    • Precedence constrains
    • DataFlow
    [​IMG]

    Giới thiệu về DataFlow

    DataFlow là một task chính trong các task của control flow, Nhiệm vụ chính của DataFlow là transform dữ liệu (chức năng chính của DTS trong SQL Server 200).

    Trong 1 DataFlow có các thành phần chính sau:

    • DataFlow sources: nguồn cung cấp dữ liệu để transform, dùng Connection Manager để kết nối dữ liệu, dữ liệu có thể là SQL, Oracle, CSV,…
    • Transformations: thao tác với nguồn dữ liệu như
      • Pivot, Unpivot dữ liệu
      • Merge, Sort, Aggregate dữ liệu
    • DataFlow destinations: Nơi cất giữ dữ liệu, dùng Connection Manager để kết nối với dữ liệu
      [​IMG]
     

    Attached Files:

  2. Loading...


Share This Page