Blog

Thiết kế DWH: Data Warehouse Design

Data Warehouse là một kho lưu trữ dữ liệu duy nhất, nơi một bản ghi từ nhiều nguồn dữ liệu được tích hợp để xử lý phân tích kinh doanh trực tuyến (OLAP). Điều này ngụ ý một Data Warehouse cần phải đáp ứng các yêu cầu từ tất cả các giai đoạn kinh doanh trong toàn bộ tổ chức. Do đó, Data Warehouse Design là một quá trình cực kỳ phức tạp, dài dòng và do đó dễ xảy ra lỗi. Hơn nữa, các chức năng phân tích nghiệp vụ thay đổi theo thời gian, dẫn đến các yêu cầu đối với hệ thống thay đổi. Do đó, Data Warehouse và hệ thống OLAP rất năng động và quá trình thiết kế diễn ra liên tục.

Data Warehouse Design theo một phương pháp khác với phương pháp xem vật chất hóa trong các ngành công nghiệp. Nó coi Data Warehouse là hệ thống cơ sở dữ liệu với các nhu cầu cụ thể như trả lời các truy vấn liên quan đến quản lý. Mục tiêu của thiết kế trở thành cách mà bản ghi từ nhiều nguồn dữ liệu sẽ được trích xuất, chuyển đổi và tải (ETL) để được tổ chức trong cơ sở dữ liệu dưới dạng Data Warehouse.

Có hai cách tiếp cận

  • “top-down” approach
  • “bottom-down” approach

“top-down” approach

Trong cách tiếp cận thiết kế “Từ trên xuống”, Data Warehouse được mô tả là Data Warehouse hướng chủ đề, biến thể theo thời gian, không thay đổi và tích hợp để toàn bộ dữ liệu doanh nghiệp từ các nguồn khác nhau được xác thực, định dạng lại và lưu trong một ( lên đến 3NF) cơ sở dữ liệu làm Data Warehouse. Data Warehouse lưu trữ thông tin “nguyên tử”, dữ liệu ở mức độ chi tiết thấp nhất, từ đó có thể xây dựng các Data Warehouse chiều bằng cách chọn dữ liệu cần thiết cho các đối tượng kinh doanh cụ thể hoặc các phòng ban cụ thể. Phương pháp tiếp cận là phương pháp tiếp cận theo hướng dữ liệu vì thông tin được thu thập và tích hợp trước tiên và sau đó các yêu cầu nghiệp vụ của các đối tượng để xây dựng siêu thị dữ liệu được hình thành. Ưu điểm của phương pháp này là nó hỗ trợ một nguồn dữ liệu tích hợp duy nhất. Do đó, data mart được xây dựng từ nó sẽ có tính nhất quán khi chúng chồng lên nhau.

Ưu điểm của thiết kế từ trên xuống

  • Data Marts được tải từ các Data Warehouse.
  • Việc phát triển Data Warehouse mới từ Data Warehouse rất dễ dàng.

Nhược điểm của thiết kế từ trên xuống

  • Kỹ thuật này không linh hoạt khi thay đổi nhu cầu của các bộ phận.
  • Chi phí thực hiện dự án cao.
Data Warehouse Design

“bottom-down” approach

Trong cách tiếp cận “Từ dưới lên”, Data Warehouse được mô tả là “bản sao của kiến ​​trúc dữ liệu giao dịch cụ thể cho truy vấn và phân tích”, thuật ngữ giản đồ hình sao. Theo cách tiếp cận này, một trung tâm dữ liệu được tạo ra trước tiên để đáp ứng các khả năng báo cáo và phân tích cần thiết cho các quy trình (hoặc đối tượng) kinh doanh cụ thể. Do đó, nó cần phải là một cách tiếp cận theo hướng kinh doanh trái ngược với cách tiếp cận theo hướng dữ liệu của Inmon.

Marts dữ liệu bao gồm dữ liệu hạt thấp nhất và, nếu cần, cả dữ liệu tổng hợp. Thay vì cơ sở dữ liệu chuẩn hóa cho Data Warehouse, cơ sở dữ liệu chiều không chuẩn hóa được điều chỉnh để đáp ứng các yêu cầu cung cấp dữ liệu của Data Warehouse. Sử dụng phương pháp này, để sử dụng tập hợp các ổ dữ liệu làm Data Warehouse doanh nghiệp, các ổ dữ liệu phải được xây dựng với các kích thước phù hợp, xác định rằng các đối tượng thông thường được biểu diễn giống nhau trong các ổ dữ liệu khác nhau. Các kích thước phù hợp đã kết nối các ổ dữ liệu để tạo thành một Data Warehouse, thường được gọi là Data Warehouse ảo.

Ưu điểm của phương pháp thiết kế “từ dưới lên” là có ROI nhanh chóng, vì việc phát triển data mart, Data Warehouse cho một chủ đề, tốn ít thời gian và công sức hơn nhiều so với phát triển Data Warehouse toàn doanh nghiệp. Ngoài ra, rủi ro thất bại thậm chí còn ít hơn. Phương pháp này vốn có tính chất gia tăng. Phương pháp này cho phép nhóm dự án học hỏi và phát triển.

Data Warehouse Design

Các bài viết liên quan:

Tổng quan về kho dữ liệu Data Warehouse

Dịch vụ triển khai dữ liệu Data Warehouse

Quy trình triển khai Data Warehouse từ A-Z

Mô hình hoá dữ liệu Data Warehouse Modeling

Kiến trúc kho dữ liệu: Data Warehouse Architecture

Leave a Reply

Your email address will not be published. Required fields are marked *