Blog

Dimensional Modeling là gì?

Mô hình kích thước biểu diễn dữ liệu bằng phép toán khối lập phương, giúp biểu diễn dữ liệu logic phù hợp hơn với quản lý dữ liệu OLAP. Nhận thức về Mô hình hóa không gian được phát triển bởi Ralph Kimball và bao gồm các bảng “thực tế” và “kích thước”.

Trong Dimensional Modeling, bản ghi giao dịch được chia thành “dữ kiện”, thường là dữ liệu giao dịch số hoặc “thứ nguyên”, là thông tin tham chiếu cung cấp ngữ cảnh cho dữ kiện. Ví dụ: một giao dịch bán hàng có thể bị thiệt hại về các dữ kiện như số lượng sản phẩm được đặt hàng và giá thanh toán cho các sản phẩm và các thứ nguyên như ngày đặt hàng, tên người dùng, số sản phẩm, địa điểm giao hàng và nhận hóa đơn , và nhân viên bán hàng chịu trách nhiệm nhận đơn đặt hàng.

Mục tiêu của Dimensional Modeling

Các mục đích của mô hình kích thước là:

  • Để tạo ra kiến ​​trúc cơ sở dữ liệu mà khách hàng cuối dễ hiểu và viết các truy vấn.
  • Để tối đa hóa hiệu quả của các truy vấn. Nó đạt được những mục tiêu này bằng cách giảm thiểu số lượng bảng và mối quan hệ giữa chúng.

Ưu điểm của mô hình hóa chiều

Sau đây là những lợi ích của mô hình chiều là:

Mô hình hóa không gian rất đơn giản: Phương pháp mô hình hóa không gian giúp các nhà thiết kế kho hàng có thể tạo ra các lược đồ cơ sở dữ liệu mà khách hàng doanh nghiệp có thể dễ dàng nắm bắt và hiểu được. Không cần đào tạo rộng rãi về cách đọc sơ đồ và không có mối quan hệ phức tạp giữa các phần tử dữ liệu khác nhau.

Mô hình hóa không gian thúc đẩy chất lượng dữ liệu: Lược đồ hình sao cho phép quản trị viên kho thực thi kiểm tra tính toàn vẹn tham chiếu trên kho dữ liệu. Vì khóa thông tin thực tế là sự kết hợp của các yếu tố cần thiết của các thứ nguyên liên quan của nó, nên một bản ghi dữ kiện sẽ được tải tích cực nếu các bản ghi thứ nguyên tương ứng được mô tả hợp lệ và cũng tồn tại trong cơ sở dữ liệu.

Bằng cách thực thi các ràng buộc khóa ngoại như một hình thức kiểm tra tính toàn vẹn tham chiếu, các DBA trong kho dữ liệu thêm một tuyến phòng thủ chống lại dữ liệu kho bị hỏng.

Có thể tối ưu hóa hiệu suất thông qua tổng hợp: Khi kích thước của kho dữ liệu tăng lên, việc tối ưu hóa hiệu suất trở thành một mối quan tâm cấp bách. Những khách hàng phải đợi hàng giờ để nhận được phản hồi cho câu hỏi sẽ nhanh chóng chán nản với các nhà kho. Tổng hợp là một trong những phương pháp dễ dàng nhất để có thể tối ưu hóa hiệu suất truy vấn.

Nhược điểm của mô hình hóa chiều

Để duy trì tính toàn vẹn của dữ liệu và kích thước, việc tải các kho dữ liệu với hồ sơ từ các hệ thống hoạt động khác nhau là rất phức tạp.

Điều nghiêm trọng là phải sửa đổi hoạt động của kho dữ liệu nếu tổ chức áp dụng kỹ thuật thứ nguyên thay đổi phương thức kinh doanh.

Các yếu tố của Dimensional Modeling

Fact

Nó là một tập hợp các mục dữ liệu liên quan, bao gồm các số đo và dữ liệu ngữ cảnh. Nó thường đại diện cho các mặt hàng kinh doanh hoặc các giao dịch kinh doanh.

Dimensions

Nó là một tập hợp dữ liệu mô tả một khía cạnh kinh doanh. Thứ nguyên quyết định nền tảng ngữ cảnh cho các dữ kiện và chúng là khuôn khổ để OLAP được thực hiện.

Measure

Nó là một thuộc tính số của một dữ kiện, đại diện cho hiệu suất hoặc hành vi của doanh nghiệp so với các thứ nguyên.

Xem xét ngữ cảnh quan hệ, có hai mô hình cơ bản được sử dụng trong mô hình chiều:

  • Star Model
  • Snowflake Model

Star Model là cấu trúc cơ bản của mô hình chiều. Nó có một bảng trung tâm rộng (bảng thực tế) và một tập hợp các bảng nhỏ hơn (kích thước) được sắp xếp theo thiết kế xuyên tâm xung quanh bàn chính. Snowflake Model là kết luận của việc phân hủy một hoặc nhiều kích thước.

Fact Table

Fact Table được sử dụng để dữ liệu các dữ kiện hoặc các thước đo trong doanh nghiệp. Dữ liệu là các yếu tố dữ liệu số được công ty quan tâm.

Đặc điểm của bảng Sự kiện

Fact Table bao gồm các giá trị số của những gì chúng tôi đo lường. Ví dụ: giá trị thực là 20 có thể có nghĩa là 20 vật dụng đã được bán.

Mỗi Fact Table bao gồm các khóa cho các Dimension Table được liên kết. Chúng được gọi là khóa ngoại trong Fact Table.

Fact Table thường bao gồm một số lượng nhỏ các cột.

Khi nó được so sánh với Dimension Table, Fact Table có một số lượng lớn các hàng.

Dimension Table

Dimension Table thiết lập bối cảnh của các dữ kiện. Dimension Table lưu trữ các trường mô tả các dữ kiện.

Đặc điểm của Dimension Table

Dimension Table chứa thông tin chi tiết về các dữ kiện. Ví dụ, điều đó cho phép các nhà phân tích kinh doanh hiểu dữ liệu và báo cáo của họ tốt hơn.

Các Dimension Table bao gồm dữ liệu mô tả về các giá trị số trong Fact Table. Đó là, chúng chứa các thuộc tính của các dữ kiện. Ví dụ: các Dimension Table cho một chức năng phân tích tiếp thị có thể bao gồm các thuộc tính như thời gian, khu vực tiếp thị và loại sản phẩm.

Vì bản ghi trong Dimension Table không được chuẩn hóa, nó thường có một số lượng lớn các cột. Các bảng kích thước bao gồm ít hàng thông tin hơn rất nhiều so với Fact Table.

Các thuộc tính trong Dimension Table được sử dụng làm tiêu đề hàng và cột trong tài liệu hoặc hiển thị kết quả truy vấn.

Ví dụ: Một thành phố và tiểu bang có thể xem tóm tắt cửa hàng trong Fact Table. Tóm tắt mặt hàng có thể được xem theo nhãn hiệu, màu sắc,… Thông tin khách hàng có thể được xem theo tên và địa chỉ.

Trong ví dụ này, cột ID khách hàng trong Fact Table là các khóa ngoại kết hợp với Dimension Table. Bằng cách theo dõi các liên kết, chúng ta có thể thấy rằng hàng 2 của Fact Table ghi lại thực tế là khách hàng 3, Gaurav, đã mua hai mặt hàng vào ngày 8.

Hệ thống cấp bậc

Hệ thống phân cấp là một cây có hướng có các nút là các thuộc tính chiều và các cung có mô hình nhiều vòng kết hợp giữa nhóm thuộc tính các chiều. Nó chứa một thứ nguyên, được đặt ở gốc cây và tất cả các thuộc tính chiều xác định nó.

Chúng tôi chuyên cung cấp các dịch vụ về Xây dựng Kho dữ liệu Data Warehouse/ Xây dựng Báo cáo Power BI cho các doanh nghiệp lớn như: Nakagawa, Mutosi, Tinh Vân Group,….. đăng ký ngay để được Demo và tư vấn miễn phí dành riêng cho doanh nghiệp của bạn.

    Xin vui lòng điền vào form dưới đây. Chúng tôi sẽ liên hệ lại ngay cho bạn khi nhận được thông tin:


    Leave a Reply

    Your email address will not be published. Required fields are marked *