Blog

Snowflake Schema là gì?

Snowflake Schema hay lược đồ bông tuyết là mô hình dữ liệu đa chiều, là phần mở rộng của lược đồ hình sao. “Một lược đồ được gọi là Snowflake Schema nếu một hoặc nhiều bảng dimension không kết nối trực tiếp với bảng dữ kiện mà phải kết nối thông qua các bảng dimension khác”. Lược đồ bông tuyết thường được sử dụng cho hoạt động kinh doanh thông minh và báo cáo trong kho dữ liệu OLAP, trung tâm dữ liệu và cơ sở dữ liệu quan hệ.

Trong lược đồ bông tuyết, các kỹ sư chia các bảng thứ nguyên riêng lẻ thành các thứ nguyên phụ hợp lý. Điều này làm cho mô hình dữ liệu phức tạp hơn nhưng các nhà phân tích có thể làm việc dễ dàng hơn, đặc biệt đối với một số loại dữ liệu nhất định.

Nó được gọi là lược đồ bông tuyết vì sơ đồ mối quan hệ thực thể (ERD) của nó trông giống như một bông tuyết, như được thấy bên dưới.

Snowflake Schema
Lược đồ bông tuyết là gì

Sơ đồ sau đây cho thấy một giản đồ Snowflake Schema có hai chiều, mỗi chiều có ba mức. Nó có thể có bất kỳ số dimension nào và mỗi dimension có số cấp độ bất kỳ.

Ví dụ về Snowflake Schema

Hình cho thấy một Snowflake Schema với bảng dữ kiện Bán hàng, với các bảng dimension Cửa hàng, Vị trí, Thời gian, Sản phẩm, Dòng và Gia đình. dimension Thị trường có hai bảng dimension với Cửa hàng là bảng dimension chính và Vị trí là bảng dimension bên ngoài. dimension sản phẩm có ba bảng dimension với Sản phẩm là bảng dimension chính và bảng Dòng và Dòng là bảng dimension bên ngoài.

Lợi thế của giản đồ Snowflake Schema

  • Ưu điểm chính của Snowflake Schema là sự phát triển về hiệu suất truy vấn do các yêu cầu lưu trữ đĩa được giảm thiểu và tham gia các bảng tra cứu nhỏ hơn.
  • Nó cung cấp khả năng mở rộng lớn hơn trong mối quan hệ qua lại giữa các mức dimension và các thành phần.
  • Không dư thừa nên dễ bảo trì hơn.
  • Truy xuất dữ liệu nhanh
  • Thực thi chất lượng dữ liệu
  • Mô hình dữ liệu phổ biến, đơn giản để lưu trữ dữ liệu

Nhược điểm của Snowflake Schema

  • Snowflake Schema cần phải có thêm các nỗ lực bảo trì do số lượng bảng tra cứu ngày càng tăng.
  • Rất nhiều chi phí khi thiết lập ban đầu
  • Mô hình dữ liệu cứng nhắc
  • Chi phí bảo trì cao
  • Nhiều bảng hơn nên mất nhiều thời gian thực hiện hơn.

INDA chuyên cung cấp các dịch vụ về Xây dựng Kho dữ liệu Data Warehouse/Xây dựng Báo cáo Power BI cho các doanh nghiệp lớn. Đăng ký ngay để được Demo và tư vấn miễn phí dành riêng cho doanh nghiệp của bạn.

>> Đọc thêm:

KHOÁ HỌC TRUY VẤN VÀ THAO TÁC DỮ LIỆU SQL TỪ CƠ BẢN ĐẾN NÂNG CAO

KHÓA HỌC DATA WAREHOUSE : TỔNG HỢP, CHUẨN HÓA VÀ XÂY DỰNG KHO DỮ LIỆU TRONG DOANH NGHIỆP

KHÓA HỌC DATA MODEL – THIẾT KẾ MÔ HÌNH DỮ LIỆU TRONG DOANH NGHIỆP

LỘ TRÌNH TRỞ THÀNH DATA ENGINEER CHO NGƯỜI MỚI BẮT ĐẦU

DATA ENGINEER LÀ GÌ? CÔNG VIỆC CHÍNH CỦA DATA ENGINEER? CÁC KỸ NĂNG CẦN THIẾT

Leave a Reply

Your email address will not be published. Required fields are marked *