Blog

Data Model là gì ? Chuẩn hóa Database trong PowerBI (Cập nhật 2026)

Last updated on January 16th, 2026 at 02:06 pm

Data Model là gì?

Cách hiểu sai Data Model

Trong ví dụ này ta có 3 bảng độc lập gồm bảng Product, Sale và Return. Nếu 3 bảng này nằm hoàn toàn độc lập với nhau thì nó sẽ không có bất kỳ kết nối hay  mối quan hệ nào, thì đây chắc chắn KHÔNG PHẢI Data Model

Data Model chuẩn

Vậy thì một Data Model chuẩn sẽ có thể kết nối với nhau qua các mối quan hệ (Relationship) hay cụ thể là các trường dữ liệu chung là Product Key. Như vậy, để có Data Model, chúng ta phải thỏa mãn được 2 điều kiện

  • Giữa các bảng phải có trường dữ liệu chung
  • Tạo các Relationship từ các trường dữ liệu chung

Thiết lập Data Model trong PowerBI

Tạo Data Model không thông qua Relationship

Để thực hành, INDA đã có sẵn ba bảng dữ liệu gồm Product, Sale Data và Return. Như các bạn thấy, ba bảng này đang đứng hoàn toàn độc lập với nhau mặc dù đã mang trường chung như Product Key nhưng không hề có Relationship, bởi vậy đây chưa phải là một Data Model

Vậy nếu chưa thành Data Model thì vấn đề mà người dùng sẽ gặp phải là khi sử dụng đến công cụ trực quan hóa Visualization Data. Ví dụ cụ thể thì chúng ta sẽ lấy một bảng gồm số lượng bán được (từ Sale Data), hàng bị trả lại (Return Data) đồng thời là thông tin của các sản phẩm

Như chúng ta thấy thì tất cả các sản phẩm đã được liệt kê từ Product Name trong bảng Product. Tuy nhiên, ở bảng Order Quantity và Return Quantity thì không được tách ra theo từng mã sản phẩm một mà nó chỉ thể hiện tổng (Total) sản phẩm. Như vậy thì rõ ràng quá trình xử lý của chúng ta đã bị sai và không thể trực quan hóa dữ liệu được

Như vậy, khi không tạo được ra Data Model thì dữ liệu của chúng ta vẫn chưa thể sử dụng được trong Excel

Tạo Data Model thông qua Relationship

Như vậy, bắt buộc chúng ta phải có Relationship thì Data Model mới hoạt động hiệu quả, vì vậy, ví dụ này INDA sẽ dùng đến công cụ Relationship.

Như dưới đây chúng ta đã có Relationship cho ba bảng hiển thị trên màn hình PBI. Khi đã tạo được Relationship thì tự động chúng ta đã đạt được hai điều kiện cần và đủ: Có các trường chung và các trường chung phải được kết nối với nhau

Sau khi đã tạo ra được Data Model rồi thì lúc này mới sử dụng được chính xác Visualization Data. Vẫn là bài toán trên, chúng ta sẽ xem tổng lượng bán sản phẩm và tổng lượng trả lại cho từng mã sản phẩm một. Như vậy vẫn phải cần mục Order Quantity trong bảng Sale Data; Return Quantity trong bảg Return và phần Product.

Lúc này thì Order Quantity và Return Quantity đã được tách chi tiết theo từng sản phẩm một, lúc này thì Data Model mới chính thức hoạt động. Bởi vậy mà chúng ta cần phải tạo Data Model trong PowerBI. Cùng với đó, bước tạo Relationship và Data Model là bắt buộc ở trong PBI nếu muốn sử dụng dữ liệu từ nhiều bảng dữ liệu khác nhau. Còn đương nhiên, nếu chỉ cần một bảng dữ liệu duy nhất thì không cần quá trình tạo ra Data Model bởi dữ liệu chỉ dùng trong một bảng. Tuy nhiên trong PowerBI thì không nên để toàn bộ dữ liệu nằm trong một bảng 

Chuẩn hóa Database cho Data Model

Trước khi sử dụng dữ liệu thì chúng ta cần phải chuẩn hóa Database, vậy chuẩn hóa Database là gì?

Chuẩn hóa Database là toàn bộ quá trình tổ chức dữ liệu tại cột-bảng trong một mối quan hệ dữ liệu, để giảm sự dư thừa và đảm bảo tính nguyên cho dữ liệu.

Chuẩn hóa Database sẽ có quy tắc như sau

  • Loại bỏ dữ liệu thừa để giảm kích thước bảng và cải thiện tốc độ & kết quả xử lý
  • Giảm thiểu các lỗi và sự bất thường từ sửa đổi dữ liệu (chèn, cập nhật hoặc xóa)
  • Đơn giản hóa các queries và cấu trúc Database có ý nghĩa phân tích

Trên đây là ba quy tắc về chuẩn hóa Database trước khi sử dụng Database đó trong Data Model khi trực quan hóa dữ liệu

* Lưu ý: Trong quá trình chuẩn hóa Database, các bảng nên đảm bảo mục đích riêng biệt và cụ thể 

Ví dụ như dưới đây là một bảng chưa được chuẩn hóa. Trên bảng này có rất nhiều trường thông tin, thậm chí một số thông tin bị trùng lặp và không sử dụng tới. Lúc này thì ta chưa thấy được sự ảnh hưởng đến Data Model của chúng ta, tuy nhiên vấn đề sẽ xảy ra khi Data Model ngày càng lớn lên thì Data Model không được tối ưu về hiệu quả xử lý và tốc độ xử lý. Bởi vậy chúng ta nên tách ra mỗi bảng sẽ có một nghiệm vụ riêng biệt và cụ thể

Quay lại với PowerBI, rõ ràng người dùng hoàn toàn gộp Sale Data, Product và Return thành một bảng, nhưng tuyệt đối không được làm như vậy mà phải tách ra làm ba bảng và tạo Relationship với nhau. Một bảng chuyên thông tin sản phẩm, một bảng bán hàng và một bảng liên quan đến hàng bị trả lại.

Đây là một lưu ý cực kỳ quan trọng trong quá trình chuẩn hóa Data, bởi vậy các bạn nên lưu ý quy tắc chuẩn hóa Data và luôn đảm bảo thực hiện ba quy tắc này cho Data của chúng ta trước khi tạo Data Model,  trực quan hóa dữ liệu.

Những tips quan trọng nhất khi xây dựng Data Model trong Power BI

Khi làm Data Modeling trong Power BI, không cần áp dụng mọi best practice nâng cao ngay từ đầu. Trên thực tế, chỉ cần làm đúng một số nguyên tắc cốt lõi dưới đây đã giúp model chạy nhanh hơn, dễ mở rộng và hạn chế lỗi về sau.

1. Luôn ưu tiên mô hình Star Schema

Đây là nguyên tắc quan trọng nhất trong Power BI Data Modeling. Việc tổ chức dữ liệu theo fact table ở trung tâm và các dimension table xung quanh giúp Power BI xử lý quan hệ hiệu quả, giảm lỗi filter context và khiến DAX dễ viết hơn.
Trong hầu hết các bài toán BI thực tế, Star Schema cho hiệu quả tốt hơn rõ rệt so với các mô hình phức tạp hoặc quá chuẩn hóa.

2. Bắt buộc có bảng Date riêng

Nếu báo cáo có yếu tố thời gian, việc tạo Date Table độc lập là điều gần như không thể bỏ qua. Bảng Date giúp các phép tính thời gian (YTD, so sánh cùng kỳ, tăng trưởng theo tháng/quý) hoạt động chính xác và ổn định.
Đây cũng là nền tảng để sử dụng các hàm Time Intelligence trong DAX một cách đúng chuẩn.

3. Giữ Data Model càng “gọn” càng tốt

Kích thước model ảnh hưởng trực tiếp đến hiệu năng. Những việc đơn giản nhưng rất hiệu quả gồm:

  • Chỉ giữ lại các cột thực sự dùng cho phân tích
  • Chọn đúng kiểu dữ liệu (số thay cho text nếu có thể)
  • Tránh đưa dữ liệu trung gian không cần thiết vào model

Một model gọn sẽ refresh nhanh hơn và giảm rủi ro lỗi khi mở rộng báo cáo.

4. Ưu tiên dùng Measures, hạn chế Calculated Columns

Measures được tính toán khi người dùng tương tác báo cáo, trong khi calculated columns làm tăng kích thước model ngay từ đầu. Vì vậy, trong đa số trường hợp:

  • Measures phù hợp cho logic tính toán
  • Calculated columns chỉ nên dùng khi thật sự cần thiết cho quan hệ hoặc phân loại dữ liệu

Đây là thói quen quan trọng để xây dựng model bền vững về lâu dài.

5. Tránh lạm dụng quan hệ lọc hai chiều

Quan hệ bidirectional filter có thể gây khó kiểm soát luồng lọc và làm chậm báo cáo. Trong phần lớn tình huống, quan hệ một chiều từ dimension → fact là đủ.
Chỉ nên dùng lọc hai chiều khi bạn hiểu rõ tác động của nó và có nhu cầu nghiệp vụ cụ thể.

6. Đặt tên bảng và cột rõ ràng, nhất quán

Một data model tốt không chỉ dành cho Power BI mà còn dành cho con người. Tên bảng, cột và measure rõ nghĩa giúp:

  • Viết DAX nhanh hơn
  • Giảm sai sót khi bảo trì
  • Dễ làm việc nhóm hoặc bàn giao

Đây là tip đơn giản nhưng ảnh hưởng rất lớn đến trải nghiệm sử dụng lâu dài.

Trên đây INDA đã giới thiệu cho các bạn Data Model là gì, cách chuẩn hóa Database để tạo Data Model. Hy vọng bạn đọc sẽ áp dụng hiệu quả những kiến thức này khi làm việc với PowerBI.

INDA Academy tự hào là đơn vị tiên phong trong việc đào tạo phân tích dữ liệu và AI chuyên sâu, đặc biệt cho khối ngành Ngân hàng – Tài chính – Bảo hiểm tại Việt Nam. Sau hơn 12 năm “thực chiến” cùng những dòng chảy dữ liệu khổng lồ, chúng tôi đã xây dựng nên một hệ sinh thái đào tạo toàn diện, giúp hàng nghìn học viên chuyển mình từ người mới bắt đầu trở thành những chuyên gia lành nghề, sẵn sàng đáp ứng tiêu chuẩn khắt khe của các doanh nghiệp lớn.

Điểm khác biệt lớn nhất tại INDA chính là triết lý đào tạo dựa trên các dự án thực tế (Project-based) và lộ trình cá nhân hóa nhờ ứng dụng AI. Chúng tôi không chỉ dạy bạn cách sử dụng công cụ, mà còn truyền tải tư duy khai phá giá trị từ dữ liệu để đưa ra quyết định kinh doanh chính xác.

Tìm hiểu thêm về các khóa học TẠI ĐÂY:
Lộ trình đào tạo Data Engineer
Lộ trình đào tạo Data Analyst
Lộ trình đào tạo Tester
Khóa học Data Engineer nâng cao – Thực chiến 5 dự án doanh nghiệp
Khóa học Data Analyst nâng cao – Thực chiến 5 dự án doanh nghiệp

Nguồn: Internet

    Leave a Reply

    Your email address will not be published. Required fields are marked *