Last updated on January 12th, 2026 at 04:33 pm
Data Mart là một tập hợp con của kho thông tin tổng, thường hướng đến một mục đích cụ thể hoặc chủ đề dữ liệu chính có thể được phân phối để cung cấp nhu cầu kinh doanh. Data Marts là kho lưu trữ hồ sơ phân tích được thiết kế để tập trung vào các chức năng kinh doanh cụ thể cho một cộng đồng cụ thể trong một tổ chức. Các Data Warehouse có nguồn gốc từ các tập hợp con dữ liệu trong Data Warehouse, mặc dù trong phương pháp thiết kế Data Warehouse từ dưới lên, Data Warehouse được tạo từ sự kết hợp của các Data Warehouse tổ chức.
Việc sử dụng cơ bản của trung tâm dữ liệu là các ứng dụng Business Intelligence (BI). BI được sử dụng để thu thập, lưu trữ, truy cập và phân tích bản ghi. Nó có thể được sử dụng bởi các doanh nghiệp nhỏ hơn để tận dụng dữ liệu mà họ đã tích lũy được vì nó ít tốn kém hơn so với việc triển khai một Data Warehouse.

Mục lục
Lý do tạo trung tâm dữ liệu
- Tạo dữ liệu tập thể bởi một nhóm người dùng
- Dễ dàng truy cập vào data thường xuyên cần thiết
- Dễ dàng sáng tạo
- Cải thiện thời gian phản hồi của khách hàng
- Chi phí thấp hơn so với việc triển khai một Data Warehouse hoàn chỉnh
- Khách hàng tiềm năng được xác định rõ ràng hơn so với trong một Data Warehouse toàn diện
- Nó chỉ chứa dữ liệu kinh doanh thiết yếu và ít lộn xộn hơn.
Các loại Data Marts
Chủ yếu có hai cách tiếp cận để thiết kế data mart. Những cách tiếp cận này là
- Dependent Data Marts
- Independent Data Marts
Dependent Data Marts
Dependent Data Marts là một tập hợp con hợp lý của một tập con vật lý của một Data Warehouse cao hơn. Theo kỹ thuật này, các data mart được coi như các tập con của Data Warehouse. Trong kỹ thuật này, trước hết một Data Warehouse được tạo ra để từ đó có thể tạo thêm các Data Warehouse khác nhau. Các Data Warehouse này phụ thuộc vào Data Warehouse và trích xuất bản ghi cần thiết từ đó. Trong kỹ thuật này, khi Data Warehouse tạo ra data mart; do đó, không cần tích hợp data mart. Nó còn được gọi là cách tiếp cận từ trên xuống.

Independent Data Marts
Cách tiếp cận thứ hai là Các Data Warehouse độc lập (IDM) Ở đây, trước tiên các Data Warehouse độc lập được tạo, sau đó một Data Warehouse được thiết kế bằng cách sử dụng các Data Warehouse độc lập này. Theo cách tiếp cận này, vì tất cả các data mart được thiết kế độc lập; do đó, việc tích hợp các data mart là bắt buộc. Nó cũng được gọi là phương pháp tiếp cận từ dưới lên vì các data mart được tích hợp để phát triển một Data Warehouse.

Ngoài hai loại này, còn một loại nữa tồn tại được gọi là “Hybrid Data Marts”.
Hybrid Data Marts
Nó cho phép kết hợp dữ liệu từ ngoài Data Warehouse. Điều này phù hợp cho nhiều trường hợp; đặc biệt là trong trường hợp tích hợp Adhoc, chẳng hạn như thêm mới nhóm một tổ chức.
Các bước triển khai Data Mart
Các bước quan trọng trong việc triển khai data mart là thiết kế lược đồ, xây dựng bộ lưu trữ vật lý, điền vào data mart với dữ liệu từ các hệ thống nguồn, truy cập nó để đưa ra quyết định sáng suốt và quản lý nó theo thời gian. Vì vậy, các bước là:
Designing
Bước thiết kế là bước đầu tiên trong quy trình data mart. Giai đoạn này bao gồm tất cả các chức năng từ việc khởi tạo yêu cầu đối với trung tâm dữ liệu thông qua việc thu thập dữ liệu về các yêu cầu và phát triển thiết kế logic và vật lý của trung tâm dữ liệu.
Nó bao gồm các nhiệm vụ sau:
- Thu thập các yêu cầu kinh doanh và kỹ thuật
- Xác định nguồn dữ liệu
- Chọn tập hợp con dữ liệu thích hợp
- Thiết kế kiến trúc logic và vật lý của data mart.
Constructing
Bước này bao gồm việc tạo cơ sở dữ liệu vật lý và các cấu trúc logic được liên kết với data mart để cung cấp khả năng truy cập nhanh và hiệu quả vào dữ liệu.
Nó bao gồm các nhiệm vụ sau:
- Tạo cơ sở dữ liệu vật lý và các cấu trúc logic, chẳng hạn như không gian bảng được liên kết với Data Warehouse.
- tạo các đối tượng lược đồ như bảng và chỉ mục được mô tả trong bước thiết kế.
- Xác định cách tốt nhất để thiết lập các bảng và cấu trúc truy cập.
Populating
Bước này bao gồm tất cả các tác vụ liên quan đến việc lấy dữ liệu từ nguồn, làm sạch nó, sửa đổi nó theo đúng định dạng và mức độ chi tiết, và chuyển nó vào data mart.
Nó bao gồm các nhiệm vụ sau:
- Ánh xạ các nguồn dữ liệu đến các nguồn dữ liệu mục tiêu
- Trích xuất dữ liệu
- Làm sạch và chuyển đổi thông tin.
- Đang tải dữ liệu vào data mart
- Tạo và lưu trữ siêu dữ liệu
Accessing
Bước này liên quan đến việc đưa dữ liệu vào sử dụng: truy vấn dữ liệu, phân tích dữ liệu, tạo báo cáo, biểu đồ và đồ thị và xuất bản chúng.
Nó bao gồm các nhiệm vụ sau:
- Thiết lập và lớp trung gian (Meta Layer) để công cụ front-end sử dụng. Lớp này chuyển các hoạt động cơ sở dữ liệu và tên đối tượng thành các điều kiện kinh doanh để khách hàng cuối có thể tương tác với trung tâm dữ liệu bằng cách sử dụng các từ liên quan đến các chức năng nghiệp vụ.
- Thiết lập và quản lý kiến trúc cơ sở dữ liệu như bảng tóm tắt giúp các truy vấn đồng ý thông qua các công cụ front-end thực thi nhanh chóng và hiệu quả.
Managing
Bước này bao gồm việc quản lý Data Warehouse trong suốt thời gian tồn tại của nó. Trong
bước này, các chức năng quản lý được thực hiện như:
Cung cấp quyền truy cập an toàn vào dữ liệu.
Quản lý sự tăng trưởng của dữ liệu.
Tối ưu hóa hệ thống để có hiệu suất tốt hơn.
Đảm bảo tính khả dụng của sự kiện dữ liệu với các lỗi hệ thống

Xu hướng mới nhất của Data Mart trong bối cảnh dữ liệu 2025–2026
Trong vài năm gần đây, vai trò của Data Mart không chỉ giới hạn ở các hệ thống báo cáo đơn lẻ mà ngày càng gắn chặt với các kiến trúc dữ liệu hiện đại và nhu cầu phân tích phức tạp trong doanh nghiệp. Dưới đây là những xu hướng nổi bật mà các tổ chức đang triển khai hoặc cân nhắc liên quan đến Data Mart:
Data Mart kết hợp với kiến trúc Data Mesh
Thay vì chỉ tạo Data Mart tập trung ở một vị trí duy nhất, tổ chức đang chuyển dịch sang mô hình Data Mesh, trong đó Data Mart được xây dựng theo từng domain dữ liệu cụ thể (như bán hàng, marketing, logistics).
Điều này giúp:
- Các đội nhóm sở hữu dữ liệu có quyền tự quyết định về mô hình và chất lượng dữ liệu
- Giảm bottleneck khi phát triển Data Mart tại trung tâm
- Tăng khả năng mở rộng và phản hồi nhanh theo nhu cầu nghiệp vụ
Data Mart như một phần của chiến lược “Data Lakehouse”
Với xu hướng tích hợp Data Lake và Data Warehouse trong kiến trúc Data Lakehouse, Data Mart ngày càng được triển khai trên nền tảng chung thay vì silo riêng.
Trong bối cảnh này:
- Các Data Mart thường được triển khai như quy trình extract/transform/load (ETL/ELT) lên một layer dataset trừu tượng
- Các báo cáo và dashboard có thể tận dụng cùng một nguồn dữ liệu nhưng với phạm vi riêng theo chức năng
Hỗ trợ cho Self-Service Analytics
Do yêu cầu nhanh của người dùng nghiệp vụ, Data Mart không còn chỉ dành cho đội phân tích dữ liệu. Xu hướng self-service analytics khiến các Data Mart được thiết kế:
- Dễ truy cập bởi người dùng không chuyên
- Gắn với công cụ BI phổ biến như Power BI, Tableau hoặc Looker
- Cung cấp semantic layer rõ ràng để giảm sai lệch hiểu dữ liệu
Tích hợp dữ liệu real-time cho dashboard và KPI theo thời gian thực
Trong nhiều ngành như bán lẻ, logistics hoặc dịch vụ tài chính, việc phản ánh dữ liệu gần như thời gian thực là một yêu cầu quan trọng. Do đó, các Data Mart hiện nay:
- Kết hợp dữ liệu streaming từ hệ thống giao dịch
- Cập nhật nhanh hơn thay vì chỉ theo lịch batch
- Hỗ trợ các dashboard KPI real-time, giúp lãnh đạo theo dõi tình hình theo phút/giờ
Tự động hóa và governance mạnh hơn
Khi Data Mart được mở rộng và số lượng tăng theo domain, vấn đề governance và tự động hóa trở nên quan trọng:
- Các công cụ tự động hóa pipeline (DataOps) giúp giảm sai sót khi cập nhật Data Mart
- Các metadata and lineage được duy trì chặt để kiểm soát chất lượng dữ liệu
- Quy trình audit và bảo mật dữ liệu được tích hợp sẵn
Hỗ trợ cho AI/ML và phân tích nâng cao
Ở các tổ chức dữ liệu trưởng thành, Data Mart không chỉ phục vụ báo cáo mà còn là nguồn dữ liệu đầu vào cho các mô hình machine learning và AI. Dữ liệu được:
- Làm sạch và gắn nhãn tốt hơn
- Gắn với feature stores để tái sử dụng trong mô hình học máy
- Kết hợp với mô hình dự đoán giúp báo cáo có thể “khuyến nghị” thay vì chỉ mô tả
Nguồn: Internet
Chúng tôi chuyên cung cấp những khoá học về Phân tích dữ liệu, đăng ký ngay để nhận được tư vấn chi tiết lộ trình dành riêng cho bạn nhé!
INDA Academy tự hào là đơn vị tiên phong trong việc đào tạo phân tích dữ liệu và AI chuyên sâu, đặc biệt cho khối ngành Ngân hàng – Tài chính – Bảo hiểm tại Việt Nam. Sau hơn 12 năm “thực chiến” cùng những dòng chảy dữ liệu khổng lồ, chúng tôi đã xây dựng nên một hệ sinh thái đào tạo toàn diện, giúp hàng nghìn học viên chuyển mình từ người mới bắt đầu trở thành những chuyên gia lành nghề, sẵn sàng đáp ứng tiêu chuẩn khắt khe của các doanh nghiệp lớn.
Điểm khác biệt lớn nhất tại INDA chính là triết lý đào tạo dựa trên các dự án thực tế (Project-based) và lộ trình cá nhân hóa nhờ ứng dụng AI. Chúng tôi không chỉ dạy bạn cách sử dụng công cụ, mà còn truyền tải tư duy khai phá giá trị từ dữ liệu để đưa ra quyết định kinh doanh chính xác.
Tìm hiểu thêm về các khóa học TẠI ĐÂY:
Lộ trình đào tạo Data Engineer
Lộ trình đào tạo Data Analyst
Lộ trình đào tạo Tester
Khóa học Data Engineer nâng cao – Thực chiến 5 dự án doanh nghiệp
Khóa học Data Analyst nâng cao – Thực chiến 5 dự án doanh nghiệp





