Khi bạn tham gia phỏng vấn các vị trí kỹ thuật trong ngành data, chẳng hạn Data Engineer, việc nắm rõ bộ câu hỏi Data Warehouse là không thể thiếu. Đó là bởi Data Warehouse là một phần cốt lõi của công việc data engineering. Hiểu được điều đó, INDA…
Khi nghiên cứu về hệ thống dữ liệu trong doanh nghiệp, bạn có thể từng thắc mắc ODS là gì? ODS (Operational Data Store) là một cơ sở dữ liệu trung tâm dùng để thu thập và lưu trữ dữ liệu từ nhiều nguồn khác nhau, hỗ trợ các quyết…
Snowflake Data Warehouse là gì? Snowflake Data Warehouse là một hệ thống lưu trữ và phân tích dữ liệu đám mây hiện đại, nổi bật với khả năng xử lý khối lượng dữ liệu lớn với tốc độ cao, tính linh hoạt và khả năng mở rộng mạnh mẽ. Được…
Bảng Fact chứa các đại lượng về hoạt động sản xuất kinh doanh của doanh nghiệp. Các loại bảng Fact Bảng fact mức chi tiết (Transaction grain fact table) Bảng fact tổng hợp thường kỳ (Periodic snapshot fact table) Đại diện cho một khung thời gian nhất định và sẽ…
Trong DW, Bảng chiều dimension cung cấp thông tin, ngữ cảnh cho bảng fact. Dù có quy mô nhỏ hơn fact nhiều lần, nhưng dimension là trọng tâm của DW, vì nếu thiếu nó, các số liệu trong fact sẽ không mang lại nhiều ý nghĩa cho người dùng. Khi có sự…
Việc xây dựng liên hệ giữa các bảng fact và dim là hoạt động cốt yếu trong xây dựng mô hình đa chiều nhà kho dữ liệu doanh nghiệp để hỗ trợ quá trình ra quyết định. Có 2 cách tiếp cận đối nghịch nhau: Phương pháp Bottom-up sẽ nhanh…
Data Warehouse và các hệ thông OLAP được xây dựng theo mô hình dữ liệu đa chiều (multi-dimensional model) Kiến trúc khối (cube) OLAP Dữ liệu trong kho dữ liệu được thể hiện dưới dạng đa chiều (Multi Dimension) gọi là khối (cube). Mỗi chiều mô tả một đặc trưng nào…
Hiện nay, đã có nhiều bài viết về Data Warehouse. Tuy nhiên đa số đều ở dạng hàn lâm, để tiếp thu được các bạn mới tiếp cận sẽ cần một thời gian nghiên cứu thẩm thấu nhất định. Với kinh nghiệm hơn nhiều năm tiếp cận thực tế hệ…
Temporary tables hay còn gọi là bảng tạm, đây là bảng dùng để lưu trữ tạm thời dữ liệu, tuy nhiên nó vẫn chứa một số tính năng của một bảng thông thường như triggers, lưu dữ liệu, … chỉ có một điều khác biệt là bảng tạm không thể…
Chúng ta càng tạo ra nhiều dữ liệu thì việc tìm kiếm giá trị từ ứng dụng data mining ngày một trở nên khó khăn. Hãy thử nghĩ về việc đứng giữa một khu rừng có chứa hàng triệu cây, bạn sẽ bắt đầu phân tích khu rừng đó ở đâu? Khai…