Lịch sử ra đời Oracle Data Integrator (ODI): Oracle Data Integrator (ODI) từng là sản phẩm của một công ty có tên là Sunopsis. Trụ sở chính của Sunopsis tại Lyon-Pháp và hoạt động tại Massachusetts- Hoa Kỳ. Việc tích hợp dữ liệu đã trở nên cực kỳ quan trọng đối với…
ETL là viết tắt của 3 từ Extract – Transform – Load (trích xuất – biến đổi – tải), sử dụng phổ biến trong bigdata, nhiều nhất là trong data warehouse. Cụ thể, ETL là gì, nó có ý nghĩa gì trong đời sống và quá trình ETL diễn ra…
Phần lớn hệ thống cơ sở dữ liệu hiện nay đều được xây dựng bằng mô hình dữ liệu quan hệ. Vậy mô hình dữ liệu quan hệ là gì và có những đặc điểm nào. Bài viết dưới đây sẽ cung cấp cái nhìn bao quát, căn bản nhất…
Data Lake là gì ? Data Lake (Hồ dữ liệu) là nơi đặt tất cả các doanh nghiệp dữ liệu (có thể) muốn thu thập, lưu trữ, phân tích và biến thành hiểu biết và hành động, bao gồm dữ liệu có cấu trúc, bán cấu trúc và không cấu…
Để có được insights tốt nhất từ tất cả dữ liệu, các tổ chức cần di chuyển dữ liệu giữa các data lake và các data warehouse một cách dễ dàng. Khi dữ liệu trong các hệ thống này tiếp tục phát triển, việc di chuyển tất cả dữ liệu…
Tiếp theo phần 1 đề cập tới cách tiếp cận Lakehouse, các phần sau này sẽ giới thiệu một kiến trúc tham chiếu sử dụng các dịch vụ AWS để tạo từng layer được mô tả trong kiến trúc Lakehouse. Xem thêm phần 1 về Cách tiếp cận Lakehouse. Theo…
