Câu chuyện thật – Con người thật Thực tập sinh data engineer xuất sắc tại INDA – Bạn Phan Đức Cương (sinh năm 1999) có chia sẻ:Mặc dù mình đã có nền tảng học về CNTT, nhưng sau khi ra trường mình lại chọn làm SALE VÀ KINH DOANH nên…
Data Warehouse là gì? Lợi ích và ứng dụng của kho dữ liệu Data Warehouse là gì? Với sự bùng nổ về mặt thông tin và dữ liệu như hiệu này thì đây luôn là những câu hỏi được rất nhiều bạn thắc mắc, đặc biệt là các bạn sinh viên…
1. Giới thiệu SSIS SQL Server Integration Service (SSIS) là một thành phần của phần mềm cơ sở dữ liệu Microsoft SQL Server có thể được sử dụng để thực hiện nhiều tác vụ di chuyển dữ liệu. SSIS là một công cụ lưu trữ dữ liệu linh hoạt và…
Trong thiết kế kho dữ liệu thì người ta dùng 2 khái niệm là độ đo (measure) và chiều phân tích (dimension) và vẫn dùng mô hình cơ sở dữ liệu quan hệ để biểu diễn, trong đó: Cụ thể có 3 mô hình biểu diễn quan hệ giữa bảng…
Google BigQuery được phát hành phổ biến vào năm 2011 và là kho dữ liệu (Data Warehouse) doanh nghiệp của Google Cloud được thiết kế phục vụ cho sự linh hoạt trong kinh doanh. Kiến trúc không máy chủ cho phép nó vận hành ở quy mô mở rộng và tốc độ phân…
ETL và ELT thường xuyên được sử dụng trong kho dữ liệu (DataWarehouse). Hãy cùng Inda Academy tìm hiểu sữ khác biệt giữa chúng nhé! ETL là gì? ETL là tên viết tắt của Extract, Transform và Load. Trong hệ thống DataWarehouse, một công cụ ETL trích xuất dữ liệu…
Data engineer là gì? Đây chính là một thuật dùng trong chuyên ngành của công nghệ thông tin. Để hiểu rõ hơn về công việc này thì bạn hãy cùng chúng tôi tìm hiểu ngay trong bài viết này, chắc chắn sẽ không làm bạn phải thất vọng với những…
Thế giới phân tích dữ liệu (data analytics) dựa vào các đường ống (pipeline) ETL và ELT để thu thập những thông tin chi tiết có ý nghĩa từ dữ liệu. Các kỹ sư dữ liệu và nhà phát triển ETL thường được yêu cầu xây dựng hàng chục đường…
Trong bài đăng này, Inda sẽ hướng dẫn các bạn cách cài đặt và cấu hình , một số thay đổi từ phiên bản 11 sang phiên bản Oracle Data Integrator 12c (ra mắt vào khoảng năm 2014). Oracle đã nỗ lực rất nhiều để cải thiện một công cụ…
ETL là viết tắt của 3 từ Extract – Transform – Load (trích xuất – biến đổi – tải), sử dụng phổ biến trong bigdata, nhiều nhất là trong data warehouse. Cụ thể, ETL là gì, nó có ý nghĩa gì trong đời sống và quá trình ETL diễn ra…