Lộ trình đào tạo Analytics Engineer

GIỚI THIỆU CHUNG

Analytics Engineer là vị trí kết hợp giữa kỹ thuật dữ liệu và phân tích kinh doanh, chịu trách nhiệm chuẩn hóa và mô hình hóa dữ liệu để phục vụ phân tích. Họ biến dữ liệu thô từ các hệ thống khác nhau thành các bảng dữ liệu có cấu trúc rõ ràng, dễ sử dụng cho báo cáo và phân tích, đồng thời đảm bảo dữ liệu phản ánh đúng logic kinh doanh.

Trong doanh nghiệp, Analytics Engineer đóng vai trò cầu nối giữa Data Engineer và Data Analyst. Họ xây dựng lớp dữ liệu phân tích đáng tin cậy, thống nhất cách tính chỉ số và kiểm soát chất lượng dữ liệu, giúp các phòng ban khai thác dữ liệu hiệu quả hơn và ra quyết định chính xác dựa trên cùng một nguồn dữ liệu.

TỔNG QUAN KHÓA HỌC

Hình thức học

Mentor hướng dẫn 1 : 1 trong quá trình học và thực tập

Nội dung

6 – 8 tháng (90 bài)

Thời gian học

Lịch học linh hoạt (Học viên sắp xếp thời gian học với Mentor)

KIẾN THỨC NHẬN ĐƯỢC

✅ Làm chủ ngôn ngữ và công cụ cốt lõi: SQL, Python, Power BI.

Xây dựng và vận hành hệ thống dữ liệu: Data Warehouse, Data Modeling, DBT, Airflow.

✅ Hiểu và ứng dụng nền tảng công nghệ hiện đại: AWS, Big Data.

✅ Triển khai dự án thực tế với dữ liệu thật, mô phỏng môi trường doanh nghiệp.

✅ Tư duy hệ thống và chuẩn hóa pipeline dữ liệu để phục vụ nhu cầu phân tích và báo cáo.

✅ Kỹ năng phối hợp giữa kỹ thuật và kinh doanh, trở thành cầu nối giữa Data Engineer và Data Analyst.

ĐỐI TƯỢNG THAM GIA

👉 Sinh viên năm 3, năm 4 các ngành CNTT, Toán – Tin, Hệ thống thông tin, Khoa học dữ liệu,… muốn phát triển theo hướng dữ liệu.

👉Data Analyst muốn nâng cấp kỹ năng kỹ thuật để chuyển hướng thành Analytic Engineer hoặc Data Engineer.

👉Người đi làm trái ngành có tư duy logic, đã học cơ bản Python/SQL, muốn chuyển nghề sang lĩnh vực phân tích và xử lý dữ liệu.

👉Người đang làm trong lĩnh vực dữ liệu cần hệ thống hóa kiến thức, làm việc bài bản với pipeline và công cụ hiện đại như dbt, Airflow, BigQuery, AWS…

TẠI SAO LỰA CHỌN KHÓA HỌC TẠI INDAACADEMY

Cam kết giới thiệu
việc làm

Hỗ trợ giới thiệu việc làm với gần 100% học viên tốt nghiệp đều tìm được việc full-time.

Đội ngũ giảng viên

Đội ngũ giảng viên chuyên gia có kinh nghiệm 5-10 năm trong lĩnh vực.

Giáo trình
chuyên nghiệp

Lộ trình bài bản, kiến thức cô đọng, trọng tâm trong thời gian ngắn.

Học thật làm thật

Đào tạo lý thuyết và thực chiến các dự án của công ty, tập đoàn.

LỘ TRÌNH TỰ TIN APPLY JOB ANALYTICS ENGINEER

Bài 1: Tổng quan về CSDL,SQL, Cài đặt tools thao tác với CSDL

Bài 2: Câu lệnh truy vấn (Query): Truy vấn dữ liệu đơn giản, truy vấn dữ liệu nâng cao: Where, Order By, Distinct, Alias

Bài 3: Cấu trúc và thao tác dữ liệu: Nhóm lệnh định nghĩa cấu trúc dữ liệu, nhóm lệnh thao tác với dữ liệu

Bài 4: Các hàm cơ bản: Hàm xử lý số, chuỗi, ngày/tháng, chuyển đổi, hàm tổng hợp

Bài 5: SQL Join: Giới thiệu về SQL Join: inner join, left join, right join, full join, cross join

Bài 6: SQL Join (Nâng cao): Join nhiều bảng (>5-7 bảng) kết hợp với các mệnh đề

Bài 7: Các chuyển đề khác: Subquery, sử dụng With, tạo View,..

Bài 8: Kết nối Power BI & Tổng kết: Dự án cuối khóa & chia sẻ kinh nghiệm tổng kết

Kết quả đạt được:

  • Hiểu cách tổ chức dữ liệu, phân tích và lợi ích của các bài toán phân tích dữ liệu;
  • Nắm được những KPI, chỉ tiêu, công thức tính toán, thống kê dữ liệu trong thực tế tại các doanh nghiệp
  • Thành thạo truy vấn, trích xuất, lọc dữ liệu từ CSDL, chèn các điều kiện vào để trích xuất dữ liệu đáp ứng 1 hoặc nhiều yêu cầu nào đó
  • Sử dụng các mệnh đề joins để ghép nối các bảng 
  • Tính sum, average, min, max, các loại hàm đếm, groupby theo các tiêu chí
  • Sử dụng các tables trung gian để tăng tốc độ đọc dữ liệu

Bài 1: Các khái niệm cơ bản trong lập trình Python

Bài 2: Biểu thức trong lập trình Python

Bài 3: Đối tượng String trong lập trình Python

Bài 4: Đối tượng List, Tuples, Sets và Dictionary

Bài 5: Thao tác với hàm tự định nghĩa trong lập trình Python

Bài 6: Hướng đối tượng và thao tác với File trong Python

Bài 7: Tìm hiểu về module và quản lý lỗi trong Python

Bài 8: Tháo tác làm việc với cơ sở dữ liệu

Bài 9: Tìm hiểu thao tác làm việc với mảng qua thư viện Numpy

Bài 10: Thao tác quản lý dữ liệu với Pandas

Bài 11: Tổng kết khóa học

Kết quả đạt được:

  • Tiếp cận làm việc và thực hành với Python từ con số 0
  • Kiến thức nền tảng nhất về ngôn ngữ lập trình Python cho đến ứng dụng Python nâng cao vào các tình huống thực tế
  • Nắm được các kiến thức có trong khóa học lập trình Python: biểu thức trong Python, đối tượng String, List, Tuples, Sets và Dictionary, hàm tự định nghĩa, module trong Python…

Bài 1: Giới thiệu Power BI; Cài đặt Power BI Desktop; Làm quen giao diện Power BI Desktop

Bài 2: Chuẩn hóa dữ liệu bằng Query Editor; Chuẩn hóa dữ liệu, kết hợp nhiều nguồn dữ liệu thành 1 nguồn

Bài 3: Mô hình dữ liệu, liên kết nhiều bảng để phân tích

Bài 4: Giới thiệu về DAX; các hàm tính toán DAX cơ bản

Bài 5: DAX Nâng Cao

Bài 6: Xây dựng báo cáo: Giới thiệu về biểu đồ (Visualization); Hướng dẫn chọn biểu đồ phù hợp trong phân tích

Bài 7: Giới thiệu Power BI Service. Làm quen với Dashboard

Bài 8: Project Sales Analytics: Phân tích dữ liệu kinh doanh trong doanh nghiệp (Pt 1)

Bài 9: Project Sales Analytics: Phân tích dữ liệu kinh doanh trong doanh nghiệp (Pt 2)

Bài 10: Project Human Resource Analytics: Phân tích dữ liệu nhân sự trong doanh nghiệp (Pt 1)

Bài 11: Project Human Resource Analytics: Phân tích dữ liệu nhân sự trong doanh nghiệp (Pt 2)

Bài 12: Tổng kết: Dự án cuối khóa & chia sẻ kinh nghiệm tổng kết

Kết quả đạt được:

  • Nắm bắt tư duy về phân tích và sử dụng dữ liệu ra quyết định trong doanh nghiệp
  • Kết nối nhiều nguồn số liệu, liên kết & chuẩn hóa dữ liệu
  • Xây dựng báo cáo vài phút thông qua kéo thả
  • Biết cách lựa chộn biểu đồ phù hợp với từng tình huống trong thực tế
  • Thành thục các thao tác tùy chỉnh biểu đồ (format) và sử dụng thư viện 1000+ biểu đồ mới của Microsoft (free)
  • Tự xây dựng thêm nhiều chỉ tiêu tính toán mới (dùng DAX) nhanh chóng, đơn giản
  • Xây dựng, thiết kế mẫu báo cáo phổ biến, thường dùng như: Sales, HR,..

Bài 1: Tổng quan PL/SQL, cài đặt SQL Developer để thao tác với CSDL

Bài 2: Các lệnh cơ bản trong PL/SQL: rẽ nhánh If then else, Vòng lặp: For loop / Loop / while loop, Con trỏ Cursor

Bài 3: Các hàm nâng cao: Merge, Ranking Function, Analytic Function…

Bài 4: Sequence, Xử lý tiến trình trong SQL(Transaction)

Bài 5: Lập trình thủ tục (Procedure), Hàm (Function)

Bài 6: Lập trình Package, Trigger

Bài 7: Tối ưu hiệu nặng CSDL với Index,Partition

Bài 8: Tổng kết: Dự án cuối khóa & chia sẻ kinh nghiệm tổng kết

Kết quả đạt được:

  • Sử dụng thành thạo ngôn ngữ PL/SQL
  • Tạo và sử dụng Store Procedure, Function, Package và Trigger
  • Xây dựng các kiểu dữ liệu cấu trúc phức tạp và kiểu dữ liệu con trỏ
  • Sử dụng thành thạo các Package có sẵn trong môi trường phát triển ứng dụng Oracle
  • Tối ưu thiết kế của CSDL để tăng hiệu năng hệ thống
  • Tăng tốc và tối ưu các câu lệnh giúp chạy nhanh gấp nhiều lần.
  • Phát triển các báo cáo bằng SQL 

Yêu cầu: đã biết về SQL cơ bản (Level 1)

  1. Giới thiệu về Data Warehouse – Kho dữ liệu
    Kiến trúc tổng thể, vai trò các thành phần, thuật ngữ chuyên ngành
    Giới thiệu về Data Model sử dụng trong Kho dữ liệu
  2. Thiết lập hệ thống và cấu hình môi trường
  3. Giai đoạn 1: ETL dữ liệu từ Nguồn vào vùng tạm (Staging)
  4. Giai đoạn 2: ETL từ vùng Tạm (Staging) vào DataWarehouse
  5. Giai đoạn 3: ETL từ DataWarehouse vào DataMart
  6. Giai đoạn 3 (tiếp): Xây dựng luồng ETL cho cả doanh nghiệp
  7. Giai đoạn 4: Phát triển báo cáo BI (sử dụng Microsoft Power BI)
  8. Mô hình dữ liệu trong DWH: Giới thiệu về các loại Dim và Fact. Cơ chế SCD Type 2
  9. Tích hợp dữ liệu thông qua API đưa vào Data Lake, Datawarehouse
  10. Tổng kết, dự án cuối khóa và chia sẻ kinh nghiệm

Kết quả đạt được:

  • Hiểu rõ quy trình thiết kế kho dữ liệu Data Warehouse từ đầu đến cuối.
  • Nắm bắt được mô hình dữ liệu Star Schema phổ biến trong DWH
  • Hiểu rõ kiến trúc của ETL (Oracle Data Integrator 12c)
  • Phát triển các job ETL, các thủ tục để đồng bộ dữ liệu từ nhiều nguồn về kho dữ liệu
  • Xây dựng đa luồng, chạy song song các job ETL để tối ưu hiệu quả
  • Xây các Datamart phục vụ báo cáo phân tích BI
  • Phát triển báo cáo thông minh BI (sử dụng PowerBI) hỗ trợ ra quyết định

Yêu cầu: đã biết về SQL cơ bản (Level 1)

Bài 1: Tổng quan về cơ sở dữ liệu;

Bài 2: Thiết kế mô hình thực thể liên kết (ERD) & mô hình mô tả tiến trình

Bài 3: Chuyển mô hình thực thể liên kết ERD thành thiết kế mức logic

Bài 4: Chuyển thiết kế mức logic thành thiết kế mức vật lý (mức bảng, cột trong CSDL)

Bài 5: Thực hành thêm các dự án thực tế

Bài 6: Chuẩn hóa CSDL

Bài 7: Tổng kết, dự án cuối khóa và chia sẻ kinh nghiêm

Kết quả đạt được:

  • Hiểu rõ quy trình thiết kế Data Model
  • Thành thạo cách chuyển đổi giữa các chuẩn thiết kế
  • Hiểu được cách thức tổ chức, lưu trữ thông tin, tối ưu thiết kế.
  • Thiết kế được các hệ thống database cho nhiều ứng dụng khác nhau(Application)
  • Nắm được thiết kế Data model, tiền đề cho xây dựng kho dữ liệu (data warehouse) 

Bài 1: Giới thiệu DBT & Kiến trúc tổng quan

Bài 2: Cấu trúc thư mục DBT & DBT run

Bài 3: Source – Nguồn dữ liệu

Bài 4: Testing dữ liệu

Bài 5: Seed data & Intermediate layer

Bài 6: Marts layer & Data Mart logic

Bài 7: Materializations

Bài 8: Snapshot & SCD Type 2

Bài 9: Jinja cơ bản và sử dụng trong DBT

Bài 10: Macro & Custom logic

Bài 11: Tài liệu hóa & Lineage

Bài 12: Hooks & Operations

Bài 13: CI/CD với Git & DBT Cloud/Core

Bài 14: Dự án tổng hợp

Bài 15: Trình bày & Tổng kết

Kết quả đạt được:

  • Hiểu kiến trúc tổng thể và quy trình vận hành của DBT.
  • Tổ chức và xây dựng dự án DBT chuẩn, sử dụng dbt run, dbt test, snapshot, seed,…
  • Mô hình hóa dữ liệu theo từng lớp: source → staging → marts, áp dụng chuẩn dim_, fact_.
  • Viết test dữ liệu, kiểm thử logic nghiệp vụ và đảm bảo chất lượng pipeline.
  • Sử dụng Jinja để viết model linh hoạt, tái sử dụng logic với macro.
  • Tài liệu hóa model, cột, lineage bằng dbt docs.
  • Ứng dụng hooks, operations và triển khai CI/CD với Git.
  • Thực hành dự án thực tế: xây dựng pipeline hoàn chỉnh từ source đến data mart.

Bài 1: Giới thiệu tổng quan về AWS

  • Giới thiệu về các dịch vụ cơ bản của Amazon Web Service (AWS) 
  • Hạ tầng toàn cầu của AWS 
  • Hướng dẫn tạo tài khoản, tính phí trên AWS

Bài 2: Giới thiệu về IAM, EC2 trong AWS

  • Nắm vững các kiến thức cơ bản về 2 core services : IAM, EC2 trên AWS 
  • Tạo và phân quyền trên IAM Khởi tạo, connect và xử lý trên EC2

Bài 3: Làm việc với Serverless,S3 trong AWS

  • Nắm được khái niệm và thực hành về 1 số dịch vụ Serverless: Lambda,… 
  • Hiểu được cách lưu trữ,xử lý dữ liệu trên S3

Bài 4: Giới thiệu một số Databases và RDS trong AWS

  • Giới thiệu về 1 số Databases trên AWS 
  • Khái niêm, khởi tạo Database 
  • Thực hành kết nối Database trên RDS

Bài 5: Quản trị hệ thống Redshift, DynamoDB, DocumentDB

  • Năm được khái niệm và kiến trúc trong Redshift
  • Nắm được cách đưa dữ liệu vào Redshift
  • Thực hành với DynamoDB, DocumentDB, Redshift

Bài 6: AWS DMS (Đồng bộ dữ liệu từ nhiều hệ thống với AWS)

  • Hiểu và nắm vững kiến thức, kiến trúc về DMS 
  • Thực hành kéo dữ liệu  giữa các Databases

Bài 7: ETL, Orchestration services: EMR, Glue, Stepfunction

  • Hiểu được khái niệm và cách sử dụng AWS Glue,EMR, Stepfunction 
  • Nắm được các các thành phần trong AWS Glue: Glue crawler, Glue Data Catalog, Glue ETL,… 
  • Thực hành Stepfunction với Glue

Bài 8: Tổng kết

  • Tổng kết, dự án cuối khóa và chia sẻ kinh nghiêm

Kết quả đạt được:

  • Thao tác và làm việc tốt với các tác vụ về kỹ thuật dữ liệu trên nền tảng điện toán đám mây AWS
  • Nắm được kiến thức về các services quan trọng trên AWS: IAM, S3, EC2,RDS,Glue, Stepfunction…
  • Hiểu biết về cơ sở hạ tầng toàn cầu AWS
  • Hiểu biết về các nguyên tắc kiến trúc cơ bản của việc xây dựng trên AWS
  • Khả năng xác định dịch vụ AWS đáp ứng yêu cầu kỹ thuật nhất định
  • Kiến thức về các phương pháp hay được đề xuất để xây dựng các ứng dụng an toàn và đáng tin cậy trên nền tảng AWS

Bài 1: Giới thiệu về Big data – Dữ liệu lớn

  • Giới thiệu về Big Data – Dữ liệu lớn 
  • Khái niệm, tiếp cận, xử lý và quản lý dữ liệu lớn 
  • Giới thiệu nền tảng công nghệ xử lý big data

Bài 2: Giới thiệu và làm việc với Hadoop

  • Kiến trúc tổng thể, vai trò các thành phần trong Hadoop 
  • Nắm được các thành phần cơ bản của Hadoop như: HDFS, YARN, Map Reduce,…

Bài 3: Quản lý và xử lý dữ liệu trong Big Data

  • Hiểu rõ về các vấn đề quan trọng cần phải chú ý khi quản lý một môi trường Big Data. 
  • BIết về khái niệm Big Data Pipeline. 
  • Biết các phép chuyển đổi dữ liệu thường dùng.

Bài 4: Giới thiệu về Spark

  • Nắm được khái niệm và các thành phần quan trọng về Spark. 
  • Cài đặt và chạy một ứng dụng Spark cơ bản.

Bài 5: Bigdata với Spark

Bài 6: Làm việc với Hive trong Bigdata

  • Hiểu được kiến trúc tổng thể, vai trò và cách sử dụng hiệu quả Hive

Bài 7: Giới thiệu về Airflow

  • Kiến trúc tổng thể, vai trò của airflow trong triển khai dữ liệu 
  • Hướng dẫn cài đặt và triển khai jobs trên airflow

Bài 8: Tổng kết

  • Tổng kết, dự án cuối khóa và chia sẻ kinh nghiêm

Kết quả đạt được:

  • Nắm vững đặc điểm và các thành phần của Bigdata
  • Nắm vững các kỹ thuật xử lý và phân tích dữ liệu lớn
  • Làm việc với Hadoop, Spark, Hive, Airflow, Big Data Technology mới nhất
  • Áp dụng ML với Big Data
  • Vận dụng các kỹ thuật phân tích dữ liệu lớn để mang lại các số liệu thống kê theo yêu cầu của doanh nghiệp.
  • Cơ hội việc làm ổn định tại các công ty xử lý và phân tích dữ liệu lớn trong ngoài nước

GIẢNG VIÊN TẠI INDAACADEMY

PHẢN HỒI HỌC VIÊN VÀ ẢNH THỰC TẾ

DOANH NGHIỆP LIÊN KẾT

CÂU HỎI THƯỜNG GẶP (FAQs)

Có. Nội dung khóa học được thiết kế từ cơ bản đến nâng cao, tập trung vào tư duy và thực hành, giúp người mới vẫn có thể theo kịp và học hiệu quả.

Khóa học tập trung vào thực hành với các bài toán dữ liệu thực tế, giúp học viên hiểu cách áp dụng kiến thức vào công việc thay vì chỉ học lý thuyết.

Sau khóa học, học viên có thể ứng tuyển các vị trí Analytics Engineer, Junior Analytics Engineer hoặc các vai trò liên quan trong nhiều phòng ban doanh nghiệp.

INDA Academy hỗ trợ kết nối thực tập và giới thiệu cơ hội việc làm phù hợp thông qua mạng lưới doanh nghiệp đối tác, giúp học viên tăng cơ hội ứng tuyển sau khi hoàn thành khóa học.

Có. INDA Academy hỗ trợ học viên định hướng lộ trình nghề nghiệp, xây dựng CV, portfolio và chuẩn bị kỹ năng phỏng vấn cho vị trí Data Analyst.

Học phí sẽ được cập nhật theo từng đợt khai giảng và đi kèm với các chương trình ưu đãi khác nhau (giảm giá sớm, học bổng đặc biệt, ưu đãi đăng ký combo, ưu đãi nhóm, ưu đãi giới thiệu…). Để biết chính xác mức học phí sau ưu đãi hiện tại, bạn chỉ cần để lại thông tin – đội ngũ tư vấn của INDA Academy sẽ liên hệ ngay để hỗ trợ 1:1. Ngoài ra, INDA Academy có chính sách trả góp học phí linh hoạt, giúp bạn dễ dàng theo học mà không áp lực tài chính.