Lộ trình đào tạo Data Engineer

LỘ TRÌNH TRỞ THÀNH DATA ENGINEER CHO NGƯỜI MỚI BẮT ĐẦU

Bỏ đi suy nghĩ không tự tin; hoang mang, mất định hướng công việc đến ngay INDA để nhận được sự tư vấn, định hướng và CAM KẾT GIỚI THIỆU VIỆC LÀM nhé!
Ảnh-chụp-màn-hình-2021-11-09-lúc-15_optimized_optimized_optimized_optimized.47.38

Tất cả các học viên tại INDA  đều tìm được việc làm tại các các doanh nghiệp trong nước và quốc tế ngay sau khi tốt nghiệp lộ trình học như: FIS Bank, SV Tech, iERP, VP bank, Techcombank, Seabank, MB Bank, VC corp,….. với mức lương khởi điểm từ 500 – 1200$
Dù bạn đang hướng tới các doanh nghiệp hàng đầu hay đơn giản là mong muốn có những chuyển biến vững chắc đầu tiên sau khi chuyển ngành, INDA sẽ đem tới cho bạn chương trình bám sát thực tế, định hướng công việc rõ ràng trong quá trình học và cam kết giới thiệu việc làm.

>>>Tham khảo thêm: Data engineer là gì? Công việc chính của DE? Các kỹ năng cần thiết

Yêu cầu

Đã có kiến thức nền tảng hoặc chưa (Kiểm tra đầu vào chọn lớp)

Hình thức học

Mentor hướng dẫn 1:1 ( Theo sát sao học viên)

Số buổi

6 tháng (50 buổi học)

Thời gian học

Lịch học linh hoạt (Học viên sắp xếp thời gian học với Mentor)

ĐẶC ĐIỂM NỔI BẬT KHÓA HỌC

Học thật làm thật

Trong lớp, học viên sẽ được thực hành thông qua dự án theo nhóm và giải tình huống thực tế. Tại INDA, bạn được học lý thuyết và áp dụng ngay vào việc làm dự án thực tế xuyên suốt kỳ học. Kết thúc khóa học bỏ túi ít nhất 3 dự án triển khai của công ty  

Học bài bản, đúng trọng tâm

Học viên được đào tạo theo lộ trình từ bài bản với những kiến thức cô đọng, trọng tâm trong thời gian ngắn để phục vụ cho làm việc thực tế tại các doanh nghiệp.

420870847_790779769758455_4150767296720783544_n
Cam kết giới thiệu việc làm

Được cam kết đầu ra, hỗ trợ giới thiệu việc làm, gần như 100% các bạn sinh viên có khả năng đi làm fulltime có việc ngay sau khi tốt nghiệp INDA.

LỘ TRÌNH DATA ENGINEER

Bài 1: Tổng quan về CSDL,SQL, Cài đặt tools thao tác với CSDL

Bài 2: Câu lệnh truy vấn (Query): Truy vấn dữ liệu đơn giản, truy vấn dữ liệu nâng cao: Where, Order By, Distinct, Alias

Bài 3: Cấu trúc và thao tác dữ liệu: Nhóm lệnh định nghĩa cấu trúc dữ liệu, nhóm lệnh thao tác với dữ liệu

Bài 4: Các hàm cơ bản: Hàm xử lý số, chuỗi, ngày/tháng, chuyển đổi, hàm tổng hợp

Bài 5: SQL Join: Giới thiệu về SQL Join: inner join, left join, right join, full join, cross join

Bài 6: SQL Join (Nâng cao): Join nhiều bảng (>5-7 bảng) kết hợp với các mệnh đề

Bài 7: Các chuyển đề khác: Subquery, sử dụng With, tạo View,..

Bài 8: Kết nối Power BI & Tổng kết: Dự án cuối khóa & chia sẻ kinh nghiệm tổng kết

Kết quả đạt được:

  • Hiểu cách tổ chức dữ liệu, phân tích và lợi ích của các bài toán phân tích dữ liệu;
  • Nắm được những KPI, chỉ tiêu, công thức tính toán, thống kê dữ liệu trong thực tế tại các doanh nghiệp
  • Thành thạo truy vấn, trích xuất, lọc dữ liệu từ CSDL, chèn các điều kiện vào để trích xuất dữ liệu đáp ứng 1 hoặc nhiều yêu cầu nào đó
  • Sử dụng các mệnh đề joins để ghép nối các bảng 
  • Tính sum, average, min, max, các loại hàm đếm, groupby theo các tiêu chí
  • Sử dụng các tables trung gian để tăng tốc độ đọc dữ liệu

Bài 1: Các khái niệm cơ bản trong lập trình Python

Bài 2: Biểu thức trong lập trình Python

Bài 3: Đối tượng String trong lập trình Python

Bài 4: Đối tượng List, Tuples, Sets và Dictionary

Bài 5: Thao tác với hàm tự định nghĩa trong lập trình Python

Bài 6: Hướng đối tượng và thao tác với File trong Python

Bài 7: Tìm hiểu về module và quản lý lỗi trong Python

Bài 8: Tháo tác làm việc với cơ sở dữ liệu

Bài 9: Tìm hiểu thao tác làm việc với mảng qua thư viện Numpy

Bài 10: Thao tác quản lý dữ liệu với Pandas

Bài 11: Tổng kết khóa học

Kết quả đạt được:

  • Tiếp cận làm việc và thực hành với Python từ con số 0
  • Kiến thức nền tảng nhất về ngôn ngữ lập trình Python cho đến ứng dụng Python nâng cao vào các tình huống thực tế
  • Nắm được các kiến thức có trong khóa học lập trình Python: biểu thức trong Python, đối tượng String, List, Tuples, Sets và Dictionary, hàm tự định nghĩa, module trong Python…

Bài 1: Tổng quan PL/SQL, cài đặt SQL Developer để thao tác với CSDL

Bài 2: Các lệnh cơ bản trong PL/SQL: rẽ nhánh If then else, Vòng lặp: For loop / Loop / while loop, Con trỏ Cursor

Bài 3: Các hàm nâng cao: Merge, Ranking Function, Analytic Function…

Bài 4: Sequence, Xử lý tiến trình trong SQL(Transaction)

Bài 5: Lập trình thủ tục (Procedure), Hàm (Function)

Bài 6: Lập trình Package, Trigger

Bài 7: Tối ưu hiệu nặng CSDL với Index,Partition

Bài 8: Tổng kết: Dự án cuối khóa & chia sẻ kinh nghiệm tổng kết

Kết quả đạt được:

  • Sử dụng thành thạo ngôn ngữ PL/SQL
  • Tạo và sử dụng Store Procedure, Function, Package và Trigger
  • Xây dựng các kiểu dữ liệu cấu trúc phức tạp và kiểu dữ liệu con trỏ
  • Sử dụng thành thạo các Package có sẵn trong môi trường phát triển ứng dụng Oracle
  • Tối ưu thiết kế của CSDL để tăng hiệu năng hệ thống
  • Tăng tốc và tối ưu các câu lệnh giúp chạy nhanh gấp nhiều lần.
  • Phát triển các báo cáo bằng SQL 

Yêu cầu: đã biết về SQL cơ bản (Level 1)

  1. Giới thiệu về Data Warehouse – Kho dữ liệu
    Kiến trúc tổng thể, vai trò các thành phần, thuật ngữ chuyên ngành
    Giới thiệu về Data Model sử dụng trong Kho dữ liệu
  2. Thiết lập hệ thống và cấu hình môi trường
  3. Giai đoạn 1: ETL dữ liệu từ Nguồn vào vùng tạm (Staging)
  4. Giai đoạn 2: ETL từ vùng Tạm (Staging) vào DataWarehouse
  5. Giai đoạn 3: ETL từ DataWarehouse vào DataMart
  6. Giai đoạn 3 (tiếp): Xây dựng luồng ETL cho cả doanh nghiệp
  7. Giai đoạn 4: Phát triển báo cáo BI (sử dụng Microsoft Power BI)
  8. Mô hình dữ liệu trong DWH: Giới thiệu về các loại Dim và Fact. Cơ chế SCD Type 2
  9. Tích hợp dữ liệu thông qua API đưa vào Data Lake, Datawarehouse
  10. Tổng kết, dự án cuối khóa và chia sẻ kinh nghiệm

Kết quả đạt được:

  • Hiểu rõ quy trình thiết kế kho dữ liệu Data Warehouse từ đầu đến cuối.
  • Nắm bắt được mô hình dữ liệu Star Schema phổ biến trong DWH
  • Hiểu rõ kiến trúc của ETL (Oracle Data Integrator 12c)
  • Phát triển các job ETL, các thủ tục để đồng bộ dữ liệu từ nhiều nguồn về kho dữ liệu
  • Xây dựng đa luồng, chạy song song các job ETL để tối ưu hiệu quả
  • Xây các Datamart phục vụ báo cáo phân tích BI
  • Phát triển báo cáo thông minh BI (sử dụng PowerBI) hỗ trợ ra quyết định

Yêu cầu: đã biết về SQL cơ bản (Level 1)

Bài 1: Tổng quan về cơ sở dữ liệu;

Bài 2: Thiết kế mô hình thực thể liên kết (ERD) & mô hình mô tả tiến trình

Bài 3: Chuyển mô hình thực thể liên kết ERD thành thiết kế mức logic

Bài 4: Chuyển thiết kế mức logic thành thiết kế mức vật lý (mức bảng, cột trong CSDL)

Bài 5: Thực hành thêm các dự án thực tế

Bài 6: Chuẩn hóa CSDL

Bài 7: Tổng kết, dự án cuối khóa và chia sẻ kinh nghiêm

Kết quả đạt được:

  • Hiểu rõ quy trình thiết kế Data Model
  • Thành thạo cách chuyển đổi giữa các chuẩn thiết kế
  • Hiểu được cách thức tổ chức, lưu trữ thông tin, tối ưu thiết kế.
  • Thiết kế được các hệ thống database cho nhiều ứng dụng khác nhau(Application)
  • Nắm được thiết kế Data model, tiền đề cho xây dựng kho dữ liệu (data warehouse) 

Bài 1: Giới thiệu về Big data – Dữ liệu lớn

  • Giới thiệu về Big Data – Dữ liệu lớn 
  • Khái niệm, tiếp cận, xử lý và quản lý dữ liệu lớn 
  • Giới thiệu nền tảng công nghệ xử lý big data

Bài 2: Giới thiệu và làm việc với Hadoop

  • Kiến trúc tổng thể, vai trò các thành phần trong Hadoop 
  • Nắm được các thành phần cơ bản của Hadoop như: HDFS, YARN, Map Reduce,…

Bài 3: Quản lý và xử lý dữ liệu trong Big Data

  • Hiểu rõ về các vấn đề quan trọng cần phải chú ý khi quản lý một môi trường Big Data. 
  • BIết về khái niệm Big Data Pipeline. 
  • Biết các phép chuyển đổi dữ liệu thường dùng.

Bài 4: Giới thiệu về Spark

  • Nắm được khái niệm và các thành phần quan trọng về Spark. 
  • Cài đặt và chạy một ứng dụng Spark cơ bản.

Bài 5: Bigdata với Spark

Bài 6: Làm việc với Hive trong Bigdata

  • Hiểu được kiến trúc tổng thể, vai trò và cách sử dụng hiệu quả Hive

Bài 7: Giới thiệu về Airflow

  • Kiến trúc tổng thể, vai trò của airflow trong triển khai dữ liệu 
  • Hướng dẫn cài đặt và triển khai jobs trên airflow

Bài 8: Tổng kết

  • Tổng kết, dự án cuối khóa và chia sẻ kinh nghiêm

Kết quả đạt được:

  • Nắm vững đặc điểm và các thành phần của Bigdata
  • Nắm vững các kỹ thuật xử lý và phân tích dữ liệu lớn
  • Làm việc với Hadoop, Spark, Hive, Airflow, Big Data Technology mới nhất
  • Áp dụng ML với Big Data
  • Vận dụng các kỹ thuật phân tích dữ liệu lớn để mang lại các số liệu thống kê theo yêu cầu của doanh nghiệp.
  • Cơ hội việc làm ổn định tại các công ty xử lý và phân tích dữ liệu lớn trong ngoài nước

Bài 1: Giới thiệu tổng quan về AWS

  • Giới thiệu về các dịch vụ cơ bản của Amazon Web Service (AWS) 
  • Hạ tầng toàn cầu của AWS 
  • Hướng dẫn tạo tài khoản, tính phí trên AWS

Bài 2: Giới thiệu về IAM, EC2 trong AWS

  • Nắm vững các kiến thức cơ bản về 2 core services : IAM, EC2 trên AWS 
  • Tạo và phân quyền trên IAM Khởi tạo, connect và xử lý trên EC2

Bài 3: Làm việc với Serverless,S3 trong AWS

  • Nắm được khái niệm và thực hành về 1 số dịch vụ Serverless: Lambda,… 
  • Hiểu được cách lưu trữ,xử lý dữ liệu trên S3

Bài 4: Giới thiệu một số Databases và RDS trong AWS

  • Giới thiệu về 1 số Databases trên AWS 
  • Khái niêm, khởi tạo Database 
  • Thực hành kết nối Database trên RDS

Bài 5: Quản trị hệ thống Redshift, DynamoDB, DocumentDB

  • Năm được khái niệm và kiến trúc trong Redshift
  • Nắm được cách đưa dữ liệu vào Redshift
  • Thực hành với DynamoDB, DocumentDB, Redshift

Bài 6: AWS DMS (Đồng bộ dữ liệu từ nhiều hệ thống với AWS)

  • Hiểu và nắm vững kiến thức, kiến trúc về DMS 
  • Thực hành kéo dữ liệu  giữa các Databases

Bài 7: ETL, Orchestration services: EMR, Glue, Stepfunction

  • Hiểu được khái niệm và cách sử dụng AWS Glue,EMR, Stepfunction 
  • Nắm được các các thành phần trong AWS Glue: Glue crawler, Glue Data Catalog, Glue ETL,… 
  • Thực hành Stepfunction với Glue

Bài 8: Tổng kết

  • Tổng kết, dự án cuối khóa và chia sẻ kinh nghiêm

Kết quả đạt được:

  • Thao tác và làm việc tốt với các tác vụ về kỹ thuật dữ liệu trên nền tảng điện toán đám mây AWS
  • Nắm được kiến thức về các services quan trọng trên AWS: IAM, S3, EC2,RDS,Glue, Stepfunction…
  • Hiểu biết về cơ sở hạ tầng toàn cầu AWS
  • Hiểu biết về các nguyên tắc kiến trúc cơ bản của việc xây dựng trên AWS
  • Khả năng xác định dịch vụ AWS đáp ứng yêu cầu kỹ thuật nhất định
  • Kiến thức về các phương pháp hay được đề xuất để xây dựng các ứng dụng an toàn và đáng tin cậy trên nền tảng AWS

Cùng INDA thiết kế lộ trình học dành riêng cho bạn

Đội ngũ giảng viên, Metor giàu kinh nghiệm tại INDA

NHỮNG NƠI HỌC VIÊN ĐÃ ĐẶT CHÂN TỚI

1000+

Học viên tốt nghiệp có ngay công việc mơ ước

$500-$1200

Mức lương trung bình của một Data Analyst/Data Engineer

PHẢN HỒI HỌC VIÊN VÀ ẢNH THỰC TẾ

DOANH NGHIỆP CHÚNG TÔI ĐÃ ĐÀO TẠO

MỘT SỐ CÂU HỎI THƯỜNG GẶP

Online: Học trực tiếp với giảng viên qua các nền tảng Google Meet / Zoom /  Teams . Mỗi buổi học INDA luôn record lại và gửi cho học viên sau buổi học.

Offline: Vì tình hình dịch đang diễn biến phức tạp nên hiện tại INDA không tổ chức học offline

Vì tình hình dịch đang diễn biến phức tạp nên hiện tại INDA không tổ chức học offline. Chỉ tổ chức học Online học trực tiếp với giảng viên qua các nền tảng Google Meet / Zoom /  Teams . Mỗi buổi học INDA luôn record lại và gửi cho học viên sau buổi học.

Sau khi kết thúc lộ trình, bạn sẽ được INDA giới thiệu việc ngay tại các công ty, doanh nghiệp là đối tác của INDA (gần 200 công ty), phù hợp với định hướng của bản thân.

Học viện INDA sẽ hỗ trợ đào tạo lại hoàn toàn miễn phí và không giới hạn số lần nếu bạn cảm thấy chưa nắm bắt được kiến thức.

Học viện INDA luôn cam kết MIỄN PHÍ HỌC LẠI không giới hạn đến khi bạn nắm rõ được kiến thức.

Liên hệ với chúng tôi

    Xin vui lòng điền vào form dưới đây. Chúng tôi sẽ liên hệ lại ngay cho bạn khi nhận được thông tin: