Khóa học Big Data Engineer

CHINH PHỤC MỨC LƯƠNG KHỦNG NGHỀ DATA ENGINEER ?

Dữ liệu lớn (Big Data) là một thuật ngữ đề cập đến việc xử lý một tập hợp dữ liệu rất lớn và phức tạp mà các ứng dụng xử lý dữ liệu truyền thống không xử lý được. Dữ liệu lớn bao gồm việc phân tích, thu thập, giám sát dữ liệu, tìm kiếm, chia sẻ, lưu trữ, truyền nhận, trực quan, truy vấn và tính riêng tư.

Ảnh-chụp-màn-hình-2021-11-09-lúc-15_optimized_optimized_optimized_optimized.47.38

Lộ trình đào tạo Big Data Engineer từ cơ bản tới nâng cao với chỉ thời gian gian 6 tháng đào tạo.

Data Engineer là nghề tiềm năng, hái ra tiền nhưng cũng không dễ dàng. Hãy đảm bảo bạn sẵn sàng quyết tâm để theo đuổi nó tới cùng!!

Yêu cầu

Thích công nghệ thông tin. Thích phân tích dữ liệu. Độ tuổi: 18 tuổi

Hình thức học

Mentor hướng dẫn 1:1

Số buổi

8 buổi/khoá

Thời gian học

Tất cả các ngày trong tuần

ĐẶC ĐIỂM NỔI BẬT KHÓA HỌC

Support học viên trọn đời

Bạn sẽ được cầm tay chỉ việc bởi đội ngũ giảng viên giàu kinh nghiệm đến từ các công ty công nghệ hàng đầu, đội ngũ mentor sẵn sàng support, fix bug xuyên màn đêm cùng học viên 24/7.  Inda luôn RECORD lại bài giảng để học viên xem lại bất cứ khi nào muốn  

Hỗ trợ phỏng vấn

Sau khi kết thúc khoá học, bạn sẽ được INDA tư vấn nghề nghiệp, hướng đi cho công việc. Hỗ trợ phỏng vấn và viết CV,…

08ce629413ebe6b5bffa3

Học thực chiến

Học thực chiến, bám sát với yêu cầu tuyển dụng của doanh nghiệp. 30% lý thuyết và 70% thực hành; thuyết trình và bảo vệ sản phẩm cuối khoá, phát triển toàn diện các kỹ năng của bản thân! 

Bạn sẽ thực tập 1 tháng với các dự án thật giúp có thể bắt tay vào ngay công việc và nhận được nhiều cơ hội tại các công ty lớn.

KHOÁ HỌC BIG DATA ENGINEER/ MACHINE LEARNING

Bài 1: Oracle Database

  •  
  • Cài đặt Oracle 19C, tạo Schema THUC_TAP
  • Giả lập 1 file dữ liệu khách hàng (Mã khách hàng, tên KH, SDT, ngày tháng năm sinh) bằng Excel hoặc CSV. 
  • Import dữ liệu vào schema “”THUC_TAP”” vừa tạo ở trên”
  • Tìm kiếm trên Internet và import Data Sample của Oracle
  • Export 1 hoặc nhiều Schema
  • Import 1 hoặc nhiều Schema vừa Export bên trên
  • Lập trình 1 function / procedure / package. Sau đó đặt lịch của database chạy các Function / procedure / package
  • Nâng cao: Cài đặt, tắt bật EM để Giám sát cơ sở dữ liệu
  • Nâng cao: Thêm sửa xóa listener nhiều lần, tắt bật lại Oracle DB
  • Nâng cao: Thống kê và tối ưu bằng AWR
  • Nâng cao: Thiết lập phân quyền (Administering User Security)
  • Nâng cao: Backup toàn bộ Database

Bài 2: ETL Data

  •  
  • Cài đặt ODI 12c
  • Cài đặt Agent bằng weblogic
  • Cài đặt Apache Airflow, Talend,  Mulesoft, Pentaho, AirByte, Apache Nifi, Apache Spark (Cài bản miễn phí)
  • Job 1: ETL dữ liệu từ file to DB
  • Job 2: ETL dữ liệu từ DB to DB
  • Job 3: ETL dữ liệu từ API to DB (API tự tìm kiếm trên mạng)
  • Tạo luồng Flow chạy Job theo 2 điều kiện: Tuần tự + song song
  • Lập lịch chạy cho ETL dữ liệu
  • Cấu hình mail để khi lỗi bắn mail về người vận hành

Bài 3: Data Lakehouse: HDFS/MinIO, Apache Spark/Flink, Trino/Presto

  • Cài đặt hệ thống và Cấu hình giữa các dịch vụ
  • Tạo 1 file PARQUET / AVRO từ internet rồi đưa vào MinIO
  • Truy vấn dữ liệu từ file trong MinIO
  • Crawling Data dùng python / Airflow để lấy dữ liệu phản hồi của khách hàng trên 1 sản phẩm của 1 Shop trên Shopee và lưu lên MinIO
  • Bóc tách: tên KH, sao, ngày comment dùng Python/ Trino / Spark / Airflow rồi ghi vào Oracle Database (tạo các table lưu kết quả)
  • Tạo báo cáo phân tích bằng Supperset / PowerBI
  • Nâng cao: Nếu quét tất cả sản phẩm của 1 Shop là điểm cộng

Bài 4: DBT

  • Dựng model bằng DBT chỏ vào: Database Oracle Sample Data
  • Dựng model bằng DBT chỏ vào: 1 file Json trên MinIO và Oracle Sample Data

Bài 5: Apache Iceberg

  • Đẩy dữ liệu từ MinIO vào Iceberg
  • Truy vấn Iceberg Data Lakehouse bằng PyIceberg / Hoặc dùng Trino

Bài 6: DevOps Tools

  • Kubernetes (K8s)
  • Apache Ambari

Bài 7: BI (Power BI)

  • Cài đặt Gateway, đồng bộ dữ liệu với Oracle Database
  • Demo toàn bộ tính năng AI của PowerBI

Bài 8: BI (Oracle OAS)

  • Cài đặt Oracle OAS
  • Tạo 1 báo cáo bằng BI Publisher. Tham khảo: https://indaacademy.vn/oracle/cach-tao-bao-cao-trong-bi-publisher/
  • Nâng cao: Phân quyền báo cáo trên OAS (BI Publisher)
  • Tạo 1 báo cáo bằng Oracle BIEE
  • Tạo 1 báo cáo bằng Data visualization của OAS
  • Demo tính năng sau:
  • https://www.youtube.com/watch?v=bsn9Keh61IY&list=PL6gBNP-Fr8KVzWmtFyWfDekHw5LVvTb6n
  • https://www.youtube.com/watch?v=uYIo4XURymI&list=PL6gBNP-Fr8KWGutKSRknReSrxC6x_LjmT”
  • Nâng cao: Backup OAS
  • Nâng cao: Xóa trắng server rồi cài lại từ đầu. Sau đó bung bản Backup

 Bài 9: BI (Super Set)

  • Dựng Superset
  • Kết nối nguồn dữ liệu Excel để kéo báo cáo
  • Kết nối nguồn dữ liệu Oracle database để kéo báo cáo

Kết quả đạt được:

  • Nắm vững được các kiến thức về Big Dât Engineer
  • Các kỹ thuật và công cụ khác nhau cả ở Onpreams và Cloud
  • Sử dụng và thực hành các công cụ ETL: Oracle ODI, Apache Airflow, Pentaho,…
  • Data Lakehouse: HDFS/MinIO, Apache Spark/Flink, Trino/Presto
  • Sử dụng các mệnh đề joins để ghép nối các bảng
  • Tính sum, average, min, max, các loại hàm đếm, groupby theo các tiêu chí
  • Trực quan hóa dữ liệu của bạn trong Google Data Studio, Power BI, Oracle OAS, Super Set

HỌC PHÍ

Big Data Engineer

Học phí: Liên hệ

Ưu đãi lên đến 40%

Hỗ trợ phỏng vấn và tư vấn nghề nghiệp

Bộ câu hỏi phỏng vấn

GIẢNG VIÊN TẠI INDA

Dao Kim Luc 1

Giảng viên INDA

ĐÀO KIM LỰC

Ha Vu Phuong CEO 1

Giảng viên INDA

HÀ VŨ PHƯỢNG

  • 7 năm triển khai kho dữ liệu trong nhiều lĩnh vực:

Ngân hàng: Xây dựng Kho dữ liệu cho Ngân hàng Vpbank, chuyển đổi báo cáo từ IBM Cognos cho BIDV,…

Bán lẻ: Xây dựng báo cáo Quản Trị Doanh nghiệp với Power BI, tích hợp dữ liệu kế toán Misa,…Vin Commerce trên nền tảng Google Bigquery và Microsoft Power BI.

Sản xuất & Phân phối như may Thành Công: xây dựng báo cáo Power BI trên nền tảng Oracle Cloud: Oracle Autonomous Data Warehouse; Oracle Analytics Cloud; Oracle ODI (ETL)

  • 5 năm kinh nghiệm xử lý dữ liệu & tối ưu các hệ thống lớn: Oracle Database, MS Server, Google BigQuery, Oracle Autonomous Data Warehouse
  • 4 năm kinh nghiệm về BI như: Power BI, Tableau, Google data studio, Oracle Cloud Analytics; ETL như: Talend, Microsoft SSIS, Oracle ODI
  • 12 năm kinh nghiệm triển khai Dự án Data Warehouse / BI cho ngân hàng, tập đoàn trong nhiều lĩnh vực khác nhau như: TechcomBank, VPBank, SeaBank, SacomBank, SCB bank, Ngân hàng nhà nước, Masan, Mobifone, ABIC, PTI, Vietnam Airlines, ACSV, Vin Commerce, TSG…

  • Đảm nhiệm nhiều vai trò quan trọng từ Data Architecture, Data Modeler, Project Manager, Solution Architecture tới các vị trí quản lý như Head of BI, BD Manager

  • Chuyên gia cao cấp về tư vấn & đào tạo công nghệ kho dữ liệu của hãng Oracle, Microsoft, Google tại Việt Nam

NHỮNG NƠI HỌC VIÊN ĐÃ ĐẶT CHÂN TỚI

1000+

Học viên tốt nghiệp có ngay công việc mơ ước

$500-$1200

Mức lương trung bình của một Data Analyst/Data Engineer

PHẢN HỒI HỌC VIÊN VÀ ẢNH THỰC TẾ

ĐÀO TẠO DOANH NGHIỆP

MỘT SỐ CÂU HỎI THƯỜNG GẶP

Bạn hoàn toàn có thể tham gia khóa học này tại học viện INDA. Khóa học được xây dựng theo lộ trình từ cơ bản tới nâng cao, phù hợp với mọi đối tượng học viên muốn theo học Big Data Engineer mà chưa có kiến thức nền tảng

  • Sinh viên chuyên ngành Kinh tế/CNTT năm 3 và năm 4 đại học muốn trở thành Data Analyst (DA)/Business Analyst (BA)/ Data Enginee (DE);
  • Đối tượng mới bắt đầu/chưa có nhiều kinh nghiệm muốn apply vào các vị trí liên quan đến phân tích dữ liệu
  • Những bạn đang đi làm và có định hướng chuyển đổi ngành nghề sang ngành Phân tích dữ liệu. 
  • Kỹ sư dữ liệu, nhà phát triển, nhà phân tích dữ liệu muốn tìm hiểu các nền tảng của GCP (Google Cloud Platform)

Online: Học trực tiếp với giảng viên qua các nền tảng Google Meet / Zoom /  Teams . Mỗi buổi học INDA luôn record lại và gửi cho học viên sau buổi học.

Offline: Vì tình hình dịch đang diễn biến phức tạp nên hiện tại INDA không tổ chức học offline

Vì tình hình dịch đang diễn biến phức tạp nên hiện tại INDA không tổ chức học offline. Chỉ tổ chức học Online học trực tiếp với giảng viên qua các nền tảng Google Meet / Zoom /  Teams . Mỗi buổi học INDA luôn record lại và gửi cho học viên sau buổi học.

INDA liên kết với hàng trăm doanh nghiệp để tuyển dụng nhân sự làm về dữ liệu. Inda sẽ hỗ trợ phỏng vấn, viết CV.. nên sau khi tốt nghiệp cơ hội thăng tiền rộng mở

Học viện INDA sẽ hỗ trợ đào tạo lại hoàn toàn miễn phí và không giới hạn số lần nếu bạn cảm thấy chưa nắm bắt được kiến thức.

Học viện INDA luôn cam kết MIỄN PHÍ HỌC LẠI không giới hạn đến khi bạn nắm rõ được kiến thức.