Big data with Spark – Dữ liệu lớn với Spark

Banner khóa học BigData indaacademy

GIỚI THIỆU CHUNG

Trong môn học này các bạn sẽ được tìm hiểu về hệ thống tính toán và thuật toán xử lý dữ liệu để có đầy đủ kiến thức cho những công việc liên quan đến dữ liệu lớn. Về hệ thống tính toán, chúng ta sẽ tìm hiểu qua về Hadoop và đi sâu vào Apache Spark – hai nền tảng phổ biến nhất hiện nay trong xử lý dữ liệu lớn.

TỔNG QUAN KHÓA HỌC

Hình thức học

Mentor hướng dẫn 1 : 1 (Theo sát sao từng học viên)

Số buổi

8 buổi/khoá

Thời gian học

Lịch học linh hoạt (Học viên sắp xếp thời gian học với Mentor)

KIẾN THỨC NHẬN ĐƯỢC

✅ Nắm được kiến thức cơ bản về Big Data, đặc trưng của Big Data, cũng như những thách thức của Big Data trong thời đại ngày nay.

✅ Hiểu rõ phương pháp và công nghệ phổ biến để xử lý Big Data như công nghệ Airflow,MapReduce, Spark,…

✅ Nắm vững toàn bộ các kiến thức cơ bản về Big Data, đặc điểm kỹ thuật của các công nghệ MapReduce và Spark để xử lý Big Data, đồng thời có đủ sự am hiểu để đưa công nghệ Big Data vào ứng dụng trong các dự án liên quan tại doanh nghiệp

ĐỐI TƯỢNG THAM GIA

👉 Các chuyên gia cơ sở dữ liệu, những người cần kiến thức và công cụ để hoàn thành vai trò phát triển ứng dụng kinh doanh thông minh.

👉 Data Engineer / Lập trình viên liên quan cơ sở dữ liệu.

TẠI SAO LỰA CHỌN KHÓA HỌC TẠI INDAACADEMY

Cam kết giới thiệu
việc làm

Hỗ trợ giới thiệu việc làm với gần 100% học viên tốt nghiệp đều tìm được việc full-time.

Đội ngũ giảng viên

Đội ngũ giảng viên chuyên gia có kinh nghiệm 5-10 năm trong lĩnh vực.

Giáo trình
chuyên nghiệp

Lộ trình bài bản, kiến thức cô đọng, trọng tâm trong thời gian ngắn.

Học thật làm thật

Đào tạo lý thuyết và thực chiến các dự án của công ty, tập đoàn.

Khóa học Big Data With Spark - Dữ liệu lớn với Spark

Bài 1: Giới thiệu về Big Data – Dữ liệu lớn; Khái niệm, tiếp cận, xử lý và quản lý dữ liệu lớn;

Bài 2: Kiến trúc tổng thể, vai trò các thành phần trong Hadoop như: HDFS, YARN, Map Reduce,…

Bài 3: Quản lý và xử lý dữ liệu trong Big Data; Hiểu rõ về các vấn đề quan trọng cần phải chú ý khi quản lý một môi trường Big Data;

Bài 4: Giới thiệu về Spark; Nắm được khái niệm và các thành phần quan trọng về Spark;

Bài 5: Big Data với Spark

Bài 6: Giới thiệu Hive; Hiểu được kiến trúc tổng thể, vai trò và cách sử dụng hiệu quả Hive.

Bài 7: Giới thiệu về Airflow; Kiến trúc tổng thể, vai trò của airflow trong triển khai dữ liệu; Hướng dẫn cài đặt và triển khai jobs trên airflow.

Bài 8: Tổng kết, dự án cuối khóa và chia sẻ kinh nghiêm

Kết quả đạt được:

Khóa học Công nghệ Big Data trình bày những kiến thức cơ bản về Big Data, đặc trưng của Big Data, cũng như những thách thức của Big Data trong thời đại ngày nay.

Khóa học sẽ trình bày các phương pháp và công nghệ phổ biến để xử lý Big Data như công nghệ Airflow,MapReduce, Spark,…

Sau khi kết thúc khóa học, người học sẽ nắm vững toàn bộ các kiến thức cơ bản về Big Data, đặc điểm kỹ thuật của các công nghệ MapReduce và Spark để xử lý Big Data, đồng thời có đủ sự am hiểu để đưa công nghệ Big Data vào ứng dụng trong các dự án liên quan tại doanh nghiệp

GIẢNG VIÊN TẠI INDAACADEMY

PHẢN HỒI HỌC VIÊN VÀ ẢNH THỰC TẾ

DOANH NGHIỆP CHÚNG TÔI ĐÃ ĐÀO TẠO