Apache Spark

Học Big Data Có Cần Biết Python Trước Không? Góc Nhìn Chuyên Gia & Lộ Trình Ngôn Ngữ Tối Ưu Nhất

Giới Thiệu: Ngôn Ngữ Nào Thống Trị Thế Giới Big Data? Big Data (Dữ liệu lớn) là một lĩnh vực rộng lớn, bao gồm các công nghệ thu thập, xử lý, lưu trữ và phân tích các tập dữ liệu khổng lồ. Để làm việc với Big Data, một ngôn…

Spark Streaming

Tổng quan Spark Streaming là một bộ mở rộng của core Spark API cho phép mở rộng, thông lượng cao, có khả năng chịu lỗi. Spark Streaming được thiết kế để xử lý dữ liệu dạng streams. Dữ liệu đầu vào từ Spark có thể lấy từ Kafka, Flume, Kinesis…

Spark SQL với DataFrame và DataSet

Spark SQL, DataFrame chính là những thành phần được sử dụng nhiều nhất trong tổng thể Framework Apache Spark. Có thể nói Spark SQL đã “phổ cập” tính toán phân tán cho 1 tập người dùng lớn hơn nhiều những Developer chỉ hằng ngày ngồi code, gọi những API nào…