Cá nhân, tổ chức hay doanh nghiệp bất kỳ đều có một lượng dữ liệu tiếp nhận và xử lý mỗi ngày liên quan đến các hoạt động việc làm diễn ra hằng ngày. Vì vậy con người cần phải có sự thống kê các dòng dữ liệu. Từ đó…
Mọi cơ sở dữ liệu (CSDL – database) đều được tạo ra theo cách không giống nhau, mỗi loại đều có ưu/nhược điểm riêng. Thực tế cho thấy những dạng database như MySQL, MongoDB đôi khi bị “lạm dụng” vì tính phổ biến của nó, bất chấp tính tương thích…
Là một tester, bạn có thể nghĩ rằng “Việc tạo testcase là đủ thách thức, vậy tại sao phải bận tâm về một thứ như test data?”. Mục đích của bài viết này là giới thiệu cho bạn hiểu nhiều hơn về kiểm thử dữ liệu, tầm quan trọng của nó…
Data Mart là một tập hợp con của kho thông tin tổng, thường hướng đến một mục đích cụ thể hoặc chủ đề dữ liệu chính có thể được phân phối để cung cấp nhu cầu kinh doanh. Data Marts là kho lưu trữ hồ sơ phân tích được thiết…
Google BigQuery được phát hành vào năm 2011 và là kho dữ liệu doanh nghiệp của Google Cloud, với mục tiêu là nhắm đến sự linh hoạt kinh doanh. Kiến trúc không máy chủ (serverless architecture) cho phép nó hoạt động ở quy mô và tốc độ lớn để cung cấp…
Trong ngôn ngữ truy vấn SQL, mệnh đề WHERE và HAVING được sử dụng rất nhiều. Tuy nhiên, vẫn có rất nhiều học viên bị nhầm lẫn và gặp khó khăn trong khi sử dụng 2 mệnh đề này. Bài viết dưới đây INDA Academy sẽ so sánh mệnh đề…
Trong những năm gần đây, Data Analytics và Data Science trở thành hai khái niệm được nhắc đến rất nhiều khi doanh nghiệp nói về dữ liệu. Tuy nhiên, không ít người mới tiếp cận lĩnh vực này vẫn còn nhầm lẫn giữa hai hướng, thậm chí cho rằng đây…
Chọn một ngôn ngữ lập trình giữa hàng chục ngôn ngữ khác trong lĩnh vực Big Data là phụ thuộc rất nhiều vào mục tiêu và từng dự án cụ thể. Tuy nhiên, với bất cứ mục tiêu nào. Khi xem xét chọn một ngôn ngữ lập trình cho dự án phát triển Big Data thì…
Khi tuyển Data Engineer, nhà tuyển dụng không xem CV giống cách họ xem CV Software Engineer. Họ tìm 3 thứ: Nếu CV không thể hiện rõ 3 yếu tố trên trong vòng 6–8 giây đầu, khả năng cao bị loại. Bài viết này hướng dẫn cách viết CV theo…
Vì công cụ và chuyên môn liên quan đến Pyspark ngày càng được săn đón trên thị trường, bài viết này cung cấp bộ câu hỏi phỏng vấn và câu trả lời bao quát toàn bộ chủ đề từ cơ bản đến nâng cao dành cho dân công nghệ và…
