Google BigQuery

BigQuery là một kho dữ liệu(data warehouse) trên nền tảng điện toán đám mây của Google (Google Cloud) cho phép bạn chạy các truy vấn siêu nhanh trên các tập dữ liệu lớn. BigQuery hoạt động dưới dạng Nền tảng là một dịch vụ (Platform as a Service – PaaS) trên hạ tầng của Google nên được thừa hưởng nhiều công nghệ hiện đại và tiên tiến. Nên BigQuery hiện nay đã trở thành một trong những DW được sử dụng nhiều nhất trên thế giới.

Tổng quan kiến trúc của BigQuery

Google BigQuery được phát hành phổ biến vào năm 2011 và là kho dữ liệu (Data Warehouse) doanh nghiệp của Google Cloud được thiết kế phục vụ cho sự linh hoạt trong kinh doanh. Kiến trúc không máy chủ cho phép nó vận hành ở quy mô mở rộng và tốc độ phân…

Tìm hiểu PIVOT trong BigQuery

Đôi khi, bạn muốn định dạng lại kết quả truy vấn của bảng để có các cột riêng biệt cho từng giá trị duy nhất. Đây được gọi là Pivot table, nó chỉ là một chức năng hiển thị được hỗ trợ bởi các công cụ BI. Tuy nhiên, đôi khi có…

Cách xuất dữ liệu ra File trong Google BigQuery

Việc xuất dữ liệu sang File từ BigQuery yêu cầu sử dụng Google Cloud Storage để lưu trữ tệp đã xuất. Sau khi tệp được lưu trữ trong Google Cloud Storage, bạn có thể tải xuống hoặc xuất tệp ở nơi khác nếu cần. Khi bạn đã tạo Cloud Storage, bạn cũng sẽ…

Tìm hiểu Partitioning & Clustering trong BigQuery

Trong bài đăng blog này, Inda sẽ giải thích các tính năng phân vùng (partitioning) và phân cụm (Clustering) trong BigQuery là gì và cách tăng hiệu suất truy vấn và giảm chi phí truy vấn của bạn. Partitioning Phân vùng (Partitioning) bảng có thể làm cho các truy vấn…

Window Functions trong Google Cloud Bigquery

Giới thiệu Trong Bigquery các Window Functions, hoặc các Analytic Functions là một hàm để tính các giá trị tổng hợp trên một nhóm các dòng . Chúng trả về một giá trị duy nhất cho mỗi dòng, ngược lại với các hàm tổng hợp (Aggregate function) trả về một giá trị…