Như đã được trình bày trong chương Relationship trong MongoDB, để triển khai một cấu trúc cơ sở dữ liệu tiêu chuẩn hóa trong MongoDB, chúng ta sử dụng khái niệm Referenced Relationship, còn được gọi là Manual References, trong đó chúng ta thao tác để lưu giữ id của…
Relationship trong MongoDB tượng trưng cho cách các Document có mối liên quan với nhau. Relationship có thể được mô hình hóa thông qua phương thức Embeded và Referenced. Những Relationship này có thể là 1:1, 1:N, N:1, hoặc N:N. Chúng ta cùng xem xét trường hợp lưu giữ địa…
Khi bạn đang chuẩn bị một MongoDB Deployment, bạn nên hiểu cách ứng dụng của bạn đang được hỗ trợ trong Production. Việc phát triển một phương thức nhất quán và có thể lặp đi lặp lại để quản lý môi trường Deployment của bạn là một ý tưởng tốt,…
Lệnh mongodump trong MongoDB Để tạo Backup của cơ sở dữ liệu trong MongoDB, bạn nên sử dụng lệnh mongodump. Lệnh này sẽ dump tất cả dữ liệu của Server vào trong dump directory. Có nhiều tùy chọn có sẵn từ đó bạn có thể giới hạn lượng dữ liệu…
Sharding là gì? Shard trong MongoDB là một tiến trình lưu giữ các bản ghi dữ liệu qua nhiều thiết bị và nó là một phương pháp của MongoDB để đáp ứng yêu cầu về sự gia tăng dữ liệu. Khi kích cỡ của dữ liệu tăng lên, một thiết…
Replication là tiến trình đồng bộ hóa dữ liệu từ nhiều Server. Replication cung cấp sự dư thừa và tăng dữ liệu có tính khả dụng với nhiều bản sao dữ liệu trên nhiều Database Server khác nhau. Replication bảo vệ một cơ sở dữ liệu từ việc thất thoát…
Aggregation có thể hiểu là sự tập hợp. Các Aggregation operation xử lý các bản ghi dữ liệu và trả về kết quả đã được tính toán. Các phép toán tập hợp nhóm các giá trị từ nhiều Document lại với nhau, và có thể thực hiện nhiều phép toán…
Bạn biết gì về Big data, Hadoop, và Spark? Trong bài viết này là một dạng bài tìm hiểu overview về hai Big data framework này mà INDA sẽ chia sẻ cùng các bạn. Ngày nay chúng ta được bao bọc bởi dữ liệu từ số lượng vô cùng lớn…
Xử lý dữ liệu với Pandas Pandas là một Python thư viện cung cấp nhanh dữ liệu cấu trúc, mạnh mẽ, linh hoạt và mang ý nghĩa hàm. Thư viện tên được bắt nguồn từ dữ liệu bảng (table data). Pandas được thiết kế để làm việc dễ dàng và…
Numpy (Numeric Python): là một thư viện toán học phổ biến và mạnh mẽ của Python. Cho phép làm việc hiệu quả với ma trận và mảng, đặc biệt là dữ liệu ma trận và mảng lớn với tốc độ xử lý nhanh hơn nhiều lần khi chỉ sử dụng “core…