Blog

Các loại Database Parallelism

Song song được sử dụng để hỗ trợ tăng tốc, trong đó các truy vấn được thực thi nhanh hơn vì nhiều tài nguyên hơn, chẳng hạn như bộ xử lý và đĩa, được cung cấp. Song song cũng được sử dụng để mở rộng quy mô, trong đó khối lượng công việc ngày càng tăng được quản lý mà không tăng thời gian phản hồi, thông qua việc tăng mức độ song song.

Các kiến ​​trúc khác nhau cho các hệ thống cơ sở dữ liệu song song là bộ nhớ dùng chung, đĩa dùng chung, không chia sẻ gì và cấu trúc phân cấp.

(a) Horizontal Parallelism: Có nghĩa là cơ sở dữ liệu được phân vùng trên nhiều đĩa và quá trình xử lý song song xảy ra trong một tác vụ cụ thể (tức là quét bảng) được thực hiện đồng thời trên các bộ xử lý khác nhau dựa trên các bộ dữ liệu khác nhau.

(b) Vertical Parallelism: Nó xảy ra giữa các nhiệm vụ khác nhau. Tất cả các hoạt động truy vấn thành phần (tức là quét, nối và sắp xếp) được thực hiện song song theo kiểu xoay vòng. Nói cách khác, một kết quả đầu ra từ một hàm (ví dụ: tham gia) ngay khi có bản ghi.

Intraquery Parallelism

Tính song song trong truy vấn xác định việc thực hiện song song một truy vấn đơn lẻ trên nhiều bộ xử lý và đĩa. Sử dụng song song truy vấn nội bộ là điều cần thiết để tăng tốc các truy vấn chạy dài.

Tính song song của truy vấn không giúp ích gì trong chức năng này vì mỗi truy vấn được chạy tuần tự.

Để cải thiện tình hình, nhiều nhà cung cấp DBMS đã phát triển các phiên bản sản phẩm của họ sử dụng song song truy vấn nội bộ.

Ứng dụng song song này phân tách SQL nối tiếp, truy vấn thành các hoạt động cấp thấp hơn như quét, nối, sắp xếp và tổng hợp.

Các hoạt động cấp thấp hơn này được thực hiện đồng thời, song song.

Interquery Parallelism

Trong song song giữa các truy vấn, các truy vấn hoặc giao dịch khác nhau thực hiện song song với nhau.

Hình thức song song này có thể tăng thông lượng giao dịch. Thời gian phản hồi của các giao dịch riêng lẻ không nhanh hơn so với thời gian nếu các giao dịch được thực hiện một cách cô lập.

Do đó, ứng dụng chính của song song giữa các truy vấn là mở rộng quy mô hệ thống xử lý giao dịch để hỗ trợ số lượng giao dịch đáng kể hơn mỗi giây.

Các nhà cung cấp cơ sở dữ liệu bắt đầu tận dụng các kiến ​​trúc phần cứng song song bằng cách triển khai các hệ thống đa máy chủ và đa luồng được thiết kế để xử lý một số lượng lớn các yêu cầu của khách hàng một cách hiệu quả.

Cách tiếp cận này đương nhiên dẫn đến song song giữa các truy vấn, trong đó các luồng máy chủ (hoặc quy trình) khác nhau xử lý nhiều yêu cầu cùng một lúc.

Song song truy vấn đã được thực hiện thành công trên các hệ thống SMP, ở đó nó đã tăng thông lượng và cho phép hỗ trợ nhiều người dùng đồng thời hơn.

Shared Disk Architecture

Kiến trúc đĩa chia sẻ thực hiện một khái niệm về quyền sở hữu chung đối với toàn bộ cơ sở dữ liệu giữa các máy chủ RDBMS, mỗi máy chủ đang chạy trên một nút của hệ thống bộ nhớ phân tán.

Mỗi máy chủ RDBMS có thể đọc, ghi, cập nhật và xóa thông tin từ cùng một cơ sở dữ liệu được chia sẻ, điều này sẽ cần hệ thống triển khai một dạng trình quản lý khóa phân tán (DLM).

Các thành phần DLM có thể được tìm thấy trong phần cứng, hệ điều hành và lớp phần mềm riêng biệt, tất cả tùy thuộc vào nhà cung cấp hệ thống.

Về mặt tích cực, kiến ​​trúc đĩa chia sẻ có thể giảm tắc nghẽn hiệu suất do lệch dữ liệu (phân phối dữ liệu không đồng đều) và có thể làm tăng đáng kể tính khả dụng của hệ thống.

Thiết kế bộ nhớ phân tán trên đĩa chia sẻ loại bỏ nút cổ chai truy cập bộ nhớ thường thấy của các hệ thống SMP lớn và giúp giảm sự phụ thuộc của DBMS vào việc phân vùng dữ liệu.

Shared-Memory Architecture

Bộ nhớ dùng chung hay kiểu chia sẻ mọi thứ là cách tiếp cận truyền thống của việc triển khai RDBMS trên phần cứng SMP.

Nó tương đối đơn giản để thực hiện và đã rất thành công cho đến thời điểm nó gặp phải những hạn chế về khả năng mở rộng của kiến ​​trúc chia sẻ mọi thứ.

Điểm mấu chốt của kỹ thuật này là một máy chủ RDBMS duy nhất có thể áp dụng tất cả các bộ xử lý, truy cập tất cả bộ nhớ và truy cập toàn bộ cơ sở dữ liệu, do đó cung cấp cho máy khách một hình ảnh hệ thống nhất quán.

Trong hệ thống SMP bộ nhớ dùng chung, DBMS coi rằng nhiều thành phần cơ sở dữ liệu thực thi các câu lệnh SQL giao tiếp với nhau bằng cách trao đổi thông điệp và thông tin qua bộ nhớ dùng chung.

Tất cả các bộ xử lý đều có quyền truy cập vào tất cả dữ liệu, được phân vùng trên các đĩa cục bộ.

Shared-Nothing Architecture

Trong môi trường bộ nhớ phân tán không dùng chung, dữ liệu được phân vùng trên tất cả các đĩa và DBMS được “phân vùng” trên nhiều đồng máy chủ, mỗi máy chủ nằm trên các nút riêng lẻ của hệ thống song song và có quyền sở hữu đĩa của nó và do đó phân vùng cơ sở dữ liệu của nó.

Một RDBMS không chia sẻ song song việc thực thi truy vấn SQL trên nhiều nút xử lý.

Mỗi bộ xử lý có bộ nhớ và đĩa của nó và giao tiếp với các bộ xử lý khác bằng cách trao đổi thông điệp và dữ liệu qua mạng kết nối.

Kiến trúc này được tối ưu hóa đặc biệt cho hệ thống MPP và cụm.

Các kiến trúc không chia sẻ gì cung cấp khả năng mở rộng gần như tuyến tính. Số lượng các nút bộ xử lý chỉ bị giới hạn bởi các giới hạn nền tảng phần cứng (và các hạn chế về ngân sách) và bản thân mỗi nút có thể là một hệ thống SMP mạnh mẽ.

Chúng tôi chuyên cung cấp các dịch vụ về Xây dựng Kho dữ liệu Data Warehouse/ Xây dựng Báo cáo Power BI cho các doanh nghiệp lớn như: Nakagawa, Mutoshi, Tinh Vân group,….. đăng ký ngay để được Demo và tư vấn miễn phí dành riêng cho doanh nghiệp của bạn.

    Xin vui lòng điền vào form dưới đây. Chúng tôi sẽ liên hệ lại ngay cho bạn khi nhận được thông tin:


    Leave a Reply

    Your email address will not be published. Required fields are marked *