Blog

Phân biệt các loại S3 Storage trong AWS (Cập nhật 2026)

Last updated on January 16th, 2026 at 10:24 am

Amazon S3 là một trong những dịch vụ nền tảng quan trọng nhất của AWS, được sử dụng rộng rãi trong các hệ thống lưu trữ, phân tích dữ liệu, ứng dụng web và kiến trúc data lake. Khi làm việc với S3 Storage, một trong những khái niệm cốt lõi nhưng thường bị hiểu hời hợt là Storage Class.

Nhiều người học AWS có thể kể tên được các storage class khác nhau, nhưng lại chưa thực sự hiểu vì sao AWS cần nhiều loại storage class đến vậy, và mỗi loại phản ánh một triết lý sử dụng dữ liệu khác nhau. Bài viết này tập trung làm rõ bản chất đó.

s3 storage

Storage Class trong S3 phản ánh điều gì?

Về bản chất, storage class trong Amazon S3 không chỉ là “mức giá khác nhau”, mà là cách AWS tổ chức, bảo vệ và cho phép truy cập dữ liệu.

Mỗi storage class định nghĩa:

  • Cách dữ liệu được phân tán giữa các Availability Zone
  • Mức độ sẵn sàng và khả năng chịu lỗi
  • Kỳ vọng của AWS về tần suất và mục đích truy cập dữ liệu

Nói cách khác, storage class thể hiện vòng đời logic của dữ liệu, từ dữ liệu đang hoạt động, dữ liệu ít dùng, cho đến dữ liệu lưu trữ dài hạn.

S3 Standard – Lớp lưu trữ cho dữ liệu “đang sống”

S3 Standard là storage class mặc định và cũng là nền tảng cho hầu hết các hệ thống sử dụng S3. Đây là lớp lưu trữ dành cho dữ liệu được truy cập thường xuyên và có vai trò trực tiếp trong hoạt động của hệ thống.

Dữ liệu trong S3 Standard được sao chép trên nhiều Availability Zone, đảm bảo tính sẵn sàng cao và khả năng truy cập ổn định với độ trễ rất thấp. Điều này khiến S3 Standard trở thành lựa chọn phù hợp cho dữ liệu ứng dụng, dữ liệu phân tích đang sử dụng, log hệ thống được truy vấn thường xuyên, hoặc data lake phục vụ BI và machine learning.

Quan trọng hơn, S3 Standard phản ánh một giả định ngầm của AWS: dữ liệu này có khả năng được truy cập bất kỳ lúc nào, và hệ thống phải luôn sẵn sàng phục vụ.

S3 Intelligent-Tiering – Khi hành vi truy cập không thể dự đoán

Trong thực tế, không phải lúc nào chúng ta cũng biết trước dữ liệu sẽ được truy cập nhiều hay ít trong tương lai. Đây là bối cảnh mà S3 Intelligent-Tiering được sinh ra.

Thay vì yêu cầu người dùng phải phân loại dữ liệu ngay từ đầu, Intelligent-Tiering cho phép AWS tự quan sát hành vi truy cập, sau đó di chuyển dữ liệu giữa các tầng truy cập khác nhau một cách tự động. Điều này đặc biệt phù hợp với các hệ thống dữ liệu lớn, nơi dữ liệu có thể rất “nóng” trong một giai đoạn, rồi gần như không được dùng trong giai đoạn khác.

Về mặt kiến trúc, Intelligent-Tiering cho thấy một xu hướng rõ ràng của AWS: giảm gánh nặng quyết định cho người thiết kế hệ thống, và chuyển phần tối ưu sang nền tảng.

S3 Standard-IA – Dữ liệu vẫn quan trọng, nhưng không còn thường xuyên

Standard-IA (Infrequent Access) được thiết kế cho những dữ liệu không còn nằm trong luồng xử lý chính, nhưng vẫn cần được truy cập nhanh khi có nhu cầu.

Điểm quan trọng cần hiểu là: Standard-IA không phải là lớp lưu trữ cho dữ liệu “lạnh”, mà là cho dữ liệu “giảm nhiệt”. Ví dụ, các bản backup gần đây, dữ liệu báo cáo cũ, hoặc kết quả xử lý batch đã hoàn thành nhưng vẫn cần giữ lại để đối chiếu.

Về mặt tư duy, khi chuyển dữ liệu sang Standard-IA, bạn đang nói với AWS rằng: dữ liệu này vẫn có giá trị, nhưng không còn nằm trong luồng hoạt động thường xuyên.

S3 One Zone-IA – Chấp nhận rủi ro có kiểm soát

One Zone-IA có cùng triết lý sử dụng với Standard-IA, nhưng chỉ lưu trữ dữ liệu trong một Availability Zone duy nhất. Điều này khiến lớp lưu trữ này phù hợp cho những dữ liệu có thể tái tạo, hoặc đóng vai trò trung gian trong pipeline xử lý.

One Zone-IA phản ánh một quyết định kiến trúc rõ ràng: đánh đổi độ sẵn sàng để giảm mức độ bảo vệ dữ liệu. Vì vậy, nó thường xuất hiện trong các hệ thống xử lý dữ liệu nhiều bước, nơi dữ liệu đầu ra của mỗi bước có thể được tạo lại nếu cần.

S3 Glacier và Glacier Deep Archive – Lưu trữ để tuân thủ và ghi nhớ

Các storage class thuộc nhóm Glacier đại diện cho lớp dữ liệu không còn tham gia vào hoạt động của hệ thống, nhưng vẫn cần được lưu giữ vì lý do pháp lý, tuân thủ hoặc lịch sử.

Glacier phù hợp cho dữ liệu có khả năng cần truy xuất lại trong tương lai, dù không thường xuyên. Trong khi đó, Glacier Deep Archive được thiết kế cho các kịch bản lưu trữ rất dài hạn, nơi dữ liệu gần như không bao giờ được truy cập trừ khi có yêu cầu đặc biệt.

Ở đây, AWS không còn giả định dữ liệu cần “sẵn sàng”, mà chỉ cần tồn tại bền vững theo thời gian.

Xu hướng sử dụng S3 Storage Class trong hệ thống hiện đại

Trong các kiến trúc dữ liệu hiện nay, S3 không còn chỉ là nơi “lưu file”, mà là nền tảng trung tâm của data lake, analytics và AI/ML. Do đó, xu hướng chung là:

  • Dữ liệu mới sinh ra thường bắt đầu ở S3 Standard hoặc Intelligent-Tiering
  • Dữ liệu dần được chuyển sang các lớp ít truy cập hơn theo vòng đời tự nhiên
  • Glacier trở thành lớp lưu trữ cuối cùng cho dữ liệu đã hoàn tất sứ mệnh vận hành

Điều này phản ánh cách AWS nhìn nhận dữ liệu như một thực thể có vòng đời, chứ không phải một khối lưu trữ tĩnh.

Kết luận

Các loại storage class trong Amazon S3 không tồn tại để “chọn cho rẻ”, mà để phản ánh trạng thái và vai trò của dữ liệu trong hệ thống. Khi hiểu storage class dưới góc độ này, bạn sẽ:

  • Thiết kế kiến trúc S3 hợp lý hơn
  • Tránh sử dụng storage class một cách máy móc
  • Tiến gần hơn tới tư duy của một cloud/data engineer thực thụ

INDA Academy tự hào là đơn vị tiên phong trong việc đào tạo phân tích dữ liệu và AI chuyên sâu, đặc biệt cho khối ngành Ngân hàng – Tài chính – Bảo hiểm tại Việt Nam. Sau hơn 12 năm “thực chiến” cùng những dòng chảy dữ liệu khổng lồ, chúng tôi đã xây dựng nên một hệ sinh thái đào tạo toàn diện, giúp hàng nghìn học viên chuyển mình từ người mới bắt đầu trở thành những chuyên gia lành nghề, sẵn sàng đáp ứng tiêu chuẩn khắt khe của các doanh nghiệp lớn.

Điểm khác biệt lớn nhất tại INDA chính là triết lý đào tạo dựa trên các dự án thực tế (Project-based) và lộ trình cá nhân hóa nhờ ứng dụng AI. Chúng tôi không chỉ dạy bạn cách sử dụng công cụ, mà còn truyền tải tư duy khai phá giá trị từ dữ liệu để đưa ra quyết định kinh doanh chính xác.

Tìm hiểu thêm về các khóa học TẠI ĐÂY:
Lộ trình đào tạo Data Engineer
Lộ trình đào tạo Data Analyst
Lộ trình đào tạo Tester
Khóa học Data Engineer nâng cao – Thực chiến 5 dự án doanh nghiệp
Khóa học Data Analyst nâng cao – Thực chiến 5 dự án doanh nghiệp

Leave a Reply

Your email address will not be published. Required fields are marked *