Video: Phân loại các CSDL NoSQL (Bài 1.6) 2025
Các kho dữ liệu của NoSQL ban đầu đã đăng ký khái niệm "Just Say No to SQL" (để diễn giải từ một chiến dịch quảng cáo chống ma túy trong những năm 1980), và chúng là một phản ứng đối với các cơ sở dữ liệu quan hệ (SQL). Không phải là những người này ghét SQL, nhưng họ đã mệt mỏi vì buộc các chốt vuông vào các lỗ tròn bằng cách giải quyết các vấn đề mà cơ sở dữ liệu quan hệ không được thiết kế cho.
Tên NoSQL có phần gây hiểu nhầm vì nhiều cơ sở dữ liệu phù hợp với loạido
có hỗ trợ SQL (thay vì hỗ trợ "NoSQL"). Hãy nghĩ về tên của nó thay vì "Không chỉ SQL. " Cung cấp này cung cấp cách lưu trữ bất kỳ loại nào dữ liệu mà không cần phải sử dụng một lược đồ. Điều này tương phản với các cơ sở dữ liệu quan hệ, nơi bạn cần xác định lược đồ (cấu trúc bảng) trước khi bất kỳ dữ liệu nào được đưa vào. Vì các cửa hàng có giá trị khóa không yêu cầu một giản đồ, bạn có khả năng linh hoạt tuyệt vời để lưu trữ dữ liệu ở nhiều định dạng.
Trong một kho lưu trữ giá trị, một hàng chỉ đơn giản bao gồm một khóa (một định danh) và một giá trị, có thể là bất cứ thứ gì từ một giá trị số nguyên cho một chuỗi dữ liệu nhị phân lớn. Nhiều triển khai của các cửa hàng có giá trị chủ chốt dựa trên giấy Dynamo của Amazon.
-
Cột cửa hàng gia đình: Ở đây bạn có các cơ sở dữ liệu trong đó các cột được nhóm vào các họ của cột và được lưu trữ cùng nhau trên đĩa.
Nói một cách nghiêm túc, nhiều cơ sở dữ liệu này không phải là định hướng theo cột vì chúng dựa trên tài liệu BigTable của Google, nơi lưu trữ dữ liệu dưới dạng bản đồ được sắp xếp theo nhiều chiều.
-
Lưu trữ tài liệu: Phiếu mua hàng này dựa vào bộ sưu tập các tài liệu được mã hoá và định dạng tương tự để nâng cao hiệu quả.Các kho tài liệu cho phép các tài liệu cá nhân trong một bộ sưu tập chỉ bao gồm một tập con của các trường, do đó chỉ cần dữ liệu cần thiết được lưu trữ. Đối với các bộ dữ liệu thưa thớt, nơi mà nhiều lĩnh vực thường không được phổ biến, điều này có thể chuyển thành tiết kiệm không gian đáng kể.
Ngược lại, các cột trống trong các bảng cơ sở dữ liệu quan hệ chiếm không gian. Cửa hàng tài liệu cũng cho phép lược đồ linh hoạt, bởi vì chỉ cần các lĩnh vực cần thiết được lưu trữ, và lĩnh vực mới có thể được thêm vào. Một lần nữa, trái ngược với các cơ sở dữ liệu quan hệ, các cấu trúc bảng được định nghĩa trước khi dữ liệu được lưu trữ và thay đổi các cột là một công việc tẻ nhạt tác động đến toàn bộ bộ dữ liệu.
-
Cơ sở dữ liệu đồ thị: Ở đây bạn có các cơ sở dữ liệu lưu trữ
cấu trúc đồ thị
-
- các biểu diễn cho thấy bộ sưu tập các thực thể (các đỉnh hoặc các nút) và các mối quan hệ của chúng (các cạnh) với nhau. Các cấu trúc này cho phép cơ sở dữ liệu đồ thị có thể rất phù hợp để lưu trữ các cấu trúc phức tạp, chẳng hạn như mối quan hệ liên kết giữa tất cả các trang web đã biết. (Ví dụ: các trang web riêng lẻ là các nút, và các cạnh kết nối chúng là liên kết từ trang này sang trang khác). Google, tất nhiên, là công nghệ đồ thị và đã phát minh ra một công cụ xử lý đồ thị được gọi là Pregel để thúc đẩy PageRank của nó thuật toán. Trong cộng đồng Hadoop, có một dự án Apache gọi là Giraph (dựa trên giấy Pregel), một công cụ xử lý đồ thị được thiết kế để xử lý đồ thị được lưu trữ trong HDFS. Các tùy chọn lưu trữ và xử lý dữ liệu có sẵn trong Hadoop là trong nhiều trường hợp thực hiện các loại NoSQL liệt kê ở đây. Điều này sẽ giúp bạn đánh giá tốt hơn các giải pháp có sẵn cho bạn và xem cách Hadoop có thể bổ sung các kho dữ liệu truyền thống như thế nào