Video: Tìm hiểu về NoSQL (Bài 1.1) 2025
Bắt đầu của bạn xung quanh NoSQL có thể là một chút khó khăn. Nếu bạn nghiên cứu cơ sở dữ liệu ở trường, bạn có thể đã được indoctrinated trong một cách suy nghĩ quan hệ. Nói cơ sở dữ liệu cho hầu hết mọi người, và họ nghĩ hệ thống quản lý cơ sở dữ liệu quan hệ . Điều này là tự nhiên vì trong 30 năm qua, RDBMS đã trở nên nổi bật.
Để hỗ trợ bạn trong hành trình này, đây là một số thuật ngữ chính phổ biến, cũng như ý nghĩa của chúng khi áp dụng cho cơ sở dữ liệu NoSQL.
Một đơn vị logic duy nhất, có khả năng lây lan trên nhiều máy, vào dữ liệu nào có thể được thêm vào và có thể được truy vấn dữ liệu chứa trong nó.
-
Khoảng thời gian quan hệ tablespace
cũng có thể được áp dụng cho cơ sở dữ liệu NoSQL hoặc bộ sưu tập. Trang dữ liệu: Một thuật ngữ từ RDBMS đề cập đến tập hợp các tập bản sao chỉ đọc được lưu trữ trên một nhóm các máy được quản lý.
-
Một tập hợp dữ liệu được lưu trữ cùng nhau trên một nút duy nhất để xử lý hiệu quả hoặc được nhân rộng.
-
Cũng có thể được sử dụng để truy vấn. Trong trường hợp này, nó có thể được coi là bộ sưu tập
. Cấu trúc cơ sở dữ liệu
Bộ sưu tập:
Một bộ hồ sơ, thường là các tài liệu, được nhóm lại với nhau. Điều này không dựa trên một thuộc tính trong tập bản ghi, nhưng trong siêu dữ liệu của nó. Việc gán một bản ghi cho bộ sưu tập thường được thực hiện khi tạo hoặc cập nhật.-
Lược đồ: Trong RDBMS và đến một mức độ nhất định các cửa hàng cột. Cấu trúc của dữ liệu phải được cấu hình trong cơ sở dữ liệu trước khi dữ liệu nào được tải.
-
Trong cơ sở dữ liệu tài liệu, mặc dù bất kỳ cấu trúc nào cũng có thể được lưu trữ, đôi khi tốt hơn là hạn chế các cấu trúc bằng cách thực thi lược đồ, chẳng hạn như trong Định nghĩa Giản đồ XML. Tuy nhiên NoSQL thường được coi là không có lược đồ, hoặc là hỗ trợ giản đồ biến. Records
Record:
Một đơn vị nguyên tử của dữ liệu đại diện trong cơ sở dữ liệu cụ thể đang được mô tả.
-
Trong một RDBMS, đây sẽ là một hàng, cũng như trong các cửa hàng. Đây cũng có thể là giá trị trong cửa hàng giá trị khóa, tài liệu trong kho tài liệu hoặc chủ đề (không phải ba lần) trong một cửa hàng ba. Hàng:
Đơn vị nguyên tử của bản ghi trong một kho lưu trữ cột hoặc RDBMS.
-
Có thể được mô phỏng dưới dạng một phần tử bên trong kho tài liệu hoặc làm bản đồ trong một cửa hàng có giá trị khóa. Trường:
Một trường duy nhất trong một bản ghi. Một cột trong một RDBMS.
-
Có thể không có trong tất cả các hồ sơ, nhưng khi có mặt nên có cùng loại hoặc cấu trúc. Bảng:
Một lớp lưu trữ duy nhất. Trong Bigtable, chúng còn được gọi là các bảng. Trong một cửa hàng ba, chúng có thể được gọi là các loại RDF chủ đề hoặc được đặt tên là đồ thị, tùy thuộc vào ngữ cảnh. Trong kho tài liệu, chúng có thể là bộ sưu tập.
-
Liên kết bản ghi Khóa chính:
Giá trị duy nhất được đảm bảo trong một bảng đặc biệt có thể được sử dụng để luôn ghi lại một bản ghi. Khóa trong kho lưu trữ giá trị khóa, URI trong kho tài liệu hoặc IRI trong kho lưu trữ ba hoặc đồ thị.
-
Khóa nước ngoài: Giá trị dữ liệu chỉ ra một bản ghi có liên quan đến một bản ghi trong một bảng hoặc một bản ghi khác. Có cùng giá trị với khóa chính trong bảng có liên quan.
-
Mối quan hệ: Một liên kết, hoặc cạnh trong lý thuyết đồ thị, cho thấy hai bản ghi có một liên kết ngữ nghĩa. Mối quan hệ có thể được giữa hai bản ghi trong cùng một bảng hoặc khác nhau.
-
Trong RDBMS, thường là các bảng khác, trong khi ở một cửa hàng ba thì phổ biến là liên quan đến các chủ đề cùng loại (ví dụ người trong đồ thị xã hội). Một số cơ sở dữ liệu, chủ yếu là đồ thị các cửa hàng, hỗ trợ thêm siêu dữ liệu vào các mối quan hệ. Tổ chức lưu trữ
Máy chủ:
Một nút máy tính duy nhất trong một nhóm. Thông thường chạy một thể hiện duy nhất của mã máy chủ cơ sở dữ liệu.
-
Cụm cụm: Một nhóm vật lý hoặc các máy chủ được quản lý cùng nhau trong cùng một trung tâm dữ liệu để cung cấp một dịch vụ duy nhất. Có thể nhân rộng cơ sở dữ liệu của nó tới các cụm trong các trung tâm dữ liệu khác.
-
Hình thức bình thường: Một phương pháp bình thường hoá, hoặc giảm thiểu sự trùng lắp dữ liệu trong một RDBMS.
-
Cơ sở dữ liệu NoSQL thường dẫn đến một cấu trúc dữ liệu denormalized để cung cấp truy vấn nhanh hơn hoặc truy cập dữ liệu. Công nghệ nhân rộng
Sao chép đĩa:
Sao chép dữ liệu giữa các nút trong suốt một cụm đơn để cung cấp khả năng phục hồi khả năng sẵn sàng cao trong trường hợp thất bại của một nút duy nhất.
-
Sao chép cơ sở dữ liệu: Nhân rộng giữa các cơ sở dữ liệu trong các cụm khác nhau. Sao chép tất cả dữ liệu theo thứ tự cập nhật từ một nhóm này sang nhóm khác. Luôn luôn duy nhất.
-
Sao chép linh hoạt: Cung cấp sao chép được kiểm soát bởi ứng dụng dữ liệu giữa các cơ sở dữ liệu trong các cụm khác nhau. Cập nhật có thể không đến trong cùng một thứ tự họ đã được áp dụng cho cơ sở dữ liệu đầu tiên. Thông thường liên quan đến một số xử lý tuỳ chỉnh, chẳng hạn như ưu tiên cập nhật dữ liệu sẽ được gửi tiếp theo. Có thể được hai hướng với mã độ giải quyết xung đột cập nhật thích hợp.
-
Công cụ tìm kiếm Chỉ mục:
Danh sách các giá trị đã có trong một bản ghi cụ thể.
-
Chỉ số đảo ngược: Danh sách các giá trị được liệt kê (các điều khoản), và một danh sách các khóa chính của các bản ghi sử dụng những điều khoản này.
-
Cung cấp cho chức năng tìm kiếm văn bản phi cấu trúc hiệu quả và chức năng tập hợp nhanh chóng và sắp xếp khi lưu trữ trong bộ nhớ. Truy vấn:
Một bộ tiêu chí dẫn đến danh sách các bản ghi phù hợp với truy vấn chính xác, được trả về theo thứ tự của (các) giá trị trường cụ thể.
-
Tìm kiếm: Một bộ tiêu chí dẫn đến danh sách có thứ tự phù hợp khớp với truy vấn.
-
Các tiêu chí tìm kiếm có thể không yêu cầu kết hợp chính xác, thay vì trả lại tính toán liên quan được tính trọng số bởi sự gần gũi của đối sánh với tiêu chí.Đây là những gì Google làm khi bạn thực hiện tìm kiếm.