Video: Ổ cứng SSD Samsung 850 Tốc Độ cao V Nand Chính Hãng 2017 2025
Ở cốt lõi của bất kỳ môi trường dữ liệu lớn nào, và lớp 2 của ngăn xếp dữ liệu lớn là các công cụ cơ sở dữ liệu có chứa bộ sưu tập các yếu tố dữ liệu liên quan đến doanh nghiệp của bạn. Những động cơ này cần phải nhanh, có thể mở rộng, và đá rắn. Chúng không phải là tất cả được tạo ra bằng nhau và một số môi trường dữ liệu lớn sẽ tốt hơn với một động cơ khác hoặc nhiều khả năng hơn với sự kết hợp của các công cụ cơ sở dữ liệu.
Chẳng hạn, mặc dù mặc dù có thể sử dụng các hệ thống quản lý cơ sở dữ liệu quan hệ (RDBMS) cho tất cả các triển khai dữ liệu lớn của bạn, nhưng thực tế là không thực hiện được vì hiệu suất, quy mô, hoặc thậm chí là chi phí. Một số công nghệ cơ sở dữ liệu khác nhau có sẵn, và bạn phải chăm sóc để lựa chọn một cách khôn ngoan.
Không có sự lựa chọn đúng đắn nào về các ngôn ngữ cơ sở dữ liệu. Mặc dù SQL là ngôn ngữ truy vấn cơ sở dữ liệu phổ biến nhất được sử dụng ngày nay, các ngôn ngữ khác có thể cung cấp một cách hiệu quả hơn hoặc hiệu quả hơn để giải quyết những thách thức dữ liệu lớn của bạn. Thật hữu ích khi nghĩ đến động cơ và ngôn ngữ là công cụ trong hộp công cụ của nhà triển khai. "Công việc của bạn là chọn đúng công cụ.
Ví dụ: nếu bạn sử dụng mô hình quan hệ, có thể bạn sẽ sử dụng SQL để truy vấn nó. Tuy nhiên, bạn cũng có thể sử dụng ngôn ngữ khác như Python hay Java. Điều rất quan trọng là phải hiểu được loại dữ liệu nào có thể bị thao tác bởi cơ sở dữ liệu và liệu nó có hỗ trợ hành vi giao dịch thực sự hay không. Các nhà thiết kế cơ sở dữ liệu mô tả hành vi này với ACID từ . Nó là viết tắt của
-
Nguyên tử: Một giao dịch là "tất cả hoặc không có gì" khi nó là nguyên tử. Nếu bất kỳ phần nào của giao dịch hoặc hệ thống bên dưới thất bại, toàn bộ giao dịch không thành công.
-
Tính nhất quán: Chỉ có các giao dịch với dữ liệu hợp lệ sẽ được thực hiện trên cơ sở dữ liệu. Nếu dữ liệu bị hỏng hoặc không đúng, giao dịch sẽ không hoàn thành và dữ liệu sẽ không được ghi vào cơ sở dữ liệu.
-
Cách ly: Nhiều giao dịch đồng thời sẽ không can thiệp vào nhau. Tất cả các giao dịch hợp lệ sẽ được thực hiện cho đến khi hoàn thành và theo thứ tự chúng được gửi để xử lý.
-
Độ bền: Sau khi dữ liệu từ giao dịch được ghi vào cơ sở dữ liệu, nó sẽ ở đó "mãi mãi. "
Engine Ngôn ngữ truy vấn MapReduce Các loại dữ liệu Giao dịch Ví dụ Quan hệ SQL, Python, C Không Typed ACID PostgreSQL, Oracle, DB / 2 Columnar Ruby Hadoop Được xác định trước và gõ Có, nếu bật HBase Biểu đồ Đi bộ,, Cypher Không Untyped ACID Neo4J Tài liệu Các lệnh JavaScript Gõ Không MongoDB, CouchDB Khóa-giá trị Lucene, các lệnh JavaScript BLOB, bán được Không Riak, Redis
Sau khi bạn hiểu các yêu cầu của mình và hiểu dữ liệu bạn đang thu thập, nơi để đặt nó, để làm gì với nó, bạn cần tổ chức nó để nó có thể được tiêu thụ để phân tích, báo cáo, hoặc các ứng dụng cụ thể.