Trang Chủ Tài chính Cá nhân Các giải pháp dữ liệu Big Data khác - những cái đầu

Các giải pháp dữ liệu Big Data khác - những cái đầu

Mục lục:

Video: 5 sai lầm thường gặp khi backup dữ liệu (và giải pháp) 2025

Video: 5 sai lầm thường gặp khi backup dữ liệu (và giải pháp) 2025
Anonim

Nhìn qua Hadoop, bạn có thể thấy các giải pháp dữ liệu lớn khác chân trời. Các giải pháp này cho phép làm việc với dữ liệu lớn trong thời gian thực hoặc sử dụng các công nghệ cơ sở dữ liệu thay thế để xử lý và xử lý nó. Ở đây, bạn được giới thiệu về các khuôn khổ xử lý thời gian thực, sau đó là các nền tảng MPP (Massively Parallel Processing) và cuối cùng là các cơ sở dữ liệu NoSQL cho phép bạn làm việc với các dữ liệu lớn bên ngoài môi trường Hadoop.

Bạn nên biết một điều gì đó được gọi là sự tuân thủ ACID, viết tắt của A tomicity, C sự an toàn, I sol, và D sự tuân thủ không dễ dãi. ACID tuân thủ là một tiêu chuẩn mà theo đó các giao dịch cơ sở dữ liệu chính xác và đáng tin cậy được đảm bảo. Trong các giải pháp dữ liệu lớn, hầu hết các hệ thống cơ sở dữ liệu không phải là ACID tuân thủ, nhưng điều này không nhất thiết đặt ra một vấn đề lớn. Đó là bởi vì hầu hết các hệ thống dữ liệu lớn đều sử dụng Hệ thống Hỗ trợ Quyết định (DSS) để xử lý hàng loạt dữ liệu trước khi dữ liệu đó được đọc.

DSS là các hệ thống thông tin được sử dụng để hỗ trợ quyết định tổ chức. DSS không giao dịch chứng minh không có yêu cầu tuân thủ ACID thực.

Các khuôn khổ xử lý thời gian thực

Đôi khi bạn có thể cần phải truy vấn các luồng dữ liệu lớn theo thời gian thực … và bạn không thể làm điều này bằng Hadoop. Trong những trường hợp này, thay vào đó, hãy sử dụng khuôn khổ chế biến thời gian thực. Một khuôn khổ xử lý thời gian thực

là - như tên của nó ngụ ý - một khuôn khổ có thể xử lý dữ liệu trong thời gian thực (hoặc gần thời gian thực) khi luồng dữ liệu và luồng vào hệ thống. Về cơ bản, các khuôn khổ xử lý thời gian thực là phản đề của các khuôn khổ xử lý hàng loạt mà bạn thấy được triển khai trong Hadoop.

Khung làm giảm chi phí của các công việc MapReduce để tăng hiệu quả thời gian tổng thể của hệ thống:

Các giải pháp trong thể loại này bao gồm Apache Storm và Apache Spark để xử lý luồng gần thời gian thực.

  • Các khuôn khổ triển khai các phương pháp truy vấn sáng tạo nhằm tạo điều kiện truy vấn dữ liệu lớn theo thời gian thực: Một số giải pháp trong danh mục này bao gồm Dremel, Apache Drill của Google, Shark for Apache Hive và Impala Cloudera.

  • . Các nền tảng xử lý song song (MPP) Massively có thể được sử dụng thay vì MapReduce như là một cách tiếp cận thay thế cho xử lý dữ liệu phân tán. Nếu mục tiêu của bạn là triển khai chế biến song song trên kho dữ liệu truyền thống, thì một MPP có thể là giải pháp hoàn hảo.

Để hiểu cách MPP so sánh với một khung xử lý song song chuẩn MapReduce, hãy xem xét những điều sau đây. MPP chạy các công việc tính toán song song trên phần cứng tùy chọn, trong khi MapReduce chạy chúng trên các máy chủ hàng hóa giá rẻ. Do đó, khả năng xử lý MPP là chi phí hạn chế. Điều này nói rằng MPP nhanh hơn và dễ sử dụng hơn các công việc MapReduce tiêu chuẩn. Đó là vì MPP có thể được truy vấn bằng Ngôn ngữ truy vấn có cấu trúc (Structured Query Language - SQL), nhưng các công việc MapReduce bản địa được kiểm soát bởi ngôn ngữ lập trình Java phức tạp hơn.

Nhà cung cấp nổi tiếng MPP và các sản phẩm bao gồm nền tảng Teradata cũ, cộng thêm các giải pháp mới hơn như Greenplum DCA của EMC 2, Vertica của HP, Netezza của IBM và Exadata của Oracle.

Giới thiệu cơ sở dữ liệu NoSQL

Hệ thống quản lý CSDL

truyền thống

(RDBMS) không được trang bị để xử lý các yêu cầu về dữ liệu lớn. Đó là bởi vì các cơ sở dữ liệu quan hệ truyền thống được thiết kế để chỉ xử lý các tập dữ liệu quan hệ được xây dựng bằng dữ liệu được lưu trữ trong hàng và cột sạch và do đó có khả năng được truy vấn thông qua Structured Query Language (SQL). Các hệ thống RDBM không có khả năng xử lý dữ liệu phi cấu trúc và bán cấu trúc. Hơn nữa, các hệ thống RDBM đơn giản không có khả năng xử lý và xử lý cần thiết để đáp ứng các yêu cầu về khối lượng dữ liệu và vận tốc lớn. Đây là nơi NoSQL đi vào. Các cơ sở dữ liệu NoSQL, như MongoDB, không liên quan, các hệ thống cơ sở dữ liệu phân tán được thiết kế để vượt qua thách thức dữ liệu lớn. Cơ sở dữ liệu NoSQL bước ra khỏi kiến ​​trúc cơ sở dữ liệu quan hệ truyền thống và cung cấp một giải pháp hiệu quả hơn và khả năng mở rộng hơn.

Các hệ thống NoSQL tạo điều kiện cho các dữ liệu không SQL truy vấn các dữ liệu không có quan hệ hoặc không có lược đồ, bán cấu trúc và không có cấu trúc. Bằng cách này, cơ sở dữ liệu NoSQL có thể xử lý các nguồn dữ liệu được cấu trúc, bán cấu trúc, và phi cấu trúc được phổ biến trong các hệ thống dữ liệu lớn.

NoSQL cung cấp bốn loại cơ sở dữ liệu không quan hệ - cơ sở dữ liệu đồ thị, cơ sở dữ liệu tài liệu, cửa hàng giá trị quan trọng, và cửa hàng gia đình cột. Vì NoSQL cung cấp chức năng bản địa cho từng loại cấu trúc dữ liệu riêng lẻ, nó cung cấp chức năng lưu trữ và truy xuất rất hiệu quả cho hầu hết các loại dữ liệu không quan hệ. Khả năng thích ứng và hiệu quả này làm cho NoSQL trở thành một sự lựa chọn ngày càng được ưa chuộng để xử lý các dữ liệu lớn và để vượt qua những thách thức trong quá trình xử lý đi cùng với nó. Có một số cuộc tranh luận về tầm quan trọng của tên NoSQL. Một số cho rằng NoSQL là viết tắt của Không chỉ SQL, trong khi những người khác tranh luận rằng các từ viết tắt là

Cơ sở dữ liệu không phải SQL

. Lập luận là khá phức tạp và không có câu trả lời thực sự cắt và khô.Để giữ mọi thứ đơn giản, chỉ cần suy nghĩ về NoSQL như là một lớp các hệ thống quản lý cơ sở dữ liệu không quan hệ không nằm trong dải các hệ thống RDBM được truy vấn bằng SQL.

Các giải pháp dữ liệu Big Data khác - những cái đầu

Lựa chọn của người biên tập

Tìm kiếm Cơ sở dữ liệu của Chính phủ cho dữ liệu Infographics của bạn - núm vú

Tìm kiếm Cơ sở dữ liệu của Chính phủ cho dữ liệu Infographics của bạn - núm vú

Một Infographic tốt có thể trực quan kể một câu chuyện hoặc làm một số trừu tượng hoặc điểm số dễ hiểu, nhưng không có điều này xảy ra mà không có một cơ sở dữ liệu tốt. Các chính phủ thế giới và các tổ chức liên chính phủ duy trì các cơ sở dữ liệu về tất cả các loại thống kê. Dữ liệu về nhân khẩu học, kinh tế, sức khoẻ và văn hoá của vô số nước có sẵn trực tuyến cho ...

Tương lai của Infographics cho Giáo dục - núm vú

Tương lai của Infographics cho Giáo dục - núm vú

Sinh viên ngày nay có dây từ khi sinh ra, và khi họ đến trường tuổi, họ đã quen với các bài thuyết trình đầy màu sắc, đồ họa và giải trí. Nhập thông tin đồ họa. Có thể có một vài cách mà các biểu đồ chữ ký sẽ đóng vai trò mạnh mẽ hơn trong giáo dục trong thập kỷ tới và hơn thế nữa: Giải thích các khái niệm phức tạp: Chúng ta đã phải vật lộn qua một thứ gì đó trong trường học. ...

Lời khuyên cho việc định vị văn bản trên các hình ảnh hoá dữ liệu - núm vú

Lời khuyên cho việc định vị văn bản trên các hình ảnh hoá dữ liệu - núm vú

Bạn có thể đã nghe nói rằng " đặt nó ", mà không thể được truer khi nói đến thêm văn bản để hình dung dữ liệu. Văn bản bị đặt sai trái có thể dẫn đến hiểu sai về dữ liệu. Bạn nên thực hiện theo hai phương pháp hay nhất để đưa văn bản vào hình dung dữ liệu của bạn: Giữ toàn bộ văn bản theo chiều ngang. Nonhorizontal ...

Lựa chọn của người biên tập

GRE Câu hỏi mẫu: Hoàn thành văn bản - những con vú

GRE Câu hỏi mẫu: Hoàn thành văn bản - những con vú

Câu hỏi Hoàn thành văn bản trên GRE bao gồm một câu hoặc đoạn văn với một, hai hoặc ba không gian trống cho một từ hoặc từ bị thiếu. Công việc của bạn là chọn từ hoặc từ thích hợp nhất để điền vào chỗ trống trong câu. Đây là một số ví dụ để bạn thử. Mẫu ...

Làm thế nào để giải quyết vấn đề về toán học trên GRE - núm vú

Làm thế nào để giải quyết vấn đề về toán học trên GRE - núm vú

Khi bạn phải dịch một vấn đề từ vào toán học trên GRE, biết đâu để bắt đầu thường là thách thức khó khăn nhất. Điều quan trọng là bắt đầu với những gì bạn biết và làm việc theo những gì bạn không biết. Bạn có thể giải quyết hầu hết các vấn đề từ bằng cách tiếp cận theo từng bước: Đọc toàn bộ ...

Làm thế nào để Tối đa hóa điểm TOE GRE của bạn - núm vú

Làm thế nào để Tối đa hóa điểm TOE GRE của bạn - núm vú

Viết luận văn (và ghi điểm) trên GRE là chủ quan đến một mức độ nào. Không có câu trả lời đúng hay sai, và mỗi bài luận hơi khác nhau, dựa trên quan điểm, kiến ​​thức, kinh nghiệm, cách viết của người thử nghiệm, v.v ... Tuy nhiên, những người đánh giá, có một danh sách các tiêu chuẩn cụ thể để phân loại bài luận của bạn. Để thực hiện tốt, hãy chắc chắn làm ...

Lựa chọn của người biên tập

Chèn nội dung vào một slide PowerPoint trong Office 2011 for Mac - núm vú

Chèn nội dung vào một slide PowerPoint trong Office 2011 for Mac - núm vú

Ribbon trong PowerPoint 2011 cho Mac cho phép bạn thêm nội dung bằng các tùy chọn trên tab Trang chủ, trong nhóm Chèn. Mỗi lần bạn thêm một nội dung nào đó vào trang trình chiếu, nó được đặt trong một lớp trên đầu của tất cả các đối tượng hiện có trên trang trình bày. Chèn nội dung văn bản vào trang trình bày PowerPoint Nhấp vào tab Trang chủ của Ribbon và ...

Văn phòng 2011 dành cho Mac: Thêm đoạn nhạc vào bài trình chiếu PowerPoint - núm vú

Văn phòng 2011 dành cho Mac: Thêm đoạn nhạc vào bài trình chiếu PowerPoint - núm vú

Tăng cường PowerPoint 2011 của bạn cho Mac trình bày với các đoạn âm thanh. Sử dụng âm thanh và âm nhạc là một cách hay để thu hút khán giả của bạn. Trong PowerPoint 2011 dành cho Mac, bạn có thể chọn một trong hai cách để kích hoạt hộp thoại Insert Audio: Từ Media Browser: Sử dụng tab Audio và kéo từ trình duyệt sang PowerPoint. ...

Office 2011 dành cho Mac: Khởi động Đoạn hoặc Phim Tạp chí trên Các trang trình bày của PowerPoint - những đầu

Office 2011 dành cho Mac: Khởi động Đoạn hoặc Phim Tạp chí trên Các trang trình bày của PowerPoint - những đầu

Bao gồm cả phương tiện truyền thông trong trình tự hoạt hình của bạn là một ý tưởng tuyệt vời. Trong PowerPoint 2011 dành cho máy Mac, bạn không còn bị hạn chế khi xem phim trên đầu. Phim bây giờ hoạt động độc đáo trong lớp của riêng mình và có thể hoạt ảnh giống như bất kỳ đối tượng khác. Phim thậm chí có thể chồng chéo và theo dõi các đường dẫn chuyển động khi chúng chơi. Chỉ cần nhớ ...