Trang Chủ Tài chính Cá nhân Quản lý Big Data Technologies trong một đám mây Hybrid - những con vú

Quản lý Big Data Technologies trong một đám mây Hybrid - những con vú

Mục lục:

Video: Dữ liệu lớn - Intel Big Data 101 - How Big Data Makes Big Impacts 2025

Video: Dữ liệu lớn - Intel Big Data 101 - How Big Data Makes Big Impacts 2025
Anonim

Thuật ngữ dữ liệu lớn được sử dụng thường xuyên trong thế giới công nghệ đám mây lai vì sự cần thiết liên tục gia tăng số lượng dữ liệu. Thực tế quan trọng về dữ liệu lớn là nó tồn tại ở điểm đầu của những giải pháp mà các tổ chức đã đưa ra trong lịch sử để quản lý khối lượng lớn các dữ liệu phức tạp. Công nghệ dữ liệu lớn cho phép mọi người phân tích và sử dụng dữ liệu một cách hiệu quả.

Khối lượng:

Dữ liệu lớn có khối lượng lớn. Nó thường đề cập đến ít nhất nhiều terabyte dữ liệu. Nhiều triển khai dữ liệu lớn đang tìm kiếm để phân tích petabyte thông tin.

  • Giá trị Byte

    10 0
    Gigabyte 10 9
    byte Terabyte 10 12 > bytes
    Petabyte 10 15 byte
    Exabyte 10 18 byte
    Đa dạng: Dữ liệu lớn có các hình dạng và kích thước khác nhau. Dữ liệu có cấu trúc là dữ liệu điển hình mà các nhà phân tích sử dụng để xử lý. Nó bao gồm doanh thu và số lượng bán hàng - loại dữ liệu bạn nghĩ bao gồm trong cơ sở dữ liệu. Dữ liệu có cấu trúc cũng đang được sản xuất theo những cách mới trong các sản phẩm như cảm biến và thẻ RFID.
  • có một số cấu trúc nhưng không theo cách bạn nghĩ về các bảng trong cơ sở dữ liệu. Nó bao gồm các định dạng EDI và XML. Dữ liệu phi cấu trúc

    • bao gồm văn bản, hình ảnh và âm thanh, bao gồm bất kỳ tài liệu, e-mail, tweet, hoặc blog nội bộ cho một công ty hoặc trên Internet. Dữ liệu phi cấu trúc chiếm khoảng 80% tổng số dữ liệu. Vận tốc:

      Đây là tốc độ di chuyển dữ liệu. Hãy suy nghĩ về cảm biến bắt dữ liệu mỗi mili giây hoặc dữ liệu dòng sản lượng từ các thiết bị y tế. Dữ liệu lớn thường xuất hiện ở bạn trong một luồng, vì vậy nó có một tính chất thời gian thực được liên kết với nó.
    • Đám mây là nơi lý tưởng cho các dữ liệu lớn vì khả năng mở rộng lưu trữ, sức mạnh tính toán và các tài nguyên co giãn. Mô hình đám mây có quy mô lớn; máy tính phân tán và một số khuôn khổ và công nghệ đã xuất hiện để hỗ trợ mô hình này, bao gồm Apache Hadoop:

    • Một nền tảng điện toán phân tán nguồn mở được viết bằng Java. Đây là một thư viện phần mềm cho phép xử lý phân tán qua các nhóm máy tính. Nó thực sự là một hệ thống tập tin phân phối. Nó tạo ra một hồ bơi máy tính, mỗi hệ thống có một hệ thống tệp tin Hadoop. Hadoop được thiết kế để giải quyết một lượng lớn dữ liệu phức tạp.Dữ liệu có thể được cấu trúc, không có cấu trúc, hoặc cấu trúc một phần. Hadoop có thể chạy trên rất nhiều máy chủ không chia sẻ bộ nhớ hoặc đĩa. Xem Hadoop để biết thêm thông tin. MapReduce:

  • Một khuôn khổ phần mềm được giới thiệu bởi Google để hỗ trợ tính toán phân tán trên các tập hợp dữ liệu lớn. Đó là trọng tâm của những gì Hadoop đang làm với dữ liệu lớn và phân tích dữ liệu lớn. Nó được thiết kế để tận dụng tài nguyên đám mây. Tính toán này được thực hiện trên nhiều máy tính, được gọi là cụm

, và mỗi cụm được gọi là một nút

  • . MapReduce có thể giải quyết cả dữ liệu được cấu trúc và không có cấu trúc. Người dùng chỉ định một hàm bản đồ để xử lý một cặp khóa / giá trị để tạo ra một cặp cặp trung gian và một hàm giảm đi hợp nhất các cặp này.

  • Cơ sở dữ liệu lớn Một sự hấp dẫn quan trọng của Hadoop là nó có thể xử lý các loại dữ liệu khác nhau. Các hệ thống quản lý cơ sở dữ liệu song song đã có mặt trên thị trường trong nhiều thập kỷ. Họ có thể hỗ trợ thực thi song song vì hầu hết các bảng được phân chia qua các nút trong một cụm và họ có thể dịch các lệnh SQL thành một kế hoạch được chia ra giữa các nút trong cluster. Tuy nhiên, chúng chủ yếu là đối phó với dữ liệu có cấu trúc bởi vì rất khó để phù hợp với dữ liệu phi cấu trúc, tự do vào các cột và hàng trong một mô hình quan hệ. Hadoop đã bắt đầu một phong trào trong cái được gọi là NoSQL, có nghĩa là không chỉ SQL. Thuật ngữ này đề cập đến một bộ công nghệ khác với các hệ thống cơ sở dữ liệu quan hệ. Một điểm khác biệt chính là họ không sử dụng SQL. Chúng cũng được thiết kế cho các kho dữ liệu phân tán. NoSQL không có nghĩa là mọi người không nên sử dụng SQL. Thay vào đó, ý tưởng là, tùy thuộc vào vấn đề của bạn là gì, cơ sở dữ liệu quan hệ và cơ sở dữ liệu NoSQL có thể cùng tồn tại trong một tổ chức. Có rất nhiều ví dụ về các loại cơ sở dữ liệu này, bao gồm:

Apache Cassandra:

Một hệ thống quản lý dữ liệu phân tán nguồn mở được phát triển bởi Facebook. Nó không có yêu cầu cấu trúc nghiêm ngặt, vì vậy nó có thể xử lý tất cả các loại dữ liệu khác nhau. Các chuyên gia cho rằng nó xuất sắc trong việc xử lý giao dịch thời gian thực với khối lượng lớn. Các cơ sở dữ liệu mã nguồn mở khác bao gồm MongoDB, Apache CouchDB và Apache HBase.

Amazon Simple DB: Amazon so sánh cơ sở dữ liệu này với một bảng tính trong đó có các cột và hàng có các thuộc tính và các mục được lưu trữ trong mỗi. Tuy nhiên, không giống như bảng tính, mỗi ô có thể có nhiều giá trị, và mỗi mục có thể có các thuộc tính liên quan. Amazon sau đó tự động lập chỉ mục dữ liệu. Gần đây, Amazon đã công bố Amazon Dynamo DB như là một cách để mang lại dữ liệu lớn NoSQL cho đám mây. Google BigTable:

Giống lai này giống như một cái bàn lớn. Bởi vì các bảng có thể lớn, chúng được phân chia tại hàng ranh giới thành các bảng, có thể là hàng trăm megabyte. MapReduce thường được sử dụng để tạo và sửa đổi dữ liệu được lưu trữ trong BigTable.

Quản lý Big Data Technologies trong một đám mây Hybrid - những con vú

Lựa chọn của người biên tập

Làm thế nào để Lưu tệp vào OneDrive từ iPad của bạn - núm vú

Làm thế nào để Lưu tệp vào OneDrive từ iPad của bạn - núm vú

Chia sẻ là chăm sóc và bạn có thể lưu tệp Word, Excel hoặc PowerPoint vào iPad hoặc máy tính để bàn của bạn trực tiếp vào thư mục OneDrive. Sau khi tệp tin trên OneDrive, những người khác có quyền truy cập vào thư mục trên OneDrive có thể mở tệp. Họ có thể mở nó trong Văn phòng cho ứng dụng iPad, Office ...

Làm thế nào để liên kết đến một tập tin cục bộ trong Office 2011 for Mac - núm vú

Làm thế nào để liên kết đến một tập tin cục bộ trong Office 2011 for Mac - núm vú

Một trong các công cụ hữu ích nhất trong Office 2011 cho mac là khả năng tạo siêu liên kết đến bất cứ đâu. Bạn có thể liên kết đến bất kỳ tập tin nào trên máy tính của bạn; những tập tin này là các tập tin địa phương. Để kết nối với các tệp cục bộ, bạn có thể sử dụng hai loại liên kết: Tuyệt đối: Loại liên kết này có chứa ...

Cách đăng nhập vào OneDrive từ phần mềm

Cách đăng nhập vào OneDrive từ phần mềm

OneDrive là một thành phần của Office 365, Dịch vụ trực tuyến của Microsoft. Trước khi bạn có thể lưu trữ, chia sẻ, hoặc đồng chỉnh sửa các tập tin trên OneDrive từ iPad, bạn phải đăng nhập vào OneDrive. Đọc tiếp để tìm hiểu cách đăng nhập từ Office cho iPad và đăng nhập từ một trình duyệt web. OneDrive ...

Lựa chọn của người biên tập

Cách sắp xếp các tệp phương tiện cho WordPress Blog của bạn - núm vú

Cách sắp xếp các tệp phương tiện cho WordPress Blog của bạn - núm vú

Nếu bạn đã chạy blog của bạn trong bất kỳ khoảng thời gian nào, bạn có thể dễ dàng quên những tệp bạn đã tải lên bằng trình tải lên WordPress. Thư viện Truyền thông WordPress giúp bạn dễ dàng và dễ dàng khám phá những tệp nào trong thư mục Uploads của bạn. Để tìm tệp hình ảnh, video hoặc âm thanh mà bạn đã tải lên bằng cách sử dụng <

Làm thế nào để tối ưu Blog WordPress của bạn cho Công cụ Tìm kiếm - núm vú

Làm thế nào để tối ưu Blog WordPress của bạn cho Công cụ Tìm kiếm - núm vú

Bạn muốn mọi người tìm thấy blog WordPress của bạn, nếu không bạn sẽ không dành thời gian để viết nó. WordPress được trang bị để tạo ra một môi trường thân thiện với các công cụ tìm kiếm, cho phép họ điều hướng dễ dàng thông qua các kho lưu trữ, các loại và các trang của bạn. WordPress cung cấp môi trường này với một cơ sở mã sạch, nội dung dễ dàng cập nhật thông qua ...

Làm thế nào để Thực hiện Từ khoá trong trang WordPress của bạn với Permalinks

Làm thế nào để Thực hiện Từ khoá trong trang WordPress của bạn với Permalinks

Cho thứ hạng cao hơn cho trang web WordPress của bạn, sử dụng các liên kết tùy chỉnh với từ khoá. Bằng cách sử dụng các liên kết tuỳ chỉnh, bạn tự động chèn từ khoá vào URL của các bài đăng và trang của bạn, cho phép các công cụ tìm kiếm bao gồm các bài đăng và trang đó trong cơ sở dữ liệu thông tin về những chủ đề đó. Nếu trang web của bạn được lưu trữ bởi nhà cung cấp có

Lựa chọn của người biên tập

Làm thế nào để gửi chú thích để chia sẻ chúng trong OneNote 2013 - núm vú

Làm thế nào để gửi chú thích để chia sẻ chúng trong OneNote 2013 - núm vú

Một trong những phương pháp đơn giản chia sẻ một ghi chú với OneNote 2013 bằng cách gửi nó dưới dạng tệp tin tới người nhận e-mail hoặc thậm chí với Microsoft Word hoặc blog của bạn. Để gửi lưu ý hiện tại dưới dạng tệp tin, hãy làm theo các bước sau: Mở ghi chú mà bạn muốn chia sẻ trong OneNote 2013 và chọn <...

Làm thế nào để Đồng bộ hóa Ghi chú trong OneNote 2013 - núm vú

Làm thế nào để Đồng bộ hóa Ghi chú trong OneNote 2013 - núm vú

OneNote 2013 khoảng cách bản thân từ khái niệm toàn bộ các tệp lưu thủ công trong lợi của đồng bộ hóa chúng. Bạn có thể đồng bộ tập tin tự động hoặc thủ công. Điều này cho phép bạn tự do khi quản lý các tệp của mình. Làm thế nào để đồng bộ tự động trong OneNote OneNote tự động lưu các ghi chú của bạn mỗi khi bạn thực hiện bất kỳ thay đổi ở tất cả để một máy tính xách tay, phần, ...

Cách Quản lý Máy tính xách tay OneNote 2013 với SkyDrive - núm vú

Cách Quản lý Máy tính xách tay OneNote 2013 với SkyDrive - núm vú

SkyDrive có thể truy cập qua đám mây, 't có một ứng dụng SkyDrive được cài đặt trên thiết bị. Điều này giúp bạn dễ dàng quản lý máy tính xách tay OneNote 2013 từ bất kỳ thiết bị nào có truy cập internet. Cách quản lý máy tính xách tay với SkyDrive trên web Bạn có thể truy cập dịch vụ từ bất cứ thiết bị nào bạn đang sử dụng miễn là nó hỗ trợ