Video: SCP Foundation Security Clearance Levels Guide 2025
Tổ chức các dịch vụ và công cụ dữ liệu , lớp 3 của ngăn xếp dữ liệu lớn, chụp, xác nhận tính hợp lệ, và tập hợp các yếu tố dữ liệu lớn vào các ngữ cảnh có liên quan bộ sưu tập. Bởi vì dữ liệu lớn là lớn, các kỹ thuật đã phát triển để xử lý dữ liệu hiệu quả và liền mạch. MapReduce là một kỹ thuật được sử dụng nhiều. Chỉ cần nói ở đây là nhiều dịch vụ dữ liệu tổ chức này là các công cụ MapReduce, được thiết kế đặc biệt để tối ưu hóa việc tổ chức các luồng dữ liệu lớn.
Tổ chức các dịch vụ dữ liệu là trên thực tế là một hệ sinh thái các công cụ và công nghệ có thể được dùng để thu thập và tập hợp dữ liệu để chuẩn bị cho việc xử lý tiếp. Như vậy, các công cụ cần phải cung cấp sự tích hợp, dịch thuật, bình thường hoá và quy mô. Các công nghệ trong lớp này bao gồm:
-
Một hệ thống tập tin phân tán: Cần thiết để phân tán các luồng dữ liệu và cung cấp quy mô và dung lượng lưu trữ
-
Cần thiết cho việc lưu trữ dữ liệu liên tục và các cuộc gọi thủ tục từ xa đa ngôn ngữ (RPCs) Các dịch vụ điều phối:
-
Cần thiết để xây dựng các ứng dụng phân tán (khóa …) > Các công cụ trích xuất, chuyển đổi và tải (ETL): Cần thiết cho việc tải và chuyển đổi dữ liệu có cấu trúc và không có cấu trúc thành Hadoop
-
Các dịch vụ quy trình làm việc: Cần thiết cho lập kế hoạch công việc và cung cấp cấu trúc để đồng bộ các yếu tố quá trình lớp
-