Video: GCP-How to Install Cloudera Manager on Google Cloud Cluster 2025
Mỗi nô lệ Nô lệ trong Yet Another Resource Negotiator (YARN) có một trình quản lý Node Manager, hoạt động như một nô lệ cho Resource Manager. Cũng như TaskTracker, mỗi nút nô lệ có một dịch vụ gắn nó với dịch vụ xử lý (Node Manager) và dịch vụ lưu trữ (DataNode) cho phép Hadoop trở thành một hệ thống phân phối.
Mỗi Node Manager theo dõi các tài nguyên xử lý dữ liệu có sẵn trên nút slave và gửi các báo cáo định kỳ tới Resource Manager.
Các tài nguyên xử lý trong một cụm Hadoop được tiêu thụ trong các miếng kích thước cắn gọi là container. container là bộ sưu tập tất cả các tài nguyên cần thiết để chạy một ứng dụng: lõi CPU, bộ nhớ, băng thông mạng và không gian đĩa. Một container được triển khai chạy như một quá trình cá nhân trên một nút nô lệ trong một cụm Hadoop.
Khái niệm container có thể nhắc nhở bạn về khe , đơn vị xử lý được sử dụng bởi JobTracker và TaskTracker, nhưng chúng có một số khác biệt đáng chú ý. Điều đáng lưu ý nhất là các thùng chứa chung và có thể chạy bất kỳ ứng dụng logic nào họ đưa ra, không giống như các khe cắm, được xác định cụ thể để chạy hoặc là bản đồ hoặc giảm các nhiệm vụ. Ngoài ra, container có thể được yêu cầu với số tiền tùy chỉnh các nguồn lực, trong khi khe cắm đều thống nhất.
Miễn là số tiền yêu cầu nằm trong phạm vi tối đa và tối đa của những gì có thể chấp nhận được đối với một container (và miễn là số lượng bộ nhớ yêu cầu là một số lượng lớn), Resource Manager sẽ cấp và lập kế hoạch cho container đó.
Tất cả các tiến trình lưu trữ đang chạy trên một nút nô lệ ban đầu được cung cấp, giám sát và theo dõi bởi trình quản lý Node Manager nút nô lệ đó.