Trang Chủ Tài chính Cá nhân Theo dõi các khối dữ liệu với NameNode trong HDFS - núm vú

Theo dõi các khối dữ liệu với NameNode trong HDFS - núm vú

Mục lục:

Video: Bigdata 2025

Video: Bigdata 2025
Anonim

NameNode đóng vai trò là sổ địa chỉ cho Hệ thống tệp phân phối Hadoop (HDFS) bởi vì nó không biết chỉ có khối tạo thành các tập tin cá nhân mà còn là nơi mà mỗi khối và các bản sao của chúng được lưu trữ. Khi người dùng lưu trữ một tệp tin trong HDFS, tệp tin được chia thành các khối dữ liệu và ba bản sao của các khối dữ liệu này được lưu trữ trong các nút nô lệ trong toàn bộ cụm Hadoop.

Đó là rất nhiều khối dữ liệu để theo dõi. Như bạn có thể mong đợi, biết nơi mà cơ thể được chôn cất làm cho NameNode là một thành phần quan trọng trong một cụm Hadoop. Nếu NameNode không có sẵn, các ứng dụng không thể truy cập bất kỳ dữ liệu nào được lưu trữ trong HDFS.

Nếu bạn nhìn vào hình dưới đây, bạn có thể thấy daemon NameNode đang chạy trên một máy chủ nút chủ. Tất cả các thông tin lập bản đồ xử lý các khối dữ liệu và các tệp tương ứng của chúng được lưu trữ trong một tệp có tên.

HDFS là một hệ thống tệp nhật ký, có nghĩa là bất kỳ thay đổi dữ liệu nào được ghi lại trong một tạp chí chỉnh sửa theo dõi các sự kiện kể từ điểm kiểm soát 999 cuối cùng - lần cuối cùng khi nhật ký chỉnh sửa được hợp nhất với. Trong HDFS, tạp chí chỉnh sửa được duy trì trong tệp có tên tên đó được lưu trữ trên NameNode.

NameNode khởi động và hoạt động

Để hiểu cách thức hoạt động của NameNode, bạn nên xem xét cách thức hoạt động của nó. Bởi vì mục đích của NameNode là để thông báo cho các ứng dụng về khối lượng khối dữ liệu mà họ cần để xử lý và để theo dõi vị trí chính xác nơi chúng được lưu trữ, nó cần tất cả các vị trí chặn và các ánh xạ khối-đến-tệp có sẵn trong RAM.

Đây là các bước mà NameNode mất. Để tải tất cả thông tin mà NameNode cần sau khi khởi động, sẽ xảy ra:

NameNode tải tập tin vào bộ nhớ.
  1. NameNode tải tệp và đóng lại các thay đổi đã ghi lại để cập nhật siêu dữ liệu khối đã có trong bộ nhớ.

  2. Daemon của DataNode gửi báo cáo khối NameNode.

  3. Đối với mỗi nút slave, có một báo cáo khối liệt kê tất cả các khối dữ liệu được lưu giữ ở đó và mô tả sức khoẻ của mỗi.

    Sau khi quá trình khởi động hoàn tất, NameNode có một bức tranh hoàn chỉnh về tất cả dữ liệu được lưu trữ trong HDFS và nó đã sẵn sàng để nhận các yêu cầu ứng dụng từ các máy khách Hadoop.

Khi các tệp dữ liệu được thêm vào và gỡ bỏ dựa trên các yêu cầu của khách hàng, các thay đổi được ghi vào khối lượng đĩa của các nút nô lệ, nhật ký cập nhật được thực hiện cho tệp, và những thay đổi được phản ánh trong các vị trí khối và siêu dữ liệu được lưu trữ trong bộ nhớ của NameNode.

Trong suốt cuộc đời của cụm, các daemon của DataNode gửi các xung nhịp tim NameNode (một tín hiệu nhanh) cứ ba giây một lần, cho thấy chúng đang hoạt động.(Giá trị mặc định này có thể được cấu hình). Mỗi sáu giờ (một lần nữa, một mặc định có thể định cấu hình), các DataNodes gửi NameNode một báo cáo khối phác thảo các khối tập tin nào trên các nút của chúng. Bằng cách này, NameNode luôn có chế độ xem hiện tại về các tài nguyên có sẵn trong cluster.

Viết dữ liệu

Để tạo các tệp tin mới trong HDFS, quá trình sau sẽ phải diễn ra:

Máy khách gửi yêu cầu đến NameNode để tạo một tệp tin mới.

  1. NameNode xác định số lượng khối cần thiết, và client được cấp

    lease để tạo các khối tin mới trong cluster. Là một phần của hợp đồng cho thuê này, khách hàng có một thời gian để hoàn thành nhiệm vụ tạo. (Hạn chế thời gian này đảm bảo không gian lưu trữ không được thực hiện bởi các ứng dụng khách không thành công) Khách hàng sau đó sẽ viết các bản sao đầu tiên của khối tệp tin tới các nút nô lệ sử dụng hợp đồng được NamesNode chỉ định.

  2. NameNode xử lý các yêu cầu ghi và xác định nơi các khối tập tin và các bản sao của chúng cần phải được viết, cân bằng tính sẵn có và hiệu năng. Bản sao đầu tiên của một khối tập tin được viết trong một ngăn, và bản sao thứ hai và thứ ba được viết trên một giá khác với bản sao đầu tiên, nhưng ở các nút nô lệ khác nhau trong cùng một giá. Sự sắp xếp này giảm thiểu lưu lượng mạng trong khi đảm bảo rằng không có khối dữ liệu nào có cùng độ trễ.

    Khi mỗi khối được ghi vào HDFS, một quy trình đặc biệt ghi các bản sao còn lại vào các nút nô lệ khác được xác định bởi NameNode.

  3. Sau khi các daemon của DataNode thừa nhận các bản sao khối tập tin đã được tạo, ứng dụng khách đóng tệp và thông báo cho NameNode, sau đó đóng hợp đồng thuê mở.

  4. Đọc dữ liệu

Để đọc các tập tin từ HDFS, tiến trình sau sẽ phải diễn ra:

Máy khách gửi yêu cầu đến NameNode cho một tệp tin.

  1. NameNode xác định khối nào có liên quan và chọn, dựa trên khoảng cách chung giữa các khối với nhau và cho khách hàng, con đường truy cập hiệu quả nhất.

    Máy khách sau đó truy cập vào các khối sử dụng các địa chỉ được cung cấp bởi NameNode.

  2. Cân bằng dữ liệu trong cụm Hadoop

Theo thời gian, với sự kết hợp của các mẫu dữ liệu không đồng đều (ở đó một số nút nô lệ có thể có nhiều dữ liệu hơn) hoặc các lỗi của nút, dữ liệu có thể sẽ phân bố không đồng đều trên các kệ và các nút nô lệ trong cụm Hadoop của bạn.

Sự phân bố không đồng đều này có thể gây ảnh hưởng bất lợi đến hiệu suất bởi vì nhu cầu về các nút nô lệ cá nhân sẽ không cân bằng; các nút có ít dữ liệu sẽ không được sử dụng đầy đủ; và các nút với nhiều khối sẽ bị lạm dụng. (Lưu ý: Việc sử dụng và sử dụng quá mức dựa trên hoạt động của đĩa, chứ không phải trên CPU hoặc RAM) HDFS bao gồm một tiện ích cân bằng để phân phối lại các khối từ các nút nô lệ đã sử dụng quá mức sang các nút còn lại khối trên nô lệ khác nhau nút và kệ. Quản trị viên Hadoop nên thường xuyên kiểm tra sức khoẻ của HDFS và nếu dữ liệu phân phối không đồng đều, họ nên gọi tiện ích cân bằng.

Thiết kế máy chủ chủ NameNode

Vì bản chất nhiệm vụ quan trọng của nó, máy chủ chủ chạy daemon NameNode yêu cầu các yêu cầu phần cứng khác biệt rõ rệt hơn so với máy chủ cho nút nô lệ. Hầu hết các thành phần cấp doanh nghiệp cần được sử dụng để giảm thiểu khả năng bị mất điện. Ngoài ra, bạn cần đủ bộ nhớ RAM để tải vào bộ nhớ tất cả dữ liệu siêu dữ liệu và vị trí về tất cả các khối dữ liệu được lưu trữ trong HDFS.

Theo dõi các khối dữ liệu với NameNode trong HDFS - núm vú

Lựa chọn của người biên tập

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Tiếp thị web, một cách để đảm bảo khả năng hiển thị là để loại bỏ đăng ký và các hình thức đăng nhập. Khách truy cập thường phải hoàn thành các biểu mẫu này trước khi họ có thể tải xuống một số loại nội dung cao cấp, chẳng hạn như giấy trắng hoặc trước khi họ có thể đọc một số bài viết trên trang web. Các công ty đã đưa chúng vào vị trí vì họ muốn dẫn ...

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Duplicate nội dung cần tránh trong web tiếp thị và Google cung cấp công cụ để phát hiện thông tin lặp lại. Không có gì gây tổn hại cho việc tìm kiếm nội dung có liên quan của công cụ tìm kiếm cũng như tìm ra chính xác những từ giống nhau trên hai trang khác nhau. Sao chép là xấu vì những lý do này: Sao chép được sử dụng để được một chiến thuật được sử dụng để đánh lừa ...

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Trong bài hát của họ. Là một nhà tiếp thị web, việc xử lý các liên kết hỏng này có thể giúp đảm bảo sự thành công của trang web của bạn. Nếu một công cụ tìm kiếm đạt đến một liên kết bị hỏng, nó không thể tìm thấy trang bạn dự định (rõ ràng) - nhưng nó cũng có thể bỏ trên trang web của bạn hoặc giảm sự liên quan ...

Lựa chọn của người biên tập

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Số dấu phẩy động là số có các phần phân đoạn (thường được thể hiện bằng dấu thập phân). Bạn nên sử dụng một kiểu điểm nổi trong các chương trình Java bất cứ khi nào bạn cần một số có số thập phân, như là 19. 95 hoặc 3. 1415. Java có hai kiểu nguyên thủy cho các số dấu phẩy: float: Sử dụng 4 byte gấp đôi: Sử dụng 8 bytes Trong hầu hết tất cả ...

Tải phiên bản mới nhất của Java - núm vú

Tải phiên bản mới nhất của Java - núm vú

Trước khi bạn có thể viết các chương trình Java cho các thiết bị Android, bạn cần một số phần mềm công cụ, bao gồm cả phiên bản mới nhất của Java. Bạn có thể có được phiên bản Java mới nhất và lớn nhất bằng cách truy cập vào trang web Java. Trang web cung cấp một số lựa chọn thay thế. (Được giới thiệu) Nhấp chuột vào nút Free Java Download trên trang chính của trang web. Đối với hầu hết các máy tính, ...

Thử nghiệm với JShell - núm vú

Thử nghiệm với JShell - núm vú

JShell là một công cụ Java 9 cho phép bạn khám phá về lập trình. JShell làm cho nó dễ dàng để chơi xung quanh mà không sợ hậu quả thảm khốc. Các chương trình Java thường sử dụng cùng kiểu cũ, lúng túng: public class SomethingOrOther {public static void main (String args []) {Một chương trình Java đòi hỏi sự giới thiệu này bởi vì trong Java ...

Lựa chọn của người biên tập

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Bản quyền © 2014 AARP Tất cả các quyền được bảo lưu. Tâm linh và tôn giáo, tình dục, những trò vui nhộn nhịp, sự tham gia của gia đình, lối sống và tiền bạc - tất cả những điều này thường quan trọng đối với những người trên 50 tuổi, nhưng bạn có thể đặt một số cao hơn những người khác. Trong bất kỳ trường hợp nào, điều quan trọng là phải suy nghĩ về họ trước để bạn có thể thảo luận ...

Hẹn hò Sau 50: Nói về Monogami - vú

Hẹn hò Sau 50: Nói về Monogami - vú

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Một vợ một chồng là một vấn đề lớn cho dù bạn là người chưa sẵn sàng cho vợ chồng một vợ chồng và muốn hẹn hò xung quanh hay người chỉ có thể quan hệ tình dục với một người một lần. Đảm bảo đối tác hẹn hò của bạn biết bạn đang đứng ở đâu (hoặc nằm xuống) đối với vợ chồng một vợ chồng ...

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Nếu bạn bị bệnh mãn tính hoặc đe dọa đến mạng sống khi bạn còn nhỏ, bạn đã có kinh nghiệm về sức khoẻ của mình. Có thể bạn phải liên tục kể câu chuyện về vết sẹo ngực hoặc nẹp chân hoặc giải thích số ít các viên thuốc mà bạn phải dùng mỗi ngày. Nó không phải ...