Trang Chủ Tài chính Cá nhân Giai đoạn ngẫu nhiên của ứng dụng MapReduce của Hadoop - núm vú

Giai đoạn ngẫu nhiên của ứng dụng MapReduce của Hadoop - núm vú

Video: Video dùng hadoop mapreduce phân tích mã độc 2025

Video: Video dùng hadoop mapreduce phân tích mã độc 2025
Anonim

Sau giai đoạn Bản đồ và trước khi bắt đầu giai đoạn Giảm là một quá trình chuyển giao, được gọi là shuffle and sắp xếp . Ở đây, dữ liệu từ các tác vụ lập bản đồ được chuẩn bị và chuyển đến các nút mà các tác vụ giảm tốc sẽ được chạy. Khi công việc lập bản đồ hoàn thành, các kết quả được sắp xếp theo trọng số, phân vùng nếu có nhiều trình làm giảm và sau đó ghi vào đĩa.

Bạn có thể thấy khái niệm này trong hình sau, hiển thị dòng chảy xử lý dữ liệu MapReduce và sự tương tác của nó với các thành phần vật lý của cụm Hadoop. (Một lưu ý ngắn gọn: Dữ liệu trong bộ nhớ được biểu diễn bằng các ô màu trắng, và dữ liệu được lưu trữ trên đĩa được biểu diễn bởi các ô màu xám)

Lưu ý rằng ngay cả khi một tác vụ giảm thiểu có thể có nhiều kết quả của tác vụ lập bản đồ, quá trình giảm tác vụ không thể bắt đầu cho đến khi tất cả tác vụ lập bản đồ kết thúc.

Để tránh các kịch bản mà hiệu suất của một công việc MapReduce bị cản trở bởi một công việc lập bản đồ straggling đang chạy trên nút slave kém hiệu quả, thì khung MapReduce sử dụng một khái niệm được gọi là

thực thi đầu cơ .

Trong trường hợp một số nhiệm vụ mapper đang chạy chậm hơn so với những gì được coi là hợp lý, thì Application Master sẽ sinh ra các nhiệm vụ trùng lặp (trong Hadoop 1, JobTracker thực hiện việc này). Nhiệm vụ nào kết thúc đầu tiên - bản sao hoặc bản gốc - kết quả của nó được lưu trữ vào đĩa và nhiệm vụ khác bị giết. Nếu bạn đang theo dõi công việc chặt chẽ và tự hỏi tại sao có nhiều tác vụ lập bản đồ hơn bạn mong đợi, đây là một lý do có thể.

Đầu ra từ các tác vụ lập bản đồ không được ghi vào HDFS, mà là cho đĩa cục bộ trên nút nô lệ mà tác vụ lập bản đồ đã được chạy. Do đó, nó không phải được nhân rộng qua cụm Hadoop.

Bên cạnh việc nén kết xuất, bạn có thể tăng hiệu quả hoạt động bằng cách chạy một tác vụ kết hợp. Chiến thuật đơn giản này được trình bày ở đây liên quan đến việc giảm địa phương cho đầu ra cho các tác vụ lập bản đồ riêng lẻ.

Trong phần lớn các trường hợp, bạn không cần thêm chương trình, vì bạn có thể nói hệ thống sử dụng chức năng giảm tốc. Nếu bạn không sử dụng chức năng giảm tốc của mình, bạn cần đảm bảo rằng đầu ra của trình kết hợp giống với chức năng của trình giảm tốc.

Nó phụ thuộc vào framework MapReduce cho dù chức năng combiner cần được chạy một lần, nhiều lần hoặc không bao giờ, vì vậy điều quan trọng là mã của bộ kết hợp đảm bảo rằng các kết quả cuối cùng không bị ảnh hưởng bởi nhiều lần chạy. Chạy bộ kết hợp có thể mang lại lợi ích về hiệu năng bằng cách giảm bớt lượng dữ liệu trung gian, nếu không thì cần phải được truyền qua mạng.

Điều này cũng làm giảm số lượng xử lý các nhiệm vụ giảm thiểu sẽ cần phải làm. Bạn đang chạy một nhiệm vụ thêm ở đây, do đó, có thể là bất kỳ đạt được hiệu suất là không đáng kể hoặc thậm chí có thể dẫn đến hiệu suất tổng thể tồi tệ hơn. Mileage của bạn có thể khác nhau, do đó kiểm tra cẩn thận này.

Sau khi tất cả các kết quả của các tác vụ lập bản đồ được sao chép vào các nút tác vụ giảm thiểu, các tệp này được hợp nhất và sắp xếp.

Giai đoạn ngẫu nhiên của ứng dụng MapReduce của Hadoop - núm vú

Lựa chọn của người biên tập

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Tiếp thị web, một cách để đảm bảo khả năng hiển thị là để loại bỏ đăng ký và các hình thức đăng nhập. Khách truy cập thường phải hoàn thành các biểu mẫu này trước khi họ có thể tải xuống một số loại nội dung cao cấp, chẳng hạn như giấy trắng hoặc trước khi họ có thể đọc một số bài viết trên trang web. Các công ty đã đưa chúng vào vị trí vì họ muốn dẫn ...

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Duplicate nội dung cần tránh trong web tiếp thị và Google cung cấp công cụ để phát hiện thông tin lặp lại. Không có gì gây tổn hại cho việc tìm kiếm nội dung có liên quan của công cụ tìm kiếm cũng như tìm ra chính xác những từ giống nhau trên hai trang khác nhau. Sao chép là xấu vì những lý do này: Sao chép được sử dụng để được một chiến thuật được sử dụng để đánh lừa ...

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Trong bài hát của họ. Là một nhà tiếp thị web, việc xử lý các liên kết hỏng này có thể giúp đảm bảo sự thành công của trang web của bạn. Nếu một công cụ tìm kiếm đạt đến một liên kết bị hỏng, nó không thể tìm thấy trang bạn dự định (rõ ràng) - nhưng nó cũng có thể bỏ trên trang web của bạn hoặc giảm sự liên quan ...

Lựa chọn của người biên tập

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Số dấu phẩy động là số có các phần phân đoạn (thường được thể hiện bằng dấu thập phân). Bạn nên sử dụng một kiểu điểm nổi trong các chương trình Java bất cứ khi nào bạn cần một số có số thập phân, như là 19. 95 hoặc 3. 1415. Java có hai kiểu nguyên thủy cho các số dấu phẩy: float: Sử dụng 4 byte gấp đôi: Sử dụng 8 bytes Trong hầu hết tất cả ...

Tải phiên bản mới nhất của Java - núm vú

Tải phiên bản mới nhất của Java - núm vú

Trước khi bạn có thể viết các chương trình Java cho các thiết bị Android, bạn cần một số phần mềm công cụ, bao gồm cả phiên bản mới nhất của Java. Bạn có thể có được phiên bản Java mới nhất và lớn nhất bằng cách truy cập vào trang web Java. Trang web cung cấp một số lựa chọn thay thế. (Được giới thiệu) Nhấp chuột vào nút Free Java Download trên trang chính của trang web. Đối với hầu hết các máy tính, ...

Thử nghiệm với JShell - núm vú

Thử nghiệm với JShell - núm vú

JShell là một công cụ Java 9 cho phép bạn khám phá về lập trình. JShell làm cho nó dễ dàng để chơi xung quanh mà không sợ hậu quả thảm khốc. Các chương trình Java thường sử dụng cùng kiểu cũ, lúng túng: public class SomethingOrOther {public static void main (String args []) {Một chương trình Java đòi hỏi sự giới thiệu này bởi vì trong Java ...

Lựa chọn của người biên tập

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Bản quyền © 2014 AARP Tất cả các quyền được bảo lưu. Tâm linh và tôn giáo, tình dục, những trò vui nhộn nhịp, sự tham gia của gia đình, lối sống và tiền bạc - tất cả những điều này thường quan trọng đối với những người trên 50 tuổi, nhưng bạn có thể đặt một số cao hơn những người khác. Trong bất kỳ trường hợp nào, điều quan trọng là phải suy nghĩ về họ trước để bạn có thể thảo luận ...

Hẹn hò Sau 50: Nói về Monogami - vú

Hẹn hò Sau 50: Nói về Monogami - vú

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Một vợ một chồng là một vấn đề lớn cho dù bạn là người chưa sẵn sàng cho vợ chồng một vợ chồng và muốn hẹn hò xung quanh hay người chỉ có thể quan hệ tình dục với một người một lần. Đảm bảo đối tác hẹn hò của bạn biết bạn đang đứng ở đâu (hoặc nằm xuống) đối với vợ chồng một vợ chồng ...

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Nếu bạn bị bệnh mãn tính hoặc đe dọa đến mạng sống khi bạn còn nhỏ, bạn đã có kinh nghiệm về sức khoẻ của mình. Có thể bạn phải liên tục kể câu chuyện về vết sẹo ngực hoặc nẹp chân hoặc giải thích số ít các viên thuốc mà bạn phải dùng mỗi ngày. Nó không phải ...