Video: [Nhạc chế] - KẾ HOẠCH TÁN TRAI - Những chị đại học đường 2 - Hậu Hoàng ft Nhung Phương 2025
Trước khi bạn có thể chạy kịch bản Chim đầu tiên của bạn trong Hadoop, bạn cần phải có một xử lý về cách các chương trình Lợn có thể được đóng gói với máy chủ Pig.
Heo có hai chế độ chạy các kịch bản:
-
Chế độ Địa phương: Tất cả các tập lệnh được chạy trên một máy duy nhất mà không yêu cầu Hadoop MapReduce và HDFS. Điều này có thể hữu ích cho việc phát triển và thử nghiệm logic lợn. Nếu bạn đang sử dụng một bộ dữ liệu nhỏ để phát triển hoặc thử nghiệm mã của bạn, thì chế độ địa phương có thể nhanh hơn so với thông qua cơ sở hạ tầng MapReduce.
Chế độ địa phương không yêu cầu Hadoop. Khi bạn chạy ở chế độ Local, chương trình Pig chạy trong bối cảnh của một máy ảo Java cục bộ, và truy cập dữ liệu là thông qua hệ thống tệp nội bộ của một máy duy nhất. Chế độ địa phương thực sự là mô phỏng địa phương của MapReduce trong lớp LocalJobRunner của Hadoop.
-
Chế độ MapReduce (còn gọi là chế độ Hadoop): Pig được thực hiện trên cụm Hadoop. Trong trường hợp này, Tập lệnh lợn được chuyển đổi thành một loạt các công việc MapReduce sau đó chạy trên cụm Hadoop.
Nếu bạn có một terabyte dữ liệu mà bạn muốn thực hiện các hoạt động và bạn muốn phát triển một chương trình tương tác, bạn có thể sớm tìm thấy mọi thứ đang giảm tốc độ đáng kể và bạn có thể bắt đầu tăng dung lượng của mình. Chế độ địa phương cho phép bạn làm việc với tập con của dữ liệu một cách tương tác hơn để bạn có thể tìm ra logic (và tìm ra lỗi) của chương trình Lợn của bạn.
Sau khi bạn đã thiết lập mọi thứ theo ý muốn và hoạt động của mình đang chạy trơn tru, sau đó bạn có thể chạy tập lệnh đối với bộ dữ liệu đầy đủ bằng cách sử dụng chế độ MapReduce.