Video: 3. Cài Đặt Eclipse & Tomcat 2025
Apache Oozie được bao gồm trong mọi phân phối chính của Hadoop, bao gồm Apache Bigtop. Trong cluster Hadoop của bạn, cài đặt máy chủ Oozie trên một nút cạnh, nơi bạn cũng sẽ chạy ứng dụng khách khác với dữ liệu của cụm sao, như được hiển thị.
Các nút cạnh được thiết kế để trở thành cổng cho mạng bên ngoài đến cụm Hadoop. Điều này làm cho chúng trở nên lý tưởng cho các công nghệ truyền dữ liệu (ví dụ như Flume), mà còn các ứng dụng khách và các cơ sở hạ tầng ứng dụng khác như Oozie. Oozie không cần một máy chủ chuyên dụng, và có thể dễ dàng cùng tồn tại với các dịch vụ khác lý tưởng cho các nút cạnh, như Pig và Hive.
Sau khi Oozie được triển khai, bạn đã sẵn sàng để bắt đầu máy chủ Oozie. Cơ sở hạ tầng của Oozie được cài đặt trong thư mục $ OOZIE_HOME. Từ đó, chạy oozie-bắt đầu. sh để khởi động máy chủ. Bạn có thể kiểm tra trạng thái của cá thể Oozie bằng cách chạy câu lệnh
oozie admin -status
Sau khi bạn đã triển khai và khởi động máy chủ Oozie, bạn có thể lập danh mục và chạy các quy trình công việc, điều phối viên hoặc gói công việc khác nhau. Khi làm việc với công việc của bạn, Oozie lưu trữ các định nghĩa danh mục - dữ liệu mô tả tất cả các đối tượng Oozie (luồng công việc, điều phối viên, và công việc bó) - cũng như các trạng thái của chúng trong một cơ sở dữ liệu chuyên dụng.
Theo mặc định, Oozie được cấu hình để sử dụng cơ sở dữ liệu Derby được nhúng, nhưng bạn có thể sử dụng MySQL, Oracle hoặc PostgreSQL, nếu cần.
Bạn có bốn tùy chọn để tương tác với máy chủ Oozie:
-
Java API: Tùy chọn này rất hữu ích trong trường hợp bạn có mã lập kế hoạch của chính mình trong các ứng dụng Java và bạn cần phải kiểm soát việc thực hiện Quy trình công việc, điều phối viên, hoặc bó bóp từ bên trong ứng dụng của bạn.
-
Một lần nữa, tùy chọn này hoạt động tốt trong những trường hợp bạn muốn sử dụng mã lập kế hoạch của chính mình làm nền tảng cho quy trình làm việc, phối hợp hoặc bó của Oozie, hoặc nếu bạn muốn xây dựng giao diện của riêng bạn hoặc mở rộng một cái hiện tại để quản trị máy chủ Oozie. Giao diện dòng lệnh (Command Line Interface - CLI):
-
Đây là giao diện dòng lệnh truyền thống của Linux cho Oozie. Oozie
-
Web Console: Được rồi, có thể bạn không thể tương tác nhiều ở đây, nhưng Oozie Web Console cung cấp cho bạn một chế độ xem (chỉ đọc) về trạng thái của máy chủ Oozie, hữu ích cho việc theo dõi công việc Oozie của bạn. Huế, một giao diện quản trị Hadoop, cung cấp một công cụ khác để làm việc với Oozie.Các luồng công việc, điều phối viên, và bó của Oozie đều được xác định bằng cách sử dụng XML, điều này có thể rất tẻ nhạt khi chỉnh sửa, đặc biệt đối với các tình huống phức tạp. Huế cung cấp một công cụ thiết kế GUI để đồ họa xây dựng công việc và Oozie đối tượng khác.
Bên dưới vỏ bọc, Oozie bao gồm một máy chủ web Tomcat được nhúng, xử lý đầu vào và đầu ra của nó.