Video: Pentaho Hadoop Integration Tutorial | Pentaho Hadoop Integration Training - Youtube 2025
Cloudera là nhà cung cấp phần mềm và dịch vụ Apache Hadoop hàng đầu trên thị trường dữ liệu lớn. Giống như Apache Drill, công nghệ Impala của Cloudera nhằm cải thiện thời gian phản hồi truy vấn tương tác cho người dùng Hadoop. Apache Hive đã cung cấp cơ chế truy vấn quen thuộc và mạnh mẽ cho người dùng Hadoop, nhưng thời gian phản hồi của truy vấn thường không được chấp nhận do sự tin cậy của Hive vào MapReduce. Câu trả lời của Cloudera cho vấn đề này là Impala.
Lưu ý rằng Impala sử dụng HiveQL làm giao diện lập trình, và Động cơ Query Exec của Impala được đặt cùng với các nút dữ liệu HDFS, phù hợp với cách tiếp cận Hadoop của đồng định vị dữ liệu với các tác vụ xử lý. Impala cũng có thể sử dụng HBase như là một kho dữ liệu. Theo nghĩa này, Impala là một phần mở rộng của Apache Hadoop, cung cấp một giải pháp thay thế hiệu suất cao cho mô hình Hive-on-top-of-MapReduce.Bạn có thể tìm thấy công nghệ Impala của Cloudera, cũng được lấy cảm hứng từ sáng chế Dremel của Google.