Video: BIG DATA for Management - Dữ liệu lớn trong quản trị doanh nghiệp - Đào tạo Tập Đoàn Trí Việt 2025
Kho dữ liệu hiện đang bị căng thẳng, cố gắng đối mặt với tăng nhu cầu về nguồn tài nguyên hữu hạn của họ. Hadoop có thể cung cấp cứu trợ đáng kể trong tình huống kho dữ liệu này.
Sự gia tăng nhanh chóng số lượng dữ liệu được tạo ra trên thế giới cũng ảnh hưởng đến kho dữ liệu vì khối lượng dữ liệu mà họ quản lý đang tăng lên - một phần là do dữ liệu cấu trúc , loại dữ liệu mạnh và được sắp xếp thành hàng và cột - được tạo ra nhưng cũng bởi vì bạn thường phải giải quyết các yêu cầu về quy định được thiết kế để duy trì khả năng truy cập truy vấn được vào dữ liệu lịch sử.
trẻ em (một tập con riêng biệt của kho dữ liệu) cho một ứng dụng phân tích cụ thể. Ngoài ra, nhu cầu ngày càng tăng cho các nhà phân tích đưa ra các truy vấn mới đối với dữ liệu có cấu trúc được lưu trữ trong các kho, và những truy vấn ngẫu nhiên này thường có thể sử dụng các tài nguyên xử lý dữ liệu quan trọng. Đôi khi một báo cáo một lần có thể đủ và đôi khi một phân tích thăm dò là cần thiết để tìm những câu hỏi chưa được yêu cầu mà có thể mang lại giá trị kinh doanh quan trọng.Điểm mấu chốt là các kho dữ liệu thường được sử dụng cho các mục đích ngoài thiết kế ban đầu của họ.
Hình minh họa, sử dụng kiến trúc cấp cao, làm thế nào Hadoop có thể sống bên cạnh kho dữ liệu và đáp ứng một số mục đích mà chúng không được thiết kế.Hadoop là nhà kho
người trợ giúp,
không phải là nhà kho thay thế. Hadoop có thể hiện đại hoá hệ thống lưu trữ dữ liệu theo bốn cách; ở đây chúng được tóm tắt:
-
Sử dụng hiệu quả xử lý hàng loạt quy mô lớn của Hadoop để xử lý và biến đổi dữ liệu cho kho.
-
Cho phép môi trường phát hiện dữ liệu đặc biệt.