Video: Phân Tích Dữ Liệu BIGDATA - [ [Trần Minh Quang] 2025
Vì có bề rộng rộng của các lĩnh vực chủ đề trong một kho dữ liệu tối cao, nó có nhiều nguồn dữ liệu. Tin tốt: Vì nhiều nguồn bên ngoài môi trường lưu trữ của riêng bạn, bạn không phải chịu trách nhiệm cá nhân về việc khai thác, chuyển đổi và tải để đưa chúng vào kho của bạn.
Tin xấu: Ai đó phải thực hiện các tác vụ đó và bạn có ít hoặc không kiểm soát được các yếu tố như quy trình đảm bảo chất lượng hoặc tần suất dữ liệu được làm mới.
Tuy nhiên, có nhiều tin tốt hơn: Bởi vì phần quan trọng nhất của kho dữ liệu tối cao vẫn là dữ liệu thu thập được nội bộ (dữ liệu đến từ các ứng dụng nội bộ của bạn), từ khía cạnh đó, những điều bạn làm ngày hôm nay để làm cho kho dữ liệu sẵn sàng sẽ vẫn được thực hiện trong tương lai.
Vì bạn khai thác tối đa kho dữ liệu của bạn với thông tin đa phương tiện - ngoài các dữ liệu truyền thống, chẳng hạn như số, chữ và thời gian - các loại nguồn dữ liệu được mở rộng từ các ứng dụng truyền thống tới các máy chủ video, các trang Web và các cơ sở dữ liệu lưu trữ các tài liệu và văn bản.
Sự kết hợp như vậy, được gọi là
các mash-up, đang trở nên phổ biến hơn và cho phép người dùng xem dữ liệu từ kho dữ liệu tối cao dưới các hình thức thực tế hơn chứ không phải các cột trong một báo cáo, nhưng các dấu chấm Bản đồ. Sự khác biệt lớn nhất giữa các kho dữ liệu tiên tiến hiện nay và kho dữ liệu tối cao là sự gia tăng đáng kể việc sử dụng công nghệ đẩy. Bằng cách sử dụng các đại lý thông minh ("trợ lý" bạn lập trình để thực hiện một số chức năng nhất định cho bạn), bạn có thể có thông tin cho bạn từ cuối vũ trụ trên Internet, chưa kể đến các máy chủ kho dữ liệu của chính bạn trong công ty của bạn.
Con số này minh hoạ một số cách mà các đại lý thông minh có thể giúp bạn thực hiện việc sử dụng kho dữ liệu rất hiệu quả.