Video: TẬN DỤNG BIG DATA - BIẾN DỮ LIỆU THÀNH LỢI NHUẬN - Tin Tức VTV24 2025
Kho dữ liệu là nơi chứa dữ liệu có giá trị cao của bạn, hoặc tài sản dữ liệu . Hầu hết các tổ chức xây dựng kho dữ liệu cho các tài sản dữ liệu được sản xuất theo cách tương đối đơn giản, theo các bước sau:
-
Nhóm lưu trữ dữ liệu (thường là các nhà phân tích máy tính và lập trình viên) lựa chọn một khu vực tập trung theo dõi và báo cáo hoạt động bán hàng sản phẩm của công ty so với các đối thủ cạnh tranh.
-
Nhóm phụ trách xây dựng kho dữ liệu chỉ định một nhóm người dùng doanh nghiệp và các cá nhân chủ chốt trong công ty để đóng vai trò của các chuyên gia về chủ đề.
Cùng nhau, đội ngũ nhân viên lưu trữ dữ liệu và chuyên gia về chủ đề biên soạn một danh sách các loại thông tin khác nhau có thể cho phép họ sử dụng kho dữ liệu để giúp theo dõi hoạt động bán hàng (hoặc bất kể trọng tâm là gì cho dự án).
-
Nhóm sau đó đi qua danh sách thông tin (tài sản dữ liệu), từng mục, và chỉ ra nơi mà kho dữ liệu có thể lấy được một phần dữ liệu cụ thể đó.
Trong hầu hết các trường hợp, nhóm có thể lấy dữ liệu từ ít nhất một cơ sở dữ liệu bên trong (bên trong công ty) hoặc tệp tin, như tệp cơ sở dữ liệu chủ của tất cả khách hàng địa chỉ hiện tại.
Trong các trường hợp khác, một phần thông tin không có trong các ứng dụng máy tính của công ty, nhưng bạn có thể lấy nó bằng cách mua nó từ một số công ty khác. Mặc dù ngân hàng không có xếp hạng tín dụng và tổng nợ tồn đọng cho tất cả khách hàng trong nội bộ, ví dụ, nó có thể mua thông tin đó từ bên thứ ba - một văn phòng tín dụng.
-
Sau khi hoàn thành các chi tiết về nơi kinh doanh có thể nhận được từng phần thông tin, đội lưu trữ dữ liệu tạo ra các chương trình khai thác.
Các chương trình trích xuất thu thập dữ liệu từ các cơ sở dữ liệu và tệp tin khác nhau, sao chép dữ liệu nhất định vào vùng dàn (vùng làm việc bên ngoài kho dữ liệu), làm sạch dữ liệu để đảm bảo rằng dữ liệu không có lỗi và sau đó sao chép dữ liệu có chất lượng cao hơn (dữ liệu dữ liệu) vào kho dữ liệu. Các chương trình trích xuất được tạo bằng tay (mã tùy chỉnh) hoặc bằng cách sử dụng các sản phẩm lưu trữ dữ liệu chuyên dụng - các công cụ ETL (giải nén, chuyển đổi và tải).
Bạn có thể xây dựng kho dữ liệu thành công bằng cách dành thời gian đầy đủ cho hai bước đầu tiên trong danh sách này (phân tích nhu cầu kho dữ liệu và cách bạn nên sử dụng nó), làm cho hai bước tiếp theo (thiết kế và triển khai dữ liệu kho để làm cho nó sẵn sàng để sử dụng) dễ dàng hơn để thực hiện.
Thật thú vị, các bước phân tích (xác định trọng tâm của kho dữ liệu và làm việc chặt chẽ với người dùng doanh nghiệp để tìm ra thông tin nào là quan trọng) gần giống với các bước cho bất kỳ loại ứng dụng máy tính khác. Hầu hết các ứng dụng máy tính tạo ra dữ liệu do kết quả của một giao dịch hoặc một tập hợp các giao dịch trong khi một ứng dụng cụ thể đang được sử dụng để điều hành doanh nghiệp, chẳng hạn như điền vào đơn hàng của khách hàng.
Sự khác biệt chính giữa các ứng dụng chạy kinh doanh và kho dữ liệu là kho dữ liệu phụ thuộc hoàn toàn vào dữ liệu thu được từ các ứng dụng và nguồn khác. Con số này cho thấy sự khác biệt giữa hai loại môi trường.