Video: (16) Singly linked list - Danh sách liên kết đơn - Bùi Thế Tâm 2025
Một quan niệm sai lầm phổ biến mà rất nhiều người hâm mộ kho dữ liệu đang nắm giữ là kho dữ liệu duy nhất tốt là một kho dữ liệu lớn - một kho dữ liệu khổng lồ rất lớn. Nhiều người thậm chí còn có lập trường rằng trừ khi họ có một số số lượng lớn các byte thiên văn, nhưng nó không thực sự là một kho dữ liệu.
"Năm trăm gigabyte? Được rồi, đó là kho dữ liệu thực ; nó sẽ là kho dữ liệu tốt hơn, tuy nhiên, nếu nó có ít nhất một terabyte (1 nghìn tỷ byte) dữ liệu. Hai mươi lăm gigabyte? Xin lỗi, đó là một data mart, không phải là một kho dữ liệu. "
Kích thước của một kho dữ liệu là một đặc tính - gần như là một phụ phẩm - của một kho dữ liệu; nó không phải là một mục tiêu. Không ai nên đặt ra với một sứ mệnh để "xây dựng một kho dữ liệu 500 GB có chứa (bất cứ điều gì). "
Để xác định kích thước bạn cần cho kho dữ liệu của bạn, hãy làm theo các bước sau:
-
Xác định sứ mệnh, hoặc mục tiêu kinh doanh, của kho dữ liệu.
Đặt câu hỏi, "Tại sao phải tạo kho này? "
-
Xác định chức năng mà bạn muốn kho dữ liệu có.
Xác định loại câu hỏi mà người dùng sẽ hỏi.
-
Xác định nội dung (loại dữ liệu) nào kho dữ liệu cần hỗ trợ chức năng của nó.
Hiểu những loại câu trả lời mà người dùng của bạn sẽ tìm kiếm.
-
Xác định, dựa vào khối lượng nội dung (dựa trên chức năng, do đó dựa trên nhiệm vụ), bạn cần phải làm cho kho dữ liệu của bạn lớn như thế nào.