Video: The future of gaming at Google 2025
Con số này cho thấy một môi trường trong đó dữ liệu được trích ra từ ba nguồn dữ liệu khác nhau để đưa vào một kho dữ liệu, và mỗi một trong ba nguồn trên một nền tảng khác nhau. Tại một số điểm trong quá trình trung gian, các trích dẫn QA'd phải được thu thập cùng nhau để tạo ra quá trình lập bản đồ và chuyển đổi kết hợp.
Dịch vụ lập bản đồ và chuyển đổi xử lý các vấn đề kho dữ liệu cổ điển. Giả sử rằng một nguồn dữ liệu lưu trữ khách hàng bằng cách sử dụng ID khách hàng năm ký tự và một nguồn khác sử dụng số nhận dạng khách hàng số sáu chữ số.
Để cho phép so sánh và xử lý kho dữ liệu khác, bạn cần một phương pháp phổ biến để nhận diện khách hàng: Một trong những chương trình xác định phải được chuyển sang hệ thống nhận dạng trung tính khác, hoặc có thể thứ ba, tùy thuộc vào đặc điểm của môi trường.
Tóm tắt dữ liệu:-
Một bản tóm tắt có thể được thực hiện sớm hơn trong quá trình, trước khi chuyển động qua hệ thống, tùy thuộc vào đặc thù của môi trường kho dữ liệu cụ thể của bạn. Việc chọn lọc dữ liệu có chọn lọc:
-
Bạn có thể bao gồm các bản ghi từ một nguồn dữ liệu, ví dụ: nếu bạn nhận được bản ghi so sánh từ một trích xuất khác. Bạn không biết, cho đến khi bạn tập trung tất cả các đóng góp của nguồn dữ liệu, làm thế nào áp dụng các quy tắc bao gồm được áp dụng. Điểm chính cần nhớ về dịch vụ lập bản đồ và chuyển đổi là bạn cần có một bộ dữ liệu hợp nhất sẵn sàng để tải vào kho dữ liệu sau khi bạn hoàn thành thêm vài bước nữa.
-
Trong các môi trường kho dữ liệu phức tạp, bạn có thể muốn cân nhắc nhiều quá trình chuyển đổi. Như thể hiện trong hình này, ví dụ, dữ liệu chiết xuất hội tụ ở một số mức độ biến đổi khác nhau trước khi di chuyển xuống dưới đường ống dẫn trung gian, cho phép bạn áp dụng nhiều mã lực cho quá trình chuyển đổi bằng cách sử dụng nhiều máy chủ trong dòng chảy sớm.