Video: [Data Warehouse 02] - Cách Kết Nối Database Nguồn Và Đích Để ETL Data 2025
Một số định nghĩa của ODS làm cho nó giống như một kho dữ liệu cổ điển với các đầu vào định kỳ (lô) từ các nguồn hoạt động khác nhau vào ODS, ngoại trừ các đầu vào mới ghi đè dữ liệu hiện có.
Ví dụ như trong một ngân hàng, ODS (theo định nghĩa này) có, trong một khoảng thời gian nhất định, một số dư tài khoản cho mỗi tài khoản kiểm tra, nhờ hệ thống kiểm tra và một khoản dư cho mỗi tài khoản tiết kiệm, hệ thống tài khoản tiết kiệm.
Các hệ thống khác nhau gửi số dư tài khoản định kỳ (chẳng hạn như vào cuối mỗi ngày) và người dùng ODS sau đó có thể tìm ở một nơi để xem hồ sơ đầy đủ của từng khách hàng ngân hàng (chẳng hạn như khách hàng của thông tin cơ bản và thông tin cân đối cho từng loại tài khoản).
Một trong những khái niệm khó hiểu nhất trong thế giới của kho dữ liệu là kho lưu trữ dữ liệu hoạt động. Không ai thực sự đồng ý về ODS thực sự là gì.
Nếu bạn muốn gọi một môi trường như ODS, bằng mọi cách, đi đúng hướng. Thuật ngữ bên lề, ví dụ này chỉ là một môi trường kho lưu trữ dữ liệu định hướng theo lô thực hiện hoạt động cập nhật và thay thế trên mỗi đoạn dữ liệu nằm ở đó (và, tất nhiên, thêm dữ liệu mới nếu có) chứ không phải giữ lịch sử đang chạy bất kỳ biện pháp nào được lưu trữ ở đó.
Bạn có thể thực hiện cái gọi là ODS một cách dễ dàng và thậm chí bạn có thể sử dụng các công cụ và dịch vụ trung gian định hướng theo đợt và các công cụ báo cáo và OLAP.
Một phiên bản khác của ODS là một chút thách thức về mặt kiến trúc. Nó sử dụng phương pháp tiếp cận đầu cuối đòi hỏi các ứng dụng cho phép kho (vì bạn biết rằng họ sẽ cung cấp dữ liệu cho một kho dữ liệu). Các ứng dụng cho phép kho lưu trữ hỗ trợ kiến trúc push hoặc pull và cho phép làm mới cơ sở dữ liệu thông tin theo thời gian thực (hoặc gần thời gian thực).
Mặc dù cơ sở của việc phá vỡ các rào cản ứng dụng và hệ thống là rất phù hợp với những gì bạn làm với kho dữ liệu, bạn có một vấn đề lớn: Tốc độ cập nhật vào môi trường thông tin và phân tích của bạn là quá chậm nếu bạn sử dụng kho dữ liệu cổ điển và các quy trình định hướng hàng loạt để trích xuất và di chuyển dữ liệu.
Hãy quên đi thuật ngữ và thuật ngữ. Thay vào đó tập trung vào sự khác biệt kiến trúc và thời gian giữa ODS.