Video: Our Miss Brooks: Board of Education Day / Cure That Habit / Professorship at State University 2025
Mục đích chính của dịch vụ lựa chọn dữ liệu và trích xuất là chọn từ (tìm thấy) một nguồn dữ liệu dữ liệu bạn muốn di chuyển vào kho dữ liệu và sau đó trích ra (kéo ra) dữ liệu đó thành một mẫu có thể sẵn sàng cho các dịch vụ đảm bảo chất lượng.
Bạn có thể sử dụng một trong hai loại dịch vụ lựa chọn và chiết xuất cho môi trường lưu trữ dữ liệu của bạn:
Thay đổi theo định hướng: Tìm và trích xuất chỉ các phần tử dữ liệu vừa được thêm vào nguồn dữ liệu hoặc được cập nhật kể từ lần rút cuối cùng.
Bạn có thể so sánh một dãy dữ liệu với ngày và thời gian của quá trình trích xuất cuối cùng để xác định xem liệu dữ liệu cần được chọn và trích xuất hay không. Nhưng khi dữ liệu được lưu trữ trong một tệp tin không có dấu thời gian (ví dụ như tệp VSAM), quá trình này có thể khó khăn hơn đáng kể.
Bạn cũng có thể phải đối mặt với một thách thức khi dữ liệu nguồn đã bị xóa khỏi tệp hoặc cơ sở dữ liệu. Nếu các quy tắc kinh doanh cho môi trường lưu trữ dữ liệu của bạn yêu cầu xóa dữ liệu tương ứng từ kho, bạn phải có một cách để phát hiện các xóa bỏ đã được thực hiện kể từ quá trình trích xuất mới nhất để đảm bảo rằng xóa thích hợp được thực hiện trong kho của bạn.Kết quả của việc lựa chọn và trích xuất là, tốt, một chiết xuất dữ liệu đã sẵn sàng để trải qua quá trình xử lý bổ sung: kiểm tra chất lượng dữ liệu.