Trang Chủ Tài chính Cá nhân Middleware Dịch vụ: Bảo đảm Chất lượng Dữ liệu - núm vú

Middleware Dịch vụ: Bảo đảm Chất lượng Dữ liệu - núm vú

Mục lục:

Video: The future of gaming at Google 2025

Video: The future of gaming at Google 2025
Anonim

Bạn nên thiết lập hai dịch vụ đảm bảo chất lượng khác nhau trong dịch vụ middleware. Bạn phải thực hiện các tác vụ QA đầu tiên đối với trích từ nguồn dữ liệu trước khi bạn thực hiện thêm bất kỳ dịch vụ trung gian nào.

Bảo đảm chất lượng dữ liệu: phần I

Cố gắng tìm và sửa lỗi và các vấn đề sớm nhất trong quá trình xử lý. Việc di chuyển dữ liệu xuống đường ống dẫn đến kho dữ liệu là vô nghĩa nếu những vấn đề quá đáng kể hoặc họ cần nhiều nỗ lực hơn nữa để sửa lỗi trong quá trình xử lý hoặc không thể sửa chữa được.

Vì vậy, bạn nên tìm những loại vấn đề gì? Dưới đây là một số ví dụ:

  • Giá trị trong các phần tử dữ liệu vượt quá phạm vi hợp lý: Một khách hàng đã gửi 150 triệu đơn đặt hàng trong tháng vừa qua, hoặc nhân viên đã làm việc với công ty trong 4 năm 297, theo cơ sở dữ liệu nhân viên và ngày thuê được lưu trữ.

  • Giá trị trong các phần tử dữ liệu không phù hợp với danh sách chính thức và đầy đủ các giá trị cho phép: Một giá trị có thể có mã A, ví dụ, khi giá trị cho phép duy nhất cho trường đó là M và F. (Nếu lĩnh vực đó đã được dán nhãn GENDER, A có thể đứng cho androgynous!)

  • Không nhất quán giữa các bảng: Đối với các mục nhập trong bảng CUSTOMER_ORDER, không có mục nhập tương ứng nào (như được xác định bởi CUSTOMER_ID) trong CUSTOMER_MASTER_TABLE.

  • Sự không nhất quán giữa các trường: Các hồ sơ có tiểu bang hoặc mã vùng không chính xác cho thành phố được chỉ định.

  • Thiếu giá trị: Các bản ghi có giá trị thiếu trong các trường nhất định mà chúng cần có nội dung.

  • Ví dụ: bảng nguồn phải bao gồm một dãy dữ liệu bao gồm tổng số đơn vị bán ra và bán hàng cho mỗi tháng trong hai năm qua. Tuy nhiên, đối với một số lượng lớn khách hàng, không có hàng tồn tại trong ít nhất một trong những tháng đó. Dữ liệu chưa đầy đủ:

  • Nếu thông tin về mọi sản phẩm mà công ty bán được cho là có sẵn, ví dụ như tất cả các sản phẩm có trong chiết xuất? Vi phạm các quy tắc kinh doanh:

  • Nếu quy tắc kinh doanh chỉ ra rằng chỉ có một người bán sỉ có thể bán sản phẩm cho bất kỳ khách hàng nào của công ty, bạn nên kiểm tra xem liệu bất kỳ hồ sơ khách hàng nào có ghi nhận doanh số bán hàng thông qua nhiều người bán sỉ, có thể chỉ ra dữ liệu không chính xác trong nguồn. Tham nhũng dữ liệu từ trích xuất cuối:

  • Nếu khai thác xảy ra hàng tháng, ví dụ: bạn nên theo dõi các giá trị dữ liệu hoặc các khoản tiền phải là không đổi, chẳng hạn như BÁN HÀNG TRONG MỘT THÁNG.Nếu trong một tháng tiếp theo, giá trị BÁN HÀNG cho mỗi khách hàng thay đổi cho một khách hàng nhất định trong một tháng trước, dữ liệu cơ bản có thể đã bị hỏng. Sự mâu thuẫn chính tả:

  • Tên của khách hàng được đánh vần theo nhiều cách khác nhau. Bạn làm gì khi gặp vấn đề? Bạn có thể thử một trong các kỹ thuật sau:

Áp dụng quy tắc hiệu chỉnh tự động.

  • Khi bạn tìm kiếm chính tả không nhất quán, hãy thực hiện tìm kiếm trong bảng tổng thể về sửa đổi chính tả trước đó và tự động thực hiện thay đổi dữ liệu. Dành riêng hồ sơ cho một thành viên nhóm để phân tích và hiệu chỉnh sau.

  • Trong trường hợp này, bạn có thể thực hiện phần nhân lực của QA cùng với việc điều chỉnh tự động. Chẳng hạn, nếu có thể, sửa chữa tự động được thực hiện và báo cáo về các vấn đề khác được đưa vào một tệp tin riêng và được gửi đến người bảo đảm chất lượng. Khi người QA thực hiện tất cả các chỉnh sửa bằng tay, bạn kết hợp các sự chỉnh sửa lại thành dữ liệu đã trải qua quá trình kiểm tra chất lượng tự động.

    Làm mát máy bay phản lực của bạn.

  • Nếu bạn phát hiện ra đủ các vấn đề nghiêm trọng hoặc đòi hỏi một lượng nghiên cứu không xác định, hãy cân nhắc việc tạm dừng toàn bộ quá trình cho đến khi bạn tìm và khắc phục sự cố. Bạn có thể làm cho quy trình kiểm định chất lượng hiệu quả hơn nhiều và ít gặp vấn đề hơn nếu bạn thực hiện phân tích hệ thống nguồn toàn diện. Nếu bạn có một ý tưởng khá rõ về loại sự cố dữ liệu bạn có thể tìm thấy trong mỗi nguồn dữ liệu, bạn có thể lập trình lại quy trình kiểm tra chất lượng để phát hiện và (hy vọng) khắc phục những vấn đề đó trước khi tiếp tục.

Về mặt lịch sử, các tổ chức xử lý quy trình QA của kho dữ liệu như là một luồng một chiều. Các vấn đề được sửa chữa trước khi dữ liệu được di chuyển sâu hơn vào luồng các quá trình trung gian nhưng không bao giờ được sửa chữa trong các nguồn dữ liệu. Hầu hết các kho dữ liệu mới đều có vòng lặp thông tin phản hồi tích hợp từ quy trình kiểm soát chất lượng nhằm sửa chữa các vấn đề chất lượng dữ liệu trong dữ liệu nguồn.

Bảo đảm chất lượng dữ liệu: phần II

Sau khi hoàn thành quá trình chuyển đổi, dữ liệu phải được QA'd - một lần nữa. Bạn không bao giờ biết loại lỗi hoặc sự khác biệt mà quá trình chuyển đổi có thể đã đưa vào dữ liệu. Sau khi thay đổi đã xảy ra, bất kỳ quá trình kiểm tra chất lượng trước đó không còn giá trị.

Chạy dữ liệu hợp nhất và chuyển đổi thông qua cùng một loại các bước QA được thảo luận ở đây. Mặc dù có thể bạn không tìm thấy lỗi thô sơ nhiều (chẳng hạn như lỗi chính tả hoặc các giá trị nằm ngoài phạm vi) nếu bạn đã làm một công việc kỹ lưỡng về Cấp QA cấp một, bạn vẫn muốn đảm bảo. Hơn nữa, đảm bảo rằng mã hoặc các tập lệnh được sử dụng cho việc chuyển đổi dữ liệu không vô tình gây ra các lỗi mới. Creep.

Mục tiêu của QA cấp hai này là đảm bảo rằng dữ liệu hợp nhất và chuyển đổi của bạn đã sẵn sàng để nạp vào kho dữ liệu - ngay khi có một bước nữa xảy ra, nếu cần thiết.

Middleware Dịch vụ: Bảo đảm Chất lượng Dữ liệu - núm vú

Lựa chọn của người biên tập

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Tiếp thị web, một cách để đảm bảo khả năng hiển thị là để loại bỏ đăng ký và các hình thức đăng nhập. Khách truy cập thường phải hoàn thành các biểu mẫu này trước khi họ có thể tải xuống một số loại nội dung cao cấp, chẳng hạn như giấy trắng hoặc trước khi họ có thể đọc một số bài viết trên trang web. Các công ty đã đưa chúng vào vị trí vì họ muốn dẫn ...

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Duplicate nội dung cần tránh trong web tiếp thị và Google cung cấp công cụ để phát hiện thông tin lặp lại. Không có gì gây tổn hại cho việc tìm kiếm nội dung có liên quan của công cụ tìm kiếm cũng như tìm ra chính xác những từ giống nhau trên hai trang khác nhau. Sao chép là xấu vì những lý do này: Sao chép được sử dụng để được một chiến thuật được sử dụng để đánh lừa ...

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Trong bài hát của họ. Là một nhà tiếp thị web, việc xử lý các liên kết hỏng này có thể giúp đảm bảo sự thành công của trang web của bạn. Nếu một công cụ tìm kiếm đạt đến một liên kết bị hỏng, nó không thể tìm thấy trang bạn dự định (rõ ràng) - nhưng nó cũng có thể bỏ trên trang web của bạn hoặc giảm sự liên quan ...

Lựa chọn của người biên tập

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Số dấu phẩy động là số có các phần phân đoạn (thường được thể hiện bằng dấu thập phân). Bạn nên sử dụng một kiểu điểm nổi trong các chương trình Java bất cứ khi nào bạn cần một số có số thập phân, như là 19. 95 hoặc 3. 1415. Java có hai kiểu nguyên thủy cho các số dấu phẩy: float: Sử dụng 4 byte gấp đôi: Sử dụng 8 bytes Trong hầu hết tất cả ...

Tải phiên bản mới nhất của Java - núm vú

Tải phiên bản mới nhất của Java - núm vú

Trước khi bạn có thể viết các chương trình Java cho các thiết bị Android, bạn cần một số phần mềm công cụ, bao gồm cả phiên bản mới nhất của Java. Bạn có thể có được phiên bản Java mới nhất và lớn nhất bằng cách truy cập vào trang web Java. Trang web cung cấp một số lựa chọn thay thế. (Được giới thiệu) Nhấp chuột vào nút Free Java Download trên trang chính của trang web. Đối với hầu hết các máy tính, ...

Thử nghiệm với JShell - núm vú

Thử nghiệm với JShell - núm vú

JShell là một công cụ Java 9 cho phép bạn khám phá về lập trình. JShell làm cho nó dễ dàng để chơi xung quanh mà không sợ hậu quả thảm khốc. Các chương trình Java thường sử dụng cùng kiểu cũ, lúng túng: public class SomethingOrOther {public static void main (String args []) {Một chương trình Java đòi hỏi sự giới thiệu này bởi vì trong Java ...

Lựa chọn của người biên tập

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Bản quyền © 2014 AARP Tất cả các quyền được bảo lưu. Tâm linh và tôn giáo, tình dục, những trò vui nhộn nhịp, sự tham gia của gia đình, lối sống và tiền bạc - tất cả những điều này thường quan trọng đối với những người trên 50 tuổi, nhưng bạn có thể đặt một số cao hơn những người khác. Trong bất kỳ trường hợp nào, điều quan trọng là phải suy nghĩ về họ trước để bạn có thể thảo luận ...

Hẹn hò Sau 50: Nói về Monogami - vú

Hẹn hò Sau 50: Nói về Monogami - vú

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Một vợ một chồng là một vấn đề lớn cho dù bạn là người chưa sẵn sàng cho vợ chồng một vợ chồng và muốn hẹn hò xung quanh hay người chỉ có thể quan hệ tình dục với một người một lần. Đảm bảo đối tác hẹn hò của bạn biết bạn đang đứng ở đâu (hoặc nằm xuống) đối với vợ chồng một vợ chồng ...

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Nếu bạn bị bệnh mãn tính hoặc đe dọa đến mạng sống khi bạn còn nhỏ, bạn đã có kinh nghiệm về sức khoẻ của mình. Có thể bạn phải liên tục kể câu chuyện về vết sẹo ngực hoặc nẹp chân hoặc giải thích số ít các viên thuốc mà bạn phải dùng mỗi ngày. Nó không phải ...