Trang Chủ Tài chính Cá nhân Dữ liệu Chiết xuất, Di chuyển và Đang tải cho Kho dữ liệu Deluxe - những con vú

Dữ liệu Chiết xuất, Di chuyển và Đang tải cho Kho dữ liệu Deluxe - những con vú

Video: How Does the Power Grid Work? 2025

Video: How Does the Power Grid Work? 2025
Anonim

Triển khai kho dữ liệu kho cao cấp là lớn và ngày càng lớn hơn. Các triển khai sử dụng hàng trăm gigabyte (một gigabyte bằng 1 tỷ byte) và thậm chí là terabyte (1 nghìn tỉ byte) ngày càng phổ biến. Để quản lý khối lượng dữ liệu và quyền truy cập của người dùng, bạn cần một máy chủ và cơ sở dữ liệu rất mạnh.

Chuẩn bị cho thử thách! Với kho dữ liệu lite, bạn thường có thể xử lý lưu lượng dữ liệu từ kho lưu trữ tới các kho dữ liệu một cách đơn giản và công nghệ thấp nhưng với kho dữ liệu thì bạn đang bước vào Khung Khó, nơi nhiều dự án kho dữ liệu đáp ứng được Waterloo.

Bạn có thể gặp khó khăn trong lĩnh vực này vì một số lý do:

  • Bạn đang xử lý nhiều nguồn dữ liệu khác nhau, một số có thể chứa dữ liệu chồng chéo. Chẳng hạn, thông tin của nhà cung cấp có thể đến từ hai hệ thống thu mua khác nhau, và một số nhà cung cấp của bạn có mục trong cả hai hệ thống.

    Có lẽ bạn sẽ chạy vào các bộ nhận dạng khác nhau mà bạn phải hội tụ (ví dụ: sáu ký tự chữ và số được xác định là SUPPLIER_ID trong một trong các hệ thống và một số nguyên duy nhất được gọi là SUP_NUM ở khác).

  • Nếu kho dữ liệu của bạn lớn (khoảng hơn 250 gigabyte), bạn có thể gặp khó khăn trong việc chiết xuất, di chuyển, và tải các cửa sổ lô. Cửa sổ lô , khung thời gian cập nhật kho hàng, phức tạp bởi số lượng các nguồn dữ liệu mà bạn phải xử lý.

  • Cơ hội bị khai thác, di chuyển, chuyển đổi, và quá trình tải đang rối tung lên theo cấp số nhân với số lượng các phần tử dữ liệu được nạp vào kho dữ liệu.

    Nếu bạn có thể chỉ định một số yếu tố khó khăn (ví dụ như số nguyên) cho quá trình nhận dữ liệu vào kho, các biện pháp sau đây sẽ đúng: Bạn có n dữ liệu các yếu tố mà bạn muốn đưa vào kho dữ liệu với một yếu tố khó khăn là x. Nếu bây giờ bạn có 2 n dữ liệu yếu tố, yếu tố khó khăn của bạn không phải là 2 x; thay vào đó, x bình phương.

    Để dễ hiểu hơn, chỉ định một số con số n và x. Nói rằng kho dữ liệu của bạn có 100 phần tử (n) và yếu tố khó khăn (x) là 5. Nếu bạn tăng gấp đôi số phần tử ( n > = 200), yếu tố khó khăn của bạn là 25 (5 bình phương), không phải là 10 (5 x 2). Quá trình xử lý rất nhiều nguồn dữ liệu, tất cả đều hướng đến một nơi (kho dữ liệu của bạn sang trọng), có tất cả các yếu tố của quá nhiều đầu bếp trong nhà bếp, hoặc bất cứ điều gì mà nói.

  • Để thực hiện việc khai thác, di chuyển, chuyển đổi, và quá trình tải thông suốt, bạn có thể phải đối phó với nhiều chủ sở hữu ứng dụng khác nhau, người giữ chính thức của cơ sở dữ liệu, và những người khác từ nhiều tổ chức khác nhau, tất cả đều phải hợp tác giống như họ là một phần của dàn nhạc giao hưởng chuyên nghiệp.

    Tuy nhiên, thực tế là họ thực hiện giống như một nhóm học sinh mẫu giáo mỗi người chọn một nhạc cụ từ thùng đồ chơi và được nói, "Bây giờ hãy chơi cái gì đó! "Mặc dù quá trình này không nhất thiết phải thất bại, mong đợi một số lặp đi lặp lại cho đến khi bạn có thể có được kho dữ liệu kho cao cấp chỉ cần tải.

    Kho dữ liệu kho cao cấp có thể có ba tầng (như kho dữ liệu lite), ngoại trừ có nhiều nguồn dữ liệu và có lẽ nhiều hơn một loại công cụ người dùng truy cập kho. Tuy nhiên, kiến ​​trúc cho kho dữ liệu có vẻ như giống với những gì được hiển thị trong hình này, với nhiều điểm thu thập dữ liệu khác nhau.

Ngoài các trạm khác "cần thiết" cho môi trường cụ thể của bạn, môi trường của bạn có thể có các yếu tố sau:

Data mart:

  • Nhận các tập hợp con từ thông tin kho cao cấp và phục vụ như là điểm truy cập chính cho người dùng. Trạm biến đổi tạm thời:

  • Một khu vực trong đó bộ dữ liệu trích ra từ một số nguồn phải trải qua một số quá trình chuyển đổi trước khi di chuyển đường ống tới cơ sở dữ liệu kho. Trạm đảm bảo chất lượng:

  • Một khu vực mà các nhóm dữ liệu trải qua kiểm tra chất lượng chuyên sâu sẽ kiểm tra trước khi bạn đưa chúng vào kho dữ liệu.

Dữ liệu Chiết xuất, Di chuyển và Đang tải cho Kho dữ liệu Deluxe - những con vú

Lựa chọn của người biên tập

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Tiếp thị web, một cách để đảm bảo khả năng hiển thị là để loại bỏ đăng ký và các hình thức đăng nhập. Khách truy cập thường phải hoàn thành các biểu mẫu này trước khi họ có thể tải xuống một số loại nội dung cao cấp, chẳng hạn như giấy trắng hoặc trước khi họ có thể đọc một số bài viết trên trang web. Các công ty đã đưa chúng vào vị trí vì họ muốn dẫn ...

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Duplicate nội dung cần tránh trong web tiếp thị và Google cung cấp công cụ để phát hiện thông tin lặp lại. Không có gì gây tổn hại cho việc tìm kiếm nội dung có liên quan của công cụ tìm kiếm cũng như tìm ra chính xác những từ giống nhau trên hai trang khác nhau. Sao chép là xấu vì những lý do này: Sao chép được sử dụng để được một chiến thuật được sử dụng để đánh lừa ...

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Trong bài hát của họ. Là một nhà tiếp thị web, việc xử lý các liên kết hỏng này có thể giúp đảm bảo sự thành công của trang web của bạn. Nếu một công cụ tìm kiếm đạt đến một liên kết bị hỏng, nó không thể tìm thấy trang bạn dự định (rõ ràng) - nhưng nó cũng có thể bỏ trên trang web của bạn hoặc giảm sự liên quan ...

Lựa chọn của người biên tập

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Số dấu phẩy động là số có các phần phân đoạn (thường được thể hiện bằng dấu thập phân). Bạn nên sử dụng một kiểu điểm nổi trong các chương trình Java bất cứ khi nào bạn cần một số có số thập phân, như là 19. 95 hoặc 3. 1415. Java có hai kiểu nguyên thủy cho các số dấu phẩy: float: Sử dụng 4 byte gấp đôi: Sử dụng 8 bytes Trong hầu hết tất cả ...

Tải phiên bản mới nhất của Java - núm vú

Tải phiên bản mới nhất của Java - núm vú

Trước khi bạn có thể viết các chương trình Java cho các thiết bị Android, bạn cần một số phần mềm công cụ, bao gồm cả phiên bản mới nhất của Java. Bạn có thể có được phiên bản Java mới nhất và lớn nhất bằng cách truy cập vào trang web Java. Trang web cung cấp một số lựa chọn thay thế. (Được giới thiệu) Nhấp chuột vào nút Free Java Download trên trang chính của trang web. Đối với hầu hết các máy tính, ...

Thử nghiệm với JShell - núm vú

Thử nghiệm với JShell - núm vú

JShell là một công cụ Java 9 cho phép bạn khám phá về lập trình. JShell làm cho nó dễ dàng để chơi xung quanh mà không sợ hậu quả thảm khốc. Các chương trình Java thường sử dụng cùng kiểu cũ, lúng túng: public class SomethingOrOther {public static void main (String args []) {Một chương trình Java đòi hỏi sự giới thiệu này bởi vì trong Java ...

Lựa chọn của người biên tập

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Bản quyền © 2014 AARP Tất cả các quyền được bảo lưu. Tâm linh và tôn giáo, tình dục, những trò vui nhộn nhịp, sự tham gia của gia đình, lối sống và tiền bạc - tất cả những điều này thường quan trọng đối với những người trên 50 tuổi, nhưng bạn có thể đặt một số cao hơn những người khác. Trong bất kỳ trường hợp nào, điều quan trọng là phải suy nghĩ về họ trước để bạn có thể thảo luận ...

Hẹn hò Sau 50: Nói về Monogami - vú

Hẹn hò Sau 50: Nói về Monogami - vú

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Một vợ một chồng là một vấn đề lớn cho dù bạn là người chưa sẵn sàng cho vợ chồng một vợ chồng và muốn hẹn hò xung quanh hay người chỉ có thể quan hệ tình dục với một người một lần. Đảm bảo đối tác hẹn hò của bạn biết bạn đang đứng ở đâu (hoặc nằm xuống) đối với vợ chồng một vợ chồng ...

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Nếu bạn bị bệnh mãn tính hoặc đe dọa đến mạng sống khi bạn còn nhỏ, bạn đã có kinh nghiệm về sức khoẻ của mình. Có thể bạn phải liên tục kể câu chuyện về vết sẹo ngực hoặc nẹp chân hoặc giải thích số ít các viên thuốc mà bạn phải dùng mỗi ngày. Nó không phải ...