Trang Chủ Tài chính Cá nhân Vai trò của ETL truyền thống trong các Tập dữ liệu lớn - đầu ngón tay

Vai trò của ETL truyền thống trong các Tập dữ liệu lớn - đầu ngón tay

Video: [160629] [FULL VIETSUB] WEEKLY IDOL EP 257 BEAST (SOFTSUB) 2025

Video: [160629] [FULL VIETSUB] WEEKLY IDOL EP 257 BEAST (SOFTSUB) 2025
Anonim

Các công cụ ETL kết hợp ba chức năng quan trọng (trích xuất, chuyển đổi, tải) cần thiết để lấy dữ liệu từ một môi trường dữ liệu lớn và đưa nó vào môi trường dữ liệu khác. Theo truyền thống, ETL đã được sử dụng với việc xử lý hàng loạt trong môi trường kho dữ liệu. Kho dữ liệu cung cấp cho người dùng doanh nghiệp một cách để củng cố thông tin để phân tích và báo cáo dữ liệu liên quan đến trọng tâm kinh doanh của họ. Các công cụ ETL được sử dụng để biến đổi dữ liệu thành định dạng theo yêu cầu của kho dữ liệu.

Việc chuyển đổi thực sự được thực hiện ở một vị trí trung gian trước khi dữ liệu được tải vào kho dữ liệu. Nhiều nhà cung cấp phần mềm, bao gồm IBM, Informatica, Pervasive, Talend, và Pentaho, cung cấp các công cụ phần mềm ETL.

ETL cung cấp cơ sở hạ tầng cơ bản để tích hợp bằng cách thực hiện ba chức năng quan trọng:

  • Trích: Đọc dữ liệu từ cơ sở dữ liệu nguồn.

  • Nạp: Ghi dữ liệu vào cơ sở dữ liệu đích.

  • Tuy nhiên, ETL đang phát triển để hỗ trợ tích hợp nhiều hơn các kho dữ liệu truyền thống. ETL có thể hỗ trợ tích hợp trên các hệ thống giao dịch, kho dữ liệu hoạt động, nền tảng BI, các trung tâm MDM, các đám mây và nền tảng Hadoop. Các nhà cung cấp phần mềm ETL đang mở rộng các giải pháp của họ để cung cấp khả năng khai thác, chuyển đổi và tải dữ liệu lớn giữa Hadoop và các nền tảng quản lý dữ liệu truyền thống.

Công cụ ETL là cần thiết cho việc tải và chuyển đổi dữ liệu có cấu trúc và không có cấu trúc thành Hadoop. Các công cụ ETL nâng cao có thể đọc và ghi nhiều tệp song song từ và đến Hadoop để đơn giản hóa cách dữ liệu được hợp nhất thành một quá trình chuyển đổi chung. Một số giải pháp kết hợp các thư viện các phép biến đổi ETL dựng sẵn cho cả dữ liệu giao dịch và tương tác chạy trên Hadoop hoặc một cơ sở hạ tầng lưới truyền thống.

Chuyển đổi dữ liệu là quá trình thay đổi định dạng dữ liệu để nó có thể được sử dụng bởi các ứng dụng khác nhau.Điều này có thể có nghĩa là một sự thay đổi từ định dạng dữ liệu được lưu trữ ở định dạng cần thiết bởi ứng dụng sẽ sử dụng dữ liệu. Quá trình này cũng bao gồm các hướng dẫn

ánh xạ

để các ứng dụng được cho biết làm thế nào để có được dữ liệu họ cần để xử lý.

Quá trình chuyển đổi dữ liệu được thực hiện phức tạp hơn rất nhiều do sự tăng trưởng đáng kinh ngạc trong số lượng dữ liệu phi cấu trúc. Một ứng dụng kinh doanh như quản lý quan hệ khách hàng có các yêu cầu cụ thể về cách lưu dữ liệu. Dữ liệu có thể cấu trúc trong các hàng và cột được tổ chức của cơ sở dữ liệu quan hệ. Dữ liệu

bán cấu trúc hoặc không có cấu trúc nếu không tuân theo yêu cầu định dạng cứng nhắc. Thông tin trong e-mail được coi là không có cấu trúc, ví dụ. Một số thông tin quan trọng nhất của công ty là các hình thức có cấu trúc phi cấu trúc và phi cấu trúc như tài liệu, thư điện tử, định dạng tin nhắn phức tạp, tương tác hỗ trợ khách hàng, giao dịch và thông tin đến từ các ứng dụng đóng gói như ERP và CRM. Công cụ chuyển đổi dữ liệu không được thiết kế để hoạt động tốt với dữ liệu phi cấu trúc. Kết quả là các công ty cần kết hợp thông tin phi cấu trúc vào quá trình ra quyết định về quy trình kinh doanh của mình đã phải đối mặt với một số lượng lớn thủ công mã hóa để hoàn thành việc tích hợp dữ liệu cần thiết. Do sự tăng trưởng và tầm quan trọng của dữ liệu phi cấu trúc để đưa ra quyết định, các giải pháp ETL từ các nhà cung cấp lớn đang bắt đầu đưa ra những cách tiếp cận chuẩn hóa để chuyển đổi dữ liệu phi cấu trúc sao cho nó có thể được tích hợp dễ dàng hơn với dữ liệu có cấu trúc hoạt động.

Vai trò của ETL truyền thống trong các Tập dữ liệu lớn - đầu ngón tay

Lựa chọn của người biên tập

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Tiếp thị web, một cách để đảm bảo khả năng hiển thị là để loại bỏ đăng ký và các hình thức đăng nhập. Khách truy cập thường phải hoàn thành các biểu mẫu này trước khi họ có thể tải xuống một số loại nội dung cao cấp, chẳng hạn như giấy trắng hoặc trước khi họ có thể đọc một số bài viết trên trang web. Các công ty đã đưa chúng vào vị trí vì họ muốn dẫn ...

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Duplicate nội dung cần tránh trong web tiếp thị và Google cung cấp công cụ để phát hiện thông tin lặp lại. Không có gì gây tổn hại cho việc tìm kiếm nội dung có liên quan của công cụ tìm kiếm cũng như tìm ra chính xác những từ giống nhau trên hai trang khác nhau. Sao chép là xấu vì những lý do này: Sao chép được sử dụng để được một chiến thuật được sử dụng để đánh lừa ...

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Trong bài hát của họ. Là một nhà tiếp thị web, việc xử lý các liên kết hỏng này có thể giúp đảm bảo sự thành công của trang web của bạn. Nếu một công cụ tìm kiếm đạt đến một liên kết bị hỏng, nó không thể tìm thấy trang bạn dự định (rõ ràng) - nhưng nó cũng có thể bỏ trên trang web của bạn hoặc giảm sự liên quan ...

Lựa chọn của người biên tập

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Số dấu phẩy động là số có các phần phân đoạn (thường được thể hiện bằng dấu thập phân). Bạn nên sử dụng một kiểu điểm nổi trong các chương trình Java bất cứ khi nào bạn cần một số có số thập phân, như là 19. 95 hoặc 3. 1415. Java có hai kiểu nguyên thủy cho các số dấu phẩy: float: Sử dụng 4 byte gấp đôi: Sử dụng 8 bytes Trong hầu hết tất cả ...

Tải phiên bản mới nhất của Java - núm vú

Tải phiên bản mới nhất của Java - núm vú

Trước khi bạn có thể viết các chương trình Java cho các thiết bị Android, bạn cần một số phần mềm công cụ, bao gồm cả phiên bản mới nhất của Java. Bạn có thể có được phiên bản Java mới nhất và lớn nhất bằng cách truy cập vào trang web Java. Trang web cung cấp một số lựa chọn thay thế. (Được giới thiệu) Nhấp chuột vào nút Free Java Download trên trang chính của trang web. Đối với hầu hết các máy tính, ...

Thử nghiệm với JShell - núm vú

Thử nghiệm với JShell - núm vú

JShell là một công cụ Java 9 cho phép bạn khám phá về lập trình. JShell làm cho nó dễ dàng để chơi xung quanh mà không sợ hậu quả thảm khốc. Các chương trình Java thường sử dụng cùng kiểu cũ, lúng túng: public class SomethingOrOther {public static void main (String args []) {Một chương trình Java đòi hỏi sự giới thiệu này bởi vì trong Java ...

Lựa chọn của người biên tập

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Bản quyền © 2014 AARP Tất cả các quyền được bảo lưu. Tâm linh và tôn giáo, tình dục, những trò vui nhộn nhịp, sự tham gia của gia đình, lối sống và tiền bạc - tất cả những điều này thường quan trọng đối với những người trên 50 tuổi, nhưng bạn có thể đặt một số cao hơn những người khác. Trong bất kỳ trường hợp nào, điều quan trọng là phải suy nghĩ về họ trước để bạn có thể thảo luận ...

Hẹn hò Sau 50: Nói về Monogami - vú

Hẹn hò Sau 50: Nói về Monogami - vú

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Một vợ một chồng là một vấn đề lớn cho dù bạn là người chưa sẵn sàng cho vợ chồng một vợ chồng và muốn hẹn hò xung quanh hay người chỉ có thể quan hệ tình dục với một người một lần. Đảm bảo đối tác hẹn hò của bạn biết bạn đang đứng ở đâu (hoặc nằm xuống) đối với vợ chồng một vợ chồng ...

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Nếu bạn bị bệnh mãn tính hoặc đe dọa đến mạng sống khi bạn còn nhỏ, bạn đã có kinh nghiệm về sức khoẻ của mình. Có thể bạn phải liên tục kể câu chuyện về vết sẹo ngực hoặc nẹp chân hoặc giải thích số ít các viên thuốc mà bạn phải dùng mỗi ngày. Nó không phải ...