Thực hiện Data Mart - Nhanh chóng - núm vú
Cho dù bạn quyết định chia vũ trụ thành những nội dung có thể vào một số tập hợp con cho dữ liệu của bạn, hãy nhớ rằng để có được giá trị kinh doanh tối đa từ Data Mart của bạn, bạn phải thực hiện nó một cách nhanh chóng. Đây là ba chìa khóa để thực hiện nhanh chóng: Thực hiện theo một phương pháp lặp đi lặp lại, theo từng giai đoạn. Bạn dành phần lớn ...
Làm thế nào để Đặt nền kiến trúc cho dữ liệu lớn - núm vú
ĐIều quan trọng là đặt một kiến trúc mạnh mẽ nền tảng nếu bạn muốn thành công với dữ liệu lớn. Ngoài việc hỗ trợ các yêu cầu chức năng, điều quan trọng là hỗ trợ thực hiện yêu cầu. Nhu cầu của bạn sẽ phụ thuộc vào bản chất của phân tích bạn đang hỗ trợ. Bạn cần một lượng điện toán hợp lý
Xác định dữ liệu bạn cần cho dữ liệu lớn của bạn - núm vú
ĐáNh giá loại dữ liệu bạn đang xử lý trong dự án dữ liệu lớn của bạn. Nhiều tổ chức nhận ra rằng rất nhiều dữ liệu nội bộ được tạo ra đã không được sử dụng hết tiềm năng của nó trong quá khứ. Bằng cách sử dụng các công cụ mới, các tổ chức đang có được cái nhìn sâu sắc mới từ những nguồn dữ liệu phi cấu trúc chưa từng sử dụng trước đây ...
Làm thế nào để sử dụng MapReduce cho dữ liệu lớn - núm vú
MapReduce là một khuôn khổ phần mềm lý tưởng cho các dữ liệu lớn bởi vì nó cho phép các nhà phát triển viết chương trình có thể xử lý số lượng dữ liệu phi cấu trúc dữ liệu khổng lồ song song trên một nhóm các bộ xử lý phân tán. Chức năng bản đồ cho dữ liệu lớn Chức năng bản đồ đã là một phần của nhiều ngôn ngữ lập trình chức năng trong nhiều năm. Bản đồ ...
Lớp 0 của ngăn xếp dữ liệu lớn: cơ sở hạ tầng vật lý dự phòng - núm vú
Ở Mức thấp nhất của stack dữ liệu lớn là cơ sở hạ tầng vật chất. Công ty của bạn có thể đã có một trung tâm dữ liệu hoặc đầu tư vào các cơ sở hạ tầng vật chất, vì vậy bạn sẽ muốn tìm một cách để sử dụng các tài sản hiện có. Việc triển khai dữ liệu lớn đòi hỏi rất cụ thể về tất cả các yếu tố trong kiến trúc tham chiếu, ...
Lớp 2 của ngăn xếp dữ liệu lớn: các cơ sở dữ liệu hoạt động - ốc vít
Ở Cốt lõi của bất kỳ lớn môi trường dữ liệu và lớp 2 của chồng dữ liệu lớn là các công cụ cơ sở dữ liệu chứa các bộ sưu tập các yếu tố dữ liệu có liên quan đến doanh nghiệp của bạn. Những động cơ này cần phải nhanh, có thể mở rộng, và đá rắn. Không phải tất cả đều được tạo ra bằng nhau, và một số môi trường dữ liệu lớn sẽ tốt hơn với ...
Lớp 3 của ngăn xếp dữ liệu lớn: Tổ chức các Dịch vụ và Công cụ Dữ liệu - các đầu
Tổ chức các dịch vụ và công cụ dữ liệu, lớp 3 của chồng dữ liệu lớn, nắm bắt, xác nhận hợp lệ và tập hợp các yếu tố dữ liệu khác nhau vào bộ sưu tập có liên quan theo ngữ cảnh. Bởi vì dữ liệu lớn là lớn, các kỹ thuật đã phát triển để xử lý dữ liệu hiệu quả và liền mạch. MapReduce là một kỹ thuật được sử dụng nhiều.
Key-Value cặp cơ sở dữ liệu trong môi trường dữ liệu lớn - núm vú
ĐếN nay, đơn giản nhất cơ sở dữ liệu NoSQL (không-chỉ-SQL) trong một môi trường dữ liệu lớn là mô hình sử dụng mô hình cặp giá trị quan trọng (KVP). Cơ sở dữ liệu KVP không yêu cầu một lược đồ (như RDBMS) và cung cấp sự linh hoạt và khả năng mở rộng tuyệt vời. Cơ sở dữ liệu KVP không cung cấp tính năng ACID (Atomicity, Consistency, Isolation, Durable), và yêu cầu người thực hiện suy nghĩ về dữ liệu ...
Gặp gỡ với Đại diện của Kho dữ liệu - những con voi
Việc mua sắm xung quanh cho các sản phẩm lưu trữ dữ liệu có thể bao gồm các cuộc họp với đại diện của công ty. Trước khi đại diện bán hàng của nhà cung cấp đặt chân vào văn phòng của bạn hoặc bắt đầu một hội nghị Web với bạn, hãy hoàn toàn rõ ràng những gì bạn mong đợi để trang trải trong cuộc họp ban đầu một hoặc hai giờ đầu tiên. Bạn nên làm ít nhất như sau: Nghe bài thuyết trình của ...
Lớp 4 của ngăn xếp dữ liệu lớn: các kho dữ liệu phân tích - những xác ướp
Kho dữ liệu, lớp 4 của chồng dữ liệu lớn và người bạn đồng hành của nó là data mart, từ lâu đã là những kỹ thuật chính mà các tổ chức sử dụng để tối ưu hóa dữ liệu để giúp các nhà ra quyết định. Thông thường, các kho dữ liệu và các kho chứa dữ liệu chuẩn được thu thập từ nhiều nguồn khác nhau và được lắp ráp để phân tích kinh doanh. Dữ liệu ...
Quản lý Ảo hóa cho dữ liệu lớn - những con voi
ẢO hóa chia tách tài nguyên và dịch vụ từ môi trường phân phối vật lý cơ bản, nhiều hệ thống ảo trong một hệ thống vật lý đơn lẻ. Một trong những lý do chính mà các công ty đã thực hiện ảo hóa là để cải thiện hiệu suất và hiệu quả xử lý của một sự pha trộn đa dạng của khối lượng công việc Các hypervisor dữ liệu Một lý tưởng ...
Trung gian cho Kho dữ liệu - núm vú
Middleware là phần mềm máy tính kết nối các thành phần phần mềm. Trong môi trường lưu trữ dữ liệu, các dịch vụ trung gian là tập hợp các chương trình và thói quen làm như sau: Kéo dữ liệu từ nguồn (hoặc nguồn). Đảm bảo đúng dữ liệu. Di chuyển dữ liệu xung quanh môi trường từ nền tảng sang nền tảng, nếu cần. Xử lý mọi nhu cầu cần thiết ...
Middleware Dịch vụ: Lập bản đồ và chuyển đổi dữ liệu - những con số
Con số này cho thấy một môi trường trong đó dữ liệu được trích ra từ ba nguồn dữ liệu khác nhau để đưa vào một kho dữ liệu, và ba nguồn tin trên một nền tảng khác nhau. Tại một số điểm trong quá trình trung gian, các trích dẫn QA'd phải được thu thập cùng nhau để tạo ra quá trình lập bản đồ và chuyển đổi kết hợp. Con số này
Middleware Dịch vụ: Vận chuyển dữ liệu và Nạp dữ liệu - núm vú
Trong hầu hết các tình huống, hai dịch vụ middleware - và khai thác, và đảm bảo chất lượng - diễn ra trên cùng một nền tảng (hệ thống) mà trên đó nguồn dữ liệu cư trú. Nếu kho dữ liệu của bạn được lưu trữ trên một nền tảng khác so với nguồn dữ liệu, bạn phải sử dụng dịch vụ di chuyển dữ liệu để thực hiện hệ thống-hệ thống ...
Middleware Dịch vụ: Lựa chọn dữ liệu và Extractions - núm vú
Mục đích chính của dịch vụ lựa chọn và trích xuất dữ liệu là chọn từ (tìm thấy) một nguồn dữ liệu dữ liệu mà bạn muốn di chuyển vào kho dữ liệu và sau đó trích xuất dữ liệu vào một mẫu có thể sẵn sàng cho các dịch vụ đảm bảo chất lượng. Bạn có thể sử dụng một trong hai loại khác nhau
Mỏ dữ liệu lớn với tổ ong - núm vú
Hive là một lớp dữ liệu theo đợt, được lưu trữ trên các phần tử cốt lõi của Hadoop (HDFS và MapReduce) và rất hữu ích trong dữ liệu lớn. Nó cung cấp cho người dùng biết SQL với một thực thi SQL-lite đơn giản được gọi là HiveQL mà không phải hy sinh truy cập thông qua người lập bản đồ và các trình giảm thiểu. Với Hive, bạn có thể đạt được điều tốt nhất của cả hai thế giới: Truy cập SQL-like ...
Cơ sở dữ liệu đa chiều - núm vú
ĐâY không phải là lần đầu tiên trong lịch sử gần đây các loại sản phẩm cơ sở dữ liệu mới xuất hiện và vượt qua sự thiếu hiệu quả của RDBMS . Trở lại những năm 1980, một loạt các ứng dụng đã được xác định, trong đó các sản phẩm RDBMS không xử lý được nhu cầu quản lý dữ liệu (đặc biệt là việc tạo ra các RDBMS có sẵn vào thời điểm đó). Các ứng dụng này đều cần những kiểu dữ liệu do người dùng định nghĩa ...
Middleware Dịch vụ: Bảo đảm Chất lượng Dữ liệu - núm vú
Bạn nên thiết lập hai dịch vụ đảm bảo chất lượng khác nhau trong lưu lượng các dịch vụ trung gian. Bạn phải thực hiện các tác vụ QA đầu tiên đối với trích từ nguồn dữ liệu trước khi bạn thực hiện thêm bất kỳ dịch vụ trung gian nào. Bảo đảm chất lượng dữ liệu: một phần Tôi cố gắng nắm bắt (và sửa lỗi) và các vấn đề ngay từ đầu quá trình ...
Các cơ sở dữ liệu phi quan hệ trong môi trường dữ liệu lớn - núm vú
Các cơ sở dữ liệu không liên quan không dựa vào mô hình bàn / để RDBMSs (hệ thống quản lý cơ sở dữ liệu quan hệ). Tóm lại, dữ liệu chuyên ngành trong thế giới dữ liệu lớn đòi hỏi sự kiên trì đặc biệt và kỹ thuật thao tác dữ liệu. Mặc dù các kiểu cơ sở dữ liệu mới cung cấp một số câu trả lời cho những thách thức lớn về dữ liệu của bạn, nhưng chúng không phải là một vé đi đến kết thúc ...
ĐặT Dữ liệu Lớn để Sử dụng - núm vú
Phân tích văn bản có thể được sử dụng để giúp hiểu rõ hơn về dữ liệu. Vì vậy, nếu dữ liệu là dữ liệu lớn? Điều đó có nghĩa là dữ liệu phi cấu trúc được phân tích là khối lượng cao, vận tốc cao, hoặc cả hai. Dữ liệu lớn và tiếng nói của khách hàng Tối ưu hóa trải nghiệm của khách hàng và cải thiện mức độ giữ chân khách hàng là các trình điều khiển chính cho
Chín dấu hiệu của một dự án kho dữ liệu thành công - ốc vít
Chỉ vì mọi người tập hợp trong quán cà phê của công ty cho bánh và thạch cao các bức tường với các biểu ngữ chúc mừng không có nghĩa là dự án kho dữ liệu của bạn đã thành công. Chương này cung cấp cho bạn một số cách để nói rằng bạn đã thực sự thành công. Nhà tài trợ điều hành nói, "Điều này hoạt động - nó thực sự làm việc! "Giả sử một người cao tuổi ...
Sửa đổi các sản phẩm tình báo kinh doanh để xử lý dữ liệu lớn - núm vú
Các sản phẩm kinh doanh thông minh truyền thống không thực sự được thiết kế để xử lý dữ liệu lớn, do đó, họ có thể yêu cầu một số sửa đổi. Chúng được thiết kế để làm việc với các dữ liệu có cấu trúc cao và được hiểu rõ, thường được lưu trữ trong kho dữ liệu quan hệ và được hiển thị trên máy tính để bàn hoặc máy tính xách tay. Phân tích tình trạng kinh doanh thông thường này được áp dụng cho các bức ảnh chụp nhanh ...
Các loại hình kinh doanh thông minh khác - núm vú
Than ôi, mô hình tổ chức gọn gàng có bốn loại khác nhau của các loại thông tin kinh doanh (truy vấn và báo cáo, phân tích kinh doanh [OLAP], khai thác dữ liệu, bảng điều khiển và bảng điểm) có thể được mở rộng cho các ứng dụng phức tạp hơn. Ví dụ: công cụ OLAP hoặc bảng điều khiển có thể có các tính năng hệ thống thông tin địa lý (GIS) - hoặc có thể không. Như thể hiện trong ...
Sản phẩm Quan hệ và Kho dữ liệu - những đầu
Dưới đây là một số sản phẩm cơ sở dữ liệu quan trọng mà bạn có thể muốn sử dụng cho dữ liệu của bạn Kho. Gần như tất cả các nhà cung cấp này đã mua các sản phẩm bổ sung, bao gồm OLAP hoặc công nghệ định hướng đa chiều và các RDBMS khác để hỗ trợ các nền tảng rất đa dạng và tích hợp vào các dòng sản phẩm và kiến trúc của họ. Bạn có thể muốn ...
Chuẩn bị cho ngữ nghĩa trong Kho dữ liệu - núm vú
Nếu bạn đánh giá các công nghệ liên quan đến công việc lưu trữ dữ liệu, rất nhiều siêu dữ liệu được quản lý theo cách độc quyền trong công cụ. Một số đã cố gắng trong quá khứ để giải quyết vấn đề hội nhập bằng cách tạo ra một công nghệ khác, được gọi là kho lưu trữ metadata kỹ thuật, để tích hợp tất cả siêu dữ liệu này từ các công cụ khác nhau. Như vậy
Bạn nên sử dụng Công cụ hoặc Mã Tuỳ chỉnh? - núm vú
Trong những ngày đầu tiên của việc lưu trữ dữ liệu, hầu hết các tổ chức xử lý các dịch vụ trung gian thông qua mã hóa tùy chỉnh, thay vì với vài công cụ có sẵn trong thời gian đó, như trong ví dụ này: Tổ chức viết một chương trình trong một chương trình ngôn ngữ như COBOL, hoặc có lẽ trong một môi trường như SAS, để xử lý dữ liệu chiết xuất ...
Truy vấn và Báo cáo Công cụ cho Kho dữ liệu - núm vú
Công cụ truy vấn và báo cáo giúp bạn chạy báo cáo thường xuyên, danh sách được tổ chức, và thực hiện báo cáo chéo và truy vấn. Dưới đây là một số công cụ truy vấn và báo cáo để làm quen với. Vai trò của SQL SQL là ngôn ngữ truy vấn cơ sở dữ liệu chính thức được sử dụng để truy cập và cập nhật dữ liệu trong hệ thống quản lý cơ sở dữ liệu quan hệ, ...
Nhân rộng Dịch vụ cho Kho dữ liệu - núm vú
Nhân rộng dịch vụ trung gian kết hợp lựa chọn và khai thác, di chuyển và tải từ một cơ sở dữ liệu một hoặc nhiều người khác, thường được quản lý bởi một sản phẩm DBMS. Mặc dù khả năng nhân rộng các dịch vụ khác nhau giữa các sản phẩm DBMS, theo truyền thống, họ đã ...
RDBMS trong môi trường dữ liệu lớn - những con số
Dữ liệu lớn đang trở thành một yếu tố quan trọng trong cách thức các tổ chức đang tận dụng cao -tốc độ dữ liệu ở tốc độ thích hợp để giải quyết các vấn đề dữ liệu cụ thể. Các hệ thống quản lý cơ sở dữ liệu quan hệ là quan trọng đối với khối lượng lớn này. Dữ liệu lớn không sống trong sự cô lập. Để có hiệu quả, các công ty thường cần để có thể kết hợp các kết quả của ...
Kiến trúc hướng dịch vụ (SOA) - núm vú
Nếu bạn thiết lập tích hợp dữ liệu hơn bằng cách sử dụng dữ liệu ODS và MDM bạn cũng cần một thông điệp, hoặc truyền thông, kiến trúc để cho phép các hệ thống không được xây dựng để giao tiếp với nhau để làm như vậy. Nhập khái niệm về các kiến trúc hướng dịch vụ hoặc các SOA. SOA là một phương pháp để phát triển và tích hợp hệ thống trong đó các chức năng ...
Dữ liệu có cấu trúc trong môi trường dữ liệu lớn - núm vú
Thuật ngữ dữ liệu cấu trúc nói chung đề cập đến dữ liệu có định nghĩa chiều dài và định dạng cho dữ liệu lớn. Ví dụ về dữ liệu có cấu trúc bao gồm số, ngày, và nhóm từ và số được gọi là chuỗi. Hầu hết các chuyên gia đều đồng ý rằng loại dữ liệu này chiếm khoảng 20 phần trăm dữ liệu ở ngoài đó. Dữ liệu có cấu trúc
Các cơ sở dữ liệu không gian trong môi trường dữ liệu lớn
Các cơ sở dữ liệu không gian có thể là một công cụ quan trọng trong dự án dữ liệu lớn của bạn[SET:h1vi]Các cơ sở dữ liệu không gian trong môi trường dữ liệu lớn
Mười kỹ năng bắt buộc cho một chuyên gia kho lưu trữ dữ liệu - các đầu
Một nhà tư vấn kho dữ liệu tốt có những khả năng nhất định trong việc xử lý với mọi người và kiến thức về các khía cạnh khác nhau của việc lưu trữ dữ liệu. Danh sách này cho phép bạn ở trên một vài kỹ năng cần thiết mà tất cả các tư vấn kho dữ liệu cần phải có.
Mười Nguồn Nguồn Thông tin cập nhật về Kho Dữ liệu - những con số
Có thể sẽ không ngạc nhiên khi thấy rằng thuật ngữ up-to-date thông tin về kho dữ liệu có nghĩa là "đi xem trên Internet. "Bạn nên dành thời gian kiểm tra các trang Web trong chương này. Viện Lưu trữ Dữ liệu Tại trang web của Bộ phận Lưu trữ Dữ liệu, bạn có thể tìm thấy các mục sau: Thông tin giáo dục Các sự kiện sắp tới White ...
Việc tạo ra các cấu trúc dữ liệu lớn có thể quản lý - núm vú
Khi máy tính di chuyển vào thị trường thương mại, dữ liệu được lưu giữ trong các tệp phẳng không áp đặt cấu trúc. Ngày nay, dữ liệu lớn đòi hỏi cấu trúc dữ liệu có thể quản lý được. Khi các công ty cần hiểu rõ về khách hàng, họ phải áp dụng các phương pháp bạo lực, bao gồm các mô hình lập trình rất chi tiết để tạo ra một số giá trị. Sau đó ...