Quản lý dữ liệu trong NoSQL - núm vú
Khi bạn quản lý các phím một cách thích hợp, bạn đã sẵn sàng để thiết kế cách lưu dữ liệu bằng NoSQL và đảm bảo rằng nó an toàn và luôn có thể truy cập được đối với công việc bạn cần làm. Các loại dữ liệu trong các cửa hàng có giá trị khóa Cửa hàng có giá trị khóa thường hoạt động như & ldquo; xô & rdquo; cho dữ liệu nhị phân. Một số cơ sở dữ liệu cung cấp khả năng nhập dữ liệu nội bộ mạnh mẽ và thậm chí ...
Apache Cơ sở dữ liệu Zookeeper và NoSQL - núm vú
Một nhóm các cơ sở dữ liệu NoSQL lớn là một điều khó sử dụng để quản lý. Apache Zookeeper để giải cứu! Theo dõi các nút nào trong cluster, mỗi dữ liệu nào được quản lý và đảm bảo rằng các thạc sĩ mới được chọn khi một thạc sĩ thất bại không phải là các nhiệm vụ dễ dàng. Việc phối hợp các hệ thống phân tán lớn là rất khó. Cả Hadoop ...
Quản lý thông tin người dùng với NoSQL - núm vú
Có dữ liệu quan trọng, và có dữ liệu hỗ trợ. Không sao cả nếu dữ liệu quan trọng của bạn xuất hiện chậm một chút vì bạn muốn chắc chắn rằng nó an toàn và được quản lý đúng mức. Nhưng bạn không muốn các dữ liệu hỗ trợ của ứng dụng của bạn cản trở các giao dịch tổng thể và trải nghiệm người dùng. Mặc dù các dữ liệu hỗ trợ có thể thấp hơn giá trị, nó ...
Tài liệu Hệ thống quản lý nội dung doanh nghiệp (ECM) của NoSQL versus
Đã Có từ hơn mười năm nay. Tài liệu NoSQL có thể cung cấp một số cạnh tranh. Các ví dụ về ECM bao gồm IBM FileNet, DB2 Content Manager và EMC Documentum. Nhiều công ty nhỏ hơn, như Stellent (nay là Oracle), đã được đưa vào các dịch vụ lớn hơn. Một hệ thống ECM đơn giản, được gọi là Basic Content Services, cũng xuất hiện ...
Cửa hàng ba và cửa hàng đồ họa - những cái đầu
Ba cửa hàng dường như phá vỡ với các công ước liên quan đến NoSQL. Đối với một điều, tất cả chúng đều tuân thủ ACID. Không giống như hầu hết các cơ sở dữ liệu NoSQL hiện tại, nhiều cửa hàng ba chỉ là sở hữu độc quyền. Ngoài ra, các tiêu chuẩn mở còn tồn tại cho các ứng dụng ngữ nghĩa theo cách mà không phải đối với các cửa hàng có giá trị quan trọng, các cửa hàng Bigtable / cột rộng, và các tài liệu cơ sở dữ liệu NoSQL. Hoàn toàn nghiện ...
Cơ sở dữ liệu Hybrid NoSQL khác - núm vú
Có ít cơ sở dữ liệu NoSQL mà bạn thường nghe thường nhắc đến - OrientDB và MarkLogic có thể, ArangoDB. Tuy nhiên, có các cơ sở dữ liệu NoSQL lai khác quan tâm. FoundationDB FoundationDB là một kho lưu trữ giá trị tuân thủ ACID mã nguồn mở. Điều gì là duy nhất về FoundationDB là nó được thiết kế để cho phép các nhà phát triển có hiệu quả cắm dữ liệu của riêng mình ...
Các tính năng tìm kiếm của NoSQL - núm vú
Nhiều cơ sở dữ liệu NoSQL hỗ trợ khả năng truy vấn và khả năng tìm kiếm nhất định. Chọn đúng người thường đi xuống để hiểu các tính năng bạn cần hỗ trợ. Mặc dù chúng liên quan, truy vấn và tìm kiếm khác nhau. Truy vấn trả về chỉ các kết quả phù hợp với tất cả các điều khoản trong đó. Tìm kiếm, mặt khác, có thể bao gồm tùy chọn ...
NoSQL và Các Công cụ Tìm kiếm - những cái đầu
Có thể có vẻ lạ khi đề cập đến công cụ tìm kiếm và NoSQL cùng nhau, nhưng nhiều công cụ tìm kiếm ngày nay sử dụng một kiến trúc rất giống với cơ sở dữ liệu NoSQL. Chỉ mục và xử lý truy vấn của họ được phân phối rất cao. Nhiều công cụ tìm kiếm thậm chí còn có khả năng hoạt động như một kho lưu trữ tài liệu chính hoặc giá trị riêng. Cơ sở dữ liệu NoSQL thường ...
Tổ chức Dữ liệu cho Khai khoáng - núm vú
Khai thác dữ liệu có những yêu cầu rất nghiêm ngặt đối với việc tổ chức dữ liệu. Đây không phải là yêu cầu kỳ lạ, phức tạp, hoặc khó khăn để đáp ứng, nhưng chúng rất nghiêm ngặt. Hình này cho thấy một mẫu dữ liệu được xem dưới dạng một bảng trong phần mềm khai thác dữ liệu. Mỗi hàng đại diện cho một mảng bất động sản. Thông tin về bưu kiện bất động sản được tổ chức ...
10 Kẻ giết người Ứng dụng NoSQL - những con dao
Người ta thường mua một nền tảng đặc biệt vì các ứng dụng killer chạy trên nó. Nhiều ứng dụng dựa trên NoSQL rơi vào danh mục ứng dụng kẻ giết người. Các ứng dụng này không thể trở thành hiện thực bằng cách sử dụng các công nghệ cơ sở dữ liệu quan hệ hiện có. Nền tảng nhắn tin Facebook Apache Cassandra được tạo ra bởi Facebook để cấp quyền truy cập Inbox của họ. Nó đã làm điều này cho một ...
Không-Vì vậy Các tính năng chung của NoSQL - núm vú
Mặc dù một số tính năng tương đối phổ biến đối với cơ sở dữ liệu NoSQL ví dụ như lý thuyết không rõ ràng lược đồ và cấu trúc không quan hệ) thì cơ sở dữ liệu thiếu một hoặc nhiều tính năng sau đây vẫn chưa đủ điều kiện để trở thành một cơ sở dữ liệu NoSQL hiện đại. Mặc dù một số tính năng khá phổ biến đối với các cơ sở dữ liệu NoSQL (ví dụ như lý thuyết không rõ ràng về lược đồ và cấu trúc không quan hệ), phần mềm NoSQL mã nguồn mở là duy nhất vì phong trào nguồn mở đã thúc đẩy sự phát triển hơn
Hiệu suất và dữ liệu lớn - núm vú
Chỉ cần có một máy tính nhanh hơn là không đủ để đảm bảo đúng mức độ hiệu suất để xử lý dữ liệu lớn. Bạn cần để có thể phân phối các thành phần của dịch vụ dữ liệu lớn của bạn qua một loạt các nút. Trong tính toán phân tán, một nút là một phần tử chứa trong một cụm hệ thống hoặc trong một giá đỡ. A ...
Vượt qua được các thiếu sót về kỹ năng số liệu lớn - những con số
Thiếu kỹ năng số liệu lớn. Vì số lượng thông tin số được tạo ra bởi các doanh nghiệp đã tăng lên theo cấp số nhân, nên một thách thức (một số người gọi đó là khủng hoảng) đã nảy sinh: chỉ có không đủ người có kỹ năng cần thiết để phân tích và giải thích tất cả những dữ liệu lớn này. Trong một cuộc khảo sát gần đây, hơn một nửa trong số
Giai đoạn 5 của Mô hình Quy trình CRISP-DM: Đánh giá - núm vú
Trong bốn (CRISP-DM) mô hình quá trình, bạn đã khám phá dữ liệu và bạn đã tìm thấy các mẫu, và bây giờ bạn phải hỏi: Có phải là kết quả tốt? Bạn sẽ đánh giá không chỉ các mô hình mà bạn tạo ra mà còn là quá trình mà bạn đã sử dụng để tạo ra chúng và tiềm năng của chúng ...
Các thuật ngữ và Định nghĩa noSQL - những con dao
Việc bắt đầu của bạn xung quanh NoSQL có thể hơi khó khăn. Nếu bạn nghiên cứu cơ sở dữ liệu ở trường, bạn có thể đã được indoctrinated trong một cách suy nghĩ quan hệ. Nói cơ sở dữ liệu cho hầu hết mọi người, và họ nghĩ hệ thống quản lý cơ sở dữ liệu quan hệ. Điều này là tự nhiên vì trong 30 năm qua, RDBMS đã trở nên nổi bật. Để ...
NoSQL Đối với người mới bắt đầu Cheat Sheet - núm vú
Là một nhà phát triển NoSQL, chọn đúng loại sản phẩm và đúng sản phẩm là bước đầu tiên. Các hướng dẫn này so sánh các tính năng quan trọng nhất trong một số cơ sở dữ liệu NoSQL phổ biến nhất.
Để đảM bảo quản lý dữ liệu lớn - nồng độ
Với những thách thức về quản trị được trình bày bằng các dữ liệu lớn, nó là khôn ngoan và tuyệt đối cần phải có những thực hành tại chỗ để đảm bảo rằng bạn đang bảo vệ thông tin của bạn. Mặc dù mức độ bạn làm việc này sẽ khác nhau tùy thuộc vào doanh nghiệp của bạn, hãy đảm bảo rằng bạn đang thực hiện các biện pháp phòng ngừa cần thiết. Kiểm tra quá trình xử lý dữ liệu của bạn Tại <...
ĐặT Các nguyên tắc cơ bản hóa mô hình xây dựng ở nơi - núm vú
Bạn muốn doanh nghiệp của bạn chống lại sự phù hợp và BIM sẵn sàng, nhưng nhận được các nguyên tắc cơ bản là tất cả trong việc chuẩn bị. BIM cho phép bạn tạo các quy trình mới và các luồng công việc và làm việc một cách hợp tác trên các dự án của bạn. BIM là hữu ích trong suốt thời gian của dự án từ giai đoạn khái niệm, xây dựng, và sau đó ...
ĐặT dữ liệu lớn của bạn với nhau - núm vú
Làm thế nào bạn sẽ biết làm thế nào để đặt tất cả các dữ liệu của bạn với nhau? Với một dự án dữ liệu lớn, bạn muốn làm gì với dữ liệu có cấu trúc và không có cấu trúc của bạn cho biết lý do tại sao bạn có thể chọn một công nghệ hơn một công nghệ khác. Nó cũng xác định sự cần thiết phải hiểu các cấu trúc dữ liệu gửi đến để đưa dữ liệu này vào ...
Giai đoạn 3 của Mô hình Quy trình CRISP-DM: Chuẩn bị dữ liệu
Thợ mỏ dữ liệu dành phần lớn thời gian của họ vào giai đoạn thứ ba của Mô hình quy trình Cross-Industry Standard cho quá trình khai thác dữ liệu (CRISP-DM): chuẩn bị dữ liệu. Hầu hết các dữ liệu được sử dụng cho khai thác dữ liệu ban đầu được thu thập và bảo quản cho các mục đích khác và cần một số sàng lọc trước khi nó đã sẵn sàng để sử dụng cho mô hình hóa. Giai đoạn chuẩn bị dữ liệu bao gồm ...
Giai đoạn 4 của Mô hình Quy trình CRISP-DM: Lập mô hình
Là một phần của Quy trình Tiêu chuẩn Công nghiệp cho Quá trình Khai khoáng Dữ liệu (CRISP-DM) mà hầu hết các thợ mỏ dữ liệu thích nhất. Dữ liệu của bạn đã có hình dạng tốt và bây giờ bạn có thể tìm kiếm các mẫu hữu ích trong dữ liệu của bạn. Giai đoạn lập mô hình bao gồm bốn nhiệm vụ. Đây là các kỹ thuật chọn mô hình Thiết kế thử nghiệm Mô hình xây dựng Đánh giá ...
Giai đoạn 1 của Mô hình Quy trình CRISP-DM: Hiểu biết Kinh doanh - núm vú
Chữ thập - Quy trình tiêu chuẩn công nghiệp cho khai thác dữ liệu (CRISP-DM) là khuôn khổ quy trình chi phối cho việc khai thác dữ liệu. Trong giai đoạn đầu của một dự án khai thác dữ liệu, trước khi bạn tiếp cận dữ liệu hoặc công cụ, bạn xác định những gì bạn đang thực hiện và xác định các lý do muốn đạt được mục tiêu này. Giai đoạn hiểu biết kinh doanh bao gồm bốn nhiệm vụ chính:
ĐặT cơ cấu tổ chức dữ liệu phải ở vị trí - núm vú
ĐIển hình, các công ty bắt đầu cuộc hành trình của họ đến lớn dữ liệu bằng cách bắt đầu thử nghiệm tổ chức để xem liệu dữ liệu lớn có thể đóng vai trò quan trọng trong việc xác định và tác động đến chiến lược kinh doanh hay không.
Giai đoạn 2 của Mô hình Quy trình CRISP-DM: Hiểu đoạn văn bản
Trong (CRISP-DM) mô hình quá trình, bạn có được dữ liệu và xác minh rằng nó là thích hợp cho nhu cầu của bạn. Bạn có thể xác định các vấn đề khiến bạn trở lại với sự hiểu biết về kinh doanh và sửa đổi kế hoạch của mình. Bạn có thể thậm chí phát hiện ra những sai sót trong sự hiểu biết về kinh doanh của bạn, một lý do khác để ...
Giảm thời gian để giá trị trong NoSQL - núm vú
Thời gian để giá trị là khoảng thời gian cần thiết từ khi bắt đầu một dự án CNTT để có thể nhận ra lợi ích kinh doanh. Đây có thể là những lợi ích hữu hình trong việc giảm chi phí hoặc khả năng giao dịch kinh doanh mới, hoặc các lợi ích vô hình như cung cấp dịch vụ khách hàng tốt hơn hoặc các sản phẩm. Các cửa hàng có giá trị Key là các cơ sở dữ liệu NoSQL đơn giản liên quan đến ...
Nghiên cứu cho dữ liệu của bạn - những con voi
Bây giờ bạn là một thợ mỏ dữ liệu, bạn cũng là một nhà nghiên cứu chính. Âm thanh khoa học hơn, phải không? Nghiên cứu của bạn là yếu tố chính bởi vì bạn sẽ bắt đầu từ dữ liệu thô (cơ bản, chưa xử lý) và phân tích nó để thêm một cái mới vào tri thức của thế giới. Có thể bạn sẽ tích hợp một số nghiên cứu thứ cấp vào công việc của bạn. Nói cách khác, bạn sẽ ...
Scaling NoSQL - núm vú
Một tính năng phổ biến của các hệ thống NoSQL là khả năng mở rộng của chúng trên nhiều máy chủ hàng hóa. Những nền tảng tương đối rẻ có nghĩa là bạn có thể mở rộng cơ sở dữ liệu bằng cách thêm một máy chủ mới hơn là thay thế phần cứng cũ với phần cứng mới, mạnh mẽ hơn chỉ trong một cú nhấn. Có những trường hợp sử dụng khối lượng lớn sẽ nhanh chóng buộc bạn ...
Bảng tính, XML, và các định dạng dữ liệu đặc biệt - núm vú
Bạn có thể cần phải sử dụng dữ liệu trong bảng tính , XML (ngôn ngữ đánh dấu mở rộng), hoặc bất kỳ hàng tá các định dạng thông dụng ít phổ biến hơn. Câu hỏi then chốt sẽ luôn là: Ứng dụng khai thác dữ liệu của bạn có nhập dữ liệu ở định dạng đó không? Miễn là ứng dụng khai thác dữ liệu của bạn có một công cụ để đọc định dạng dữ liệu bạn cần, quá trình ...
Thiết lập Cơ sở phải cho dữ liệu lớn - núm vú
Vì vậy, làm thế nào để bạn bắt đầu trong hành trình của bạn để tạo ra môi trường phù hợp để bạn đã sẵn sàng thử nghiệm cả hai dữ liệu lớn và chuẩn bị để mở rộng việc sử dụng dữ liệu lớn khi bạn đã sẵn sàng? Bạn có phải đầu tư vào công nghệ mới cho trung tâm dữ liệu của mình? Bạn có thể tận dụng đám mây ...
Bảo mật Xem xét với dữ liệu lớn - núm vú
Trong khi các công ty rất quan tâm đến an ninh và quản trị dữ liệu nói chung, các sáng kiến dữ liệu lớn đi kèm với những sự phức tạp nhất định và những vấn đề không lường trước mà nhiều công ty không chuẩn bị để xử lý. Thường phân tích dữ liệu lớn được thực hiện với một loạt các nguồn dữ liệu có thể đến từ nhiều nguồn không được xác định. Ngoài ra, bạn ...
Mô phỏng Sử dụng các Máy Tóm tắt với các Thuật toán - các núm vú
Các hoạt động nhiều hơn một thuật toán đòi hỏi, thì phức tạp hơn. Sự phức tạp là một biện pháp hiệu quả thuật toán về cách sử dụng thời gian vì mỗi hoạt động mất một thời gian. Với cùng một vấn đề, các thuật toán phức tạp nói chung ít thuận lợi hơn các thuật toán đơn giản vì các thuật toán phức tạp đòi hỏi nhiều thời gian hơn. Hãy suy nghĩ về những thời điểm khi tốc độ ...
Xóa bỏ dữ liệu bạn cần - núm vú
Khi khai thác dữ liệu, đôi khi bạn sẽ có nhiều dữ liệu hơn bạn cần cho một dự án nhất định. Đây là cách để giảm xuống chỉ cần những gì bạn cần. Thu hẹp các trường Khi bạn có nhiều biến trong một tập dữ liệu, có thể khó tìm hoặc thấy những điểm mà bạn quan tâm. Và nếu bộ dữ liệu của bạn ...
Tại sao Sắp xếp dữ liệu là quan trọng đối với các thuật toán - các núm vú
Hãy tưởng tượng cố gắng tìm một mục trong danh sách mà không cần phân loại Đầu tiên. Mỗi tìm kiếm trở thành một tìm kiếm tuần tự tốn nhiều thời gian. Tuy nhiên, một trường hợp có thể được thực hiện không phân loại dữ liệu cho các thuật toán. Sau khi tất cả, dữ liệu vẫn có thể truy cập, ngay cả khi bạn không sắp xếp nó - và phân loại cần có thời gian. Tất nhiên, vấn đề với ...
Lưu trữ dữ liệu lớn với HBase - núm vú
HBase là một cơ sở dữ liệu phân tán, phi quan hệ (columnar) sử dụng HDFS như sự tồn tại của nó lưu trữ cho các dự án dữ liệu lớn. Nó được mô phỏng theo Google BigTable và có khả năng lưu trữ các bảng rất lớn (hàng tỷ cột / hàng) bởi vì nó được xếp lớp trên các nhóm phần cứng hàng hóa Hadoop. HBase cung cấp ngẫu nhiên, thời gian thực truy cập đọc / ghi vào dữ liệu lớn. HBase ...
Các thuật toán giải phóng và lọc Bloom - núm vú
Ở Trung tâm của nhiều thuật toán phát trực tuyến là các bộ lọc Bloom. Được tạo ra gần 50 năm trước bởi Burton H. Bloom, vào thời điểm khoa học máy tính vẫn còn khá trẻ, ý định ban đầu của người sáng tạo thuật toán này là thương mại không gian (bộ nhớ) và / hoặc thời gian (phức tạp) chống lại những gì ông gọi là lỗi cho phép. Tài liệu gốc của ông có tiêu đề ...
Cấu trúc dữ liệu để có được một giải pháp - con người
Suy nghĩ về dữ liệu theo những cách không đặc hiệu và áp dụng các quy tắc khác nhau cho cùng một dữ liệu để hiểu nó theo những cách mà máy tính không bao giờ có thể. Quan điểm của dữ liệu trên máy tính có cấu trúc, đơn giản, kiên quyết và nhất định không sáng tạo. Khi con người chuẩn bị dữ liệu cho máy tính để sử dụng, dữ liệu thường tương tác với các thuật toán trong ...
Sử dụng bộ nhớ Flash trong NoSQL - núm vú
Khi bạn cần viết nhanh, bộ nhớ flash được gọi là (trái với việc kêu gọi Flash Gordon). Điều này đi kèm với chi phí của việc sử dụng không gian bộ nhớ, tất nhiên. Ghi vào RAM sẽ giúp bạn, tốt, về kích thước của bộ nhớ RAM của bạn. Vì vậy, có một lựa chọn lưu trữ tốc độ cao ngay phía sau của bạn ...
Nói chuyện Khai phá dữ liệu với các nhân viên điều hành - những người không hoàn hảo
Bạn không vào khai thác dữ liệu chỉ để vui chơi với các con số . Bạn muốn hành động. Bạn muốn thấy mọi việc được thực hiện đúng và bạn hiểu rằng điều quan trọng là phải dựa vào các bằng chứng chắc chắn từ dữ liệu. Nhưng bạn không phải là người có quyền quyết định. Vì vậy, bạn sẽ cần phải ...
Kinh tế học của các dữ liệu lớn - núm vú
Cách tốt nhất để hiểu được kinh tế của dữ liệu lớn là xem xét các phương pháp để đưa dữ liệu lớn vào làm việc cho tổ chức của bạn. Mặc dù chi phí cụ thể có thể thay đổi do quy mô tổ chức của bạn, sức mua, mối quan hệ giữa các nhà cung cấp, v.v ..., các lớp học chi phí khá nhất quán. Dữ liệu lớn ...