Công cụ Hình dung trên Web - những đầu số
Hai công cụ trực quan hóa dữ liệu này là đáng giá thời gian của bạn để kiểm tra. Những công cụ này phức tạp hơn rất nhiều so với những công cụ khác, tuy nhiên với sự tinh tế đó lại có nhiều đầu ra có thể tùy chỉnh và thích nghi hơn. Có được một chút Giới thiệu về Môi trường Tạo hình và Môi trường Trực quan, hay Weave, là sản phẩm tinh thần của Tiến sĩ Georges ...
Hadoop là gì? - núm vú
Hadoop là một công cụ xử lý dữ liệu mã nguồn mở được phát triển bởi Tổ chức Phần mềm Apache. Hadoop hiện là chương trình đi-vào để xử lý khối lượng lớn và các loại dữ liệu vì nó được thiết kế để làm cho máy tính quy mô lớn hơn giá cả phải chăng và linh hoạt. Với sự xuất hiện của Hadoop, việc xử lý dữ liệu đại chúng đã được giới thiệu nhiều hơn ...
Tại sao các công ty cần dữ liệu trong chuyển động cho dữ liệu lớn - ốc vít
Bạn cần dữ liệu chuyển động để phản ứng nhanh với tình trạng hiện tại của dữ liệu lớn. Để hoàn thành giao dịch thẻ tín dụng hoặc gửi e-mail, dữ liệu cần được vận chuyển từ địa điểm này đến địa điểm khác. Dữ liệu đang nghỉ ngơi khi được lưu trữ trong cơ sở dữ liệu trong trung tâm dữ liệu hoặc đám mây của bạn. Ngược lại, ...
Dữ liệu Các nguồn của các chính phủ trên khắp thế giới - núm vú
Hoa Kỳ chỉ là một trong nhiều chính phủ chia sẻ dữ liệu với công chúng. Mặc dù bạn sẽ không tìm thấy chính xác cùng phạm vi hoặc loại dữ liệu từ mọi quốc gia, bạn sẽ thấy rằng hầu hết các quốc gia đều có một số dữ liệu để chia sẻ. Ngoài ra còn có một số tổ chức liên chính phủ và phi lợi nhuận cung cấp tài nguyên dữ liệu quốc tế. OFFSTATS. ...
Tại sao Các vấn đề về Trực quan hóa cho Analytics tiên đoán - những người có núm vú
ĐọC hàng các bảng tính, quét các trang và các trang báo cáo, thông qua các ngăn xếp các kết quả phân tích được tạo ra bởi các mô hình tiên đoán có thể rất phức tạp, tốn nhiều thời gian, và - hãy đối mặt với nó - nhàm chán. Nhìn vào một vài biểu đồ đại diện cho cùng một dữ liệu nhanh hơn và dễ dàng hơn, trong khi truyền đạt ý nghĩa tương tự. Các đồ thị có thể mang lại nhiều hơn
Hình dung kết quả phân tích của Mô hình Tiên đoán của bạn - những con vú
Thường xuyên, bạn cần phải có khả năng hiển thị kết quả dự đoán của bạn phân tích cho những người quan trọng. Dưới đây là một số cách sử dụng kỹ thuật hiển thị để báo cáo kết quả mô hình của bạn cho các bên liên quan. Hiển thị nhóm ẩn trong dữ liệu của bạn Tập hợp dữ liệu là quá trình khám phá các nhóm ẩn của các mục có liên quan bên trong ...
ĐịNh nghĩa dữ liệu lớn: Khối lượng, tốc độ, và đa dạng - núm vú
Dữ liệu lớn cho phép các , quản lý và vận dụng số lượng lớn các dữ liệu khác nhau ở đúng tốc độ và vào đúng thời điểm. Để có được những hiểu biết đúng đắn, dữ liệu lớn thường được chia nhỏ theo ba đặc điểm: Khối lượng: Bao nhiêu dữ liệu Vận tốc: Dữ liệu được xử lý nhanh như thế nào Giống: Các loại dữ liệu Trong khi nó ...
Làm việc với dữ liệu đồ thị trong Python cho Khoa học dữ liệu - núm vú
Phần lớn các nhà khoa học dữ liệu phải làm việc với dữ liệu đồ thị tại một số điểm. Python cung cấp cho bạn chức năng đó. Hãy tưởng tượng các điểm dữ liệu được kết nối với các điểm dữ liệu khác, chẳng hạn như cách một trang web được kết nối với một trang web khác thông qua các siêu liên kết. Mỗi điểm dữ liệu là một nút. Các nút kết nối với nhau bằng cách sử dụng ...
Phân biệt các thuật toán từ các cấu trúc toán khác - những núm vú
Nếu bạn giống như hầu hết mọi người, bạn thường thấy mình gãi đầu khi nói đến các cấu trúc toán học bởi vì không ai dường như biết cách sử dụng các thuật ngữ một cách chính xác. Nó như thể mọi người cố tình cố gắng làm mọi thứ trở nên khó khăn! Sau khi tất cả, một phương trình là gì và tại sao nó là khác nhau từ một thuật toán? ...
ĐốI phó với sự phức tạp của thuật toán - những con vú
Bạn đã biết rằng các thuật toán rất phức tạp. Tuy nhiên, bạn cần phải biết một thuật toán phức tạp phức tạp như thế nào bởi vì một thuật toán phức tạp hơn là, nó cần nhiều thời gian hơn để chạy. Bảng dưới đây giúp bạn hiểu mức độ phức tạp khác nhau được trình bày theo thứ tự thời gian chạy (từ nhanh nhất đến chậm nhất). Sự phức tạp Mô tả Sự phức tạp liên tục O (1) ...
Dữ liệu Các nguồn từ Chính phủ Liên bang Hoa Kỳ - những con số
Chính phủ Hoa Kỳ bao gồm hơn 100 cơ quan, cơ quan thống kê với mục đích chính là thu thập và phân tích dữ liệu cho một số sử dụng của chính phủ. Kết quả là một nguồn tài nguyên rộng lớn của dữ liệu được thu thập, quản lý và phân tích chuyên nghiệp, phần lớn trong số đó có sẵn cho bạn. Cục phân tích kinh tế. Cục phân tích kinh tế (BEA) là một phần ...
Dữ liệu Các nguồn của Chính phủ Hoa Kỳ và Chính quyền địa phương - những núm vú
Tìm dữ liệu bạn cần từ chính quyền tiểu bang và địa phương có thể rất khó khăn. Một số quốc gia quan tâm đến việc chia sẻ dữ liệu hơn các quốc gia khác. Bạn không thể đếm trên mỗi tiểu bang hoặc chính quyền địa phương để có một cổng dữ liệu mở hoặc tìm kiếm một người nào đó trong chính quyền địa phương để giúp bạn tìm thấy những gì bạn cần hoặc ...
Các yếu tố được thêm vào Bloom Bộ lọc - núm vú
Nói chung, bạn tạo bộ lọc Bloom cho các thuật toán của một kích thước cố định cho phép bạn thay đổi kích thước của bộ lọc). Bạn vận hành chúng bằng cách thêm các phần tử mới vào bộ lọc và tìm kiếm chúng khi đã có mặt. Không thể xóa một phần tử khỏi bộ lọc sau khi thêm nó (bộ lọc có một phần không thể xóa nhòa ...
Cách tiếp cận khác nhau để Phân tích Dữ liệu Lớn - núm vú
Trong nhiều trường hợp, phân tích dữ liệu lớn sẽ được trình bày cho người dùng cuối thông qua báo cáo và hình ảnh hóa. Bởi vì dữ liệu thô có thể không đồng nhất, bạn sẽ phải dựa vào công cụ phân tích và kỹ thuật để giúp trình bày dữ liệu theo những cách có ý nghĩa. Các ứng dụng mới đang có mặt và sẽ chia thành hai loại: ...
Một lịch sử tóm tắt của Kho dữ liệu - núm vú
Nhiều người, khi họ lần đầu tiên nghe các nguyên tắc cơ bản của kho dữ liệu - đặc biệt là sao chép dữ liệu từ nơi này sang nơi khác - nghĩ (hoặc thậm chí nói), "Điều đó không có ý nghĩa! Tại sao lãng phí thời gian sao chép và di chuyển dữ liệu, và lưu trữ nó trong một cơ sở dữ liệu khác nhau? Tại sao không lấy nó trực tiếp từ vị trí ban đầu ...
Dịch vụ EII bổ sung cho Kho dữ liệu - núm vú
Môi trường lưu trữ dữ liệu ảo của bạn bao gồm các dịch vụ mà một cơ sở dữ liệu duy nhất sẽ xử lý một môi trường tập trung. Các dịch vụ trung gian thực sự bổ sung cho các phần mềm trung gian lưu trữ dữ liệu truyền thống, chẳng hạn như khai thác và chuyển đổi: Dịch vụ siêu dữ liệu thống nhất: Người dùng thấy một khung nhìn hợp lý về nội dung của môi trường mà không cần biết vị trí và thông tin của ...
Cơ bản của cơ sở hạ tầng dữ liệu lớn - núm vú
Dữ liệu lớn là về tốc độ cao, khối lượng lớn và nhiều loại dữ liệu khác nhau, do đó, cơ sở hạ tầng vật lý sẽ thực sự "tạo ra hoặc phá vỡ" việc thực hiện. Hầu hết các triển khai dữ liệu lớn cần phải có sẵn rất cao, do đó mạng, máy chủ và bộ nhớ vật lý phải linh hoạt và dư thừa. Khả năng phục hồi và dự phòng tương quan với nhau. Một cơ sở hạ tầng, hoặc một hệ thống, ...
Cách tiếp cận Các nhà cung cấp sản phẩm dữ liệu Kho hàng - núm vú
ĐốI phó với các nhà cung cấp sản phẩm lưu trữ dữ liệu: Làm bài tập ở nhà của bạn. Hỏi rất nhiều câu hỏi. Hãy hoài nghi. Dành thời gian của bạn trước khi cam kết mua sản phẩm. Bản chất một-đối-một của mối quan hệ giữa nhà cung cấp và khách hàng hơi khác với sự tương tác của liên lạc xảy ra ở
Biết hoài nghi với Kho dữ liệu Mua sắm - núm vú
Bạn cần phải có cuộc trò chuyện thẳng thắn và thảo luận cởi mở với nhà cung cấp sản phẩm data warehousing (không phải cuộc trò chuyện được tổ chức tại một gian hàng đông đúc tại một cuộc triển lãm thương mại). Nếu bạn đã nghe một số điều về một sản phẩm mà bạn quan tâm (khả năng mở rộng sản phẩm trên một số lượng người dùng nhất định, ví dụ), hãy hỏi! Bằng chứng về nhu cầu (các trang tham khảo, thảo luận với người quản lý phát triển, ...
Dữ liệu lớn và nguồn gốc của MapReduce - núm vú
MapReduce ngày càng trở nên hữu ích cho các dữ liệu lớn. Vào đầu những năm 2000, một số kỹ sư tại Google nhìn vào tương lai và xác định rằng mặc dù các giải pháp hiện tại của họ cho các ứng dụng như thu thập dữ liệu web, tần suất truy vấn, v.v ... đủ cho hầu hết các yêu cầu hiện tại, chúng không tương xứng với sự phức tạp mà họ dự đoán là web ...
Khái niệm cơ bản về Ảo hóa Dữ liệu lớn - núm vú
ẢO hóa là lý tưởng cho dữ liệu lớn bởi vì nó tách biệt tài nguyên và dịch vụ , cho phép bạn tạo ra nhiều hệ thống ảo trong một hệ thống vật lý duy nhất. Một trong những lý do chính mà các công ty đã thực hiện ảo hóa là để cải thiện hiệu suất và hiệu quả xử lý của một sự pha trộn đa dạng của khối lượng công việc. ...
Phân tích dữ liệu lớn và Kho dữ liệu - những con voi
Bạn sẽ tìm thấy giá trị trong việc mang các khả năng của kho dữ liệu và môi trường dữ liệu lớn với nhau. Bạn cần phải tạo môi trường lai, nơi dữ liệu lớn có thể làm việc với kho dữ liệu. Thứ nhất, điều quan trọng là phải nhận ra rằng kho dữ liệu được thiết kế hôm nay sẽ không thay đổi ...
Phân tích nghiệp vụ (OLAP) - núm vú
Phân tích nghiệp vụ là thuật ngữ dùng để mô tả hình dung dữ liệu theo cách đa chiều. Dữ liệu truy vấn và dữ liệu báo cáo thường được trình bày theo hàng sau hàng dữ liệu hai chiều. Thứ nguyên đầu tiên là tiêu đề cho các cột dữ liệu; kích thước thứ hai là dữ liệu thực tế được liệt kê bên dưới các tiêu đề cột đó. Phân tích kinh doanh cho phép người sử dụng ...
Nhà cung cấp Đám mây dữ liệu lớn - những người có núm vú
Nhà cung cấp đám mây có tất cả các hình dạng và kích cỡ và cung cấp nhiều sản phẩm khác nhau cho dữ liệu lớn. Một số là tên hộ gia đình, trong khi một số khác đang nổi lên. Một số nhà cung cấp đám mây cung cấp dịch vụ IaaS có thể được sử dụng cho dữ liệu lớn bao gồm Amazon. com, AT & T, GoGrid, Joyent, Rackspace, IBM và Verizon / Terremark. Cloud Compression của Amazon Công khai Cloud ...
Dữ liệu Khai thác, Di chuyển và Tải cho Kho dữ liệu Tối cao - núm vú
Phân phối dữ liệu quy mô lớn và công nghệ tiên tiến có thể tích hợp các hệ thống "kinh doanh" khác nhau, nâng cao chất lượng tổng thể của tài sản dữ liệu thông qua nhu cầu phân tích thông tin kinh doanh và nhu cầu giao dịch. Một kho dữ liệu tối đa có thể bao gồm một môi trường cơ sở dữ liệu đáp ứng các yêu cầu này: Nó được phân phối trên nhiều nền tảng khác nhau. ...
Phân loại Kho dữ liệu của bạn - núm vú
Mặc dù bạn phải đảm bảo rằng kho dữ liệu phù hợp với nhu cầu riêng của bạn, một số nguyên tắc có thể giúp bạn xác định sự phức tạp có thể xảy ra của môi trường và cấu trúc của nó. Một thiết lập tốt là sử dụng phân loại ba cấp để lập kế hoạch một kho dữ liệu.
Kiến trúc thông minh và Kho dữ liệu - kỷ luật
Những ngày đầu của xử lý thông minh nghiệp vụ (bất kỳ loại trừ khai thác dữ liệu) đã có một hương vị khách hàng / máy chủ mạnh mẽ, hai tầng.
Dữ liệu Marts Nguồn gốc của một Kho Dữ liệu - những con vú
Nhiều chuyên gia lưu trữ dữ liệu sẽ cho rằng một data mart thật là một "cửa hàng bán lẻ", và một kho dữ liệu cung cấp nội dung của nó, như thể hiện trong hình này. Trong một môi trường như thể hiện trong hình này, các nguồn dữ liệu, kho dữ liệu, data mart, và người dùng tương tác theo cách này: Các nguồn dữ liệu, hoạt động như ...
ĐặC điểm của Khung Phân tích Dữ liệu Lớn - những con vú
Ngay cả khi các bộ công cụ mới tiếp tục có sẵn để giúp bạn quản lý và phân tích khuôn khổ dữ liệu lớn của bạn hiệu quả hơn, bạn không thể có được những gì bạn cần. Ngoài ra, một loạt các công nghệ có thể hỗ trợ phân tích số liệu lớn và các yêu cầu như tính khả dụng, khả năng mở rộng và hiệu năng cao. Một số trong số này ...
Dữ liệu khai thác để lưu trữ dữ liệu - núm vú
Vào các thời điểm, khai thác dữ liệu cho kho dữ liệu không được kết hợp với các hình thức khác kinh doanh thông minh. Sự thiếu tích hợp này xảy ra vì hai lý do: Người dùng doanh nghiệp không có kiến thức cần thiết trong nền tảng thống kê khai thác dữ liệu. Các nhà cung cấp thông tin kinh doanh chính không cung cấp các công cụ khai thác dữ liệu mạnh mẽ, và các nhà cung cấp khai thác dữ liệu không cung cấp ...
Các kho dữ liệu Kho hàng - ví dụ
Giống như với quần jeans chuông, cơ sở dữ liệu hỗ trợ phần cứng đang trên con đường trở lại. Microsoft, Oracle, và Netezza là tất cả các cơn thịnh nộ tại các cuộc hội thảo cơ sở dữ liệu trên toàn cầu. Vào giữa những cuối những năm 1980, các nhà cung cấp Britton Lee và Teradata (mà cuối cùng sáp nhập) đều là những cơn thịnh nộ. Họ cung cấp máy móc chuyên dụng để tối ưu hoá việc xử lý cơ sở dữ liệu - máy đầu tiên ...
Các nguyên tắc cơ bản và bảng điểm - nguyên tắc
Nguyên tắc cơ bản đằng sau chức năng bảng điều khiển và bảng điểm của kho dữ liệu là "Nói cho tôi biết rất nhiều thứ, nhưng đừng khiến tôi làm việc quá sức. "Mặc dù có những nỗ lực tốt nhất của các nhà cung cấp, mặc dù tất cả các yếu tố con người và nghiên cứu khả năng sử dụng đã được đưa vào các sản phẩm thông minh kinh doanh và cho dù bạn đào tạo nhiều như thế nào ...
Dữ liệu Chiết xuất, Di chuyển và Đang tải cho Kho dữ liệu Deluxe - những con vú
Là lớn - và ngày càng lớn hơn. Các triển khai sử dụng hàng trăm gigabyte (một gigabyte bằng 1 tỷ byte) và thậm chí là terabyte (1 nghìn tỉ byte) ngày càng phổ biến. Để quản lý khối lượng dữ liệu và quyền truy cập của người dùng, bạn cần một máy chủ và cơ sở dữ liệu rất mạnh. Chuẩn bị cho ...
Dữ liệu Kho: Nguồn cấp dữ liệu - núm vú
Kho dữ liệu, theo bản chất của nó, cửa hàng. Sự phân bố tài sản thông tin của bạn giúp ích trong việc thực hiện và khả năng sử dụng trong các hệ thống và trên toàn doanh nghiệp. Làm cho mức độ sử dụng này là nền tảng của sứ mệnh kho lưu trữ dữ liệu và mục tiêu của bạn. Hình này cho thấy cách lưu trữ dữ liệu quan trọng của một dữ liệu ...
Tối đa Nguồn dữ liệu và Công cụ Thông minh Kinh doanh cho Kho Dữ liệu Tối cao - núm vú
Do phạm vi rộng các lĩnh vực chủ đề trong một kho dữ liệu tối cao, nó có nhiều nguồn dữ liệu. Tin tốt: Vì nhiều nguồn bên ngoài môi trường lưu trữ của riêng bạn, bạn không phải chịu trách nhiệm cá nhân về việc khai thác, chuyển đổi và tải để đưa chúng vào kho của bạn. Tin xấu: Một người nào đó đã ...