Văn bản Phân tích dữ liệu không có cấu trúc - đầu
Có rất nhiều phương pháp để phân tích dữ liệu phi cấu trúc cho sáng kiến dữ liệu lớn của bạn. Về mặt lịch sử, những kỹ thuật này xuất phát từ các lĩnh vực kỹ thuật như NLP, khám phá kiến thức, khai thác dữ liệu, thu thập thông tin và thống kê. Phân tích văn bản là quá trình phân tích văn bản phi cấu trúc, trích xuất các thông tin có liên quan và chuyển nó thành thông tin cấu trúc có thể sau đó ...
Data Warehouse Deluxe - núm vú
Bạn sẽ tập trung hầu hết các hoạt động liên quan đến kho lưu trữ dữ liệu vào kho dữ liệu môi trường sang trọng, như thể hiện trong hình này. Dữ liệu từ nhiều nguồn khác nhau hội tụ trong các kho dữ liệu "thực" này, tạo ra nhiều lựa chọn kiến trúc mà bạn có thể đáp ứng các nhu cầu cụ thể của mình. Các lĩnh vực chủ đề và nội dung dữ liệu của ...
Mười câu hỏi cần xem xét khi bạn chọn Công cụ Người dùng - ốc vít
ÍT điều hơn bực bội hơn là xây dựng thành công kho dữ liệu và sau đó làm cho nó trở nên không sử dụng được bởi các công cụ người dùng chưa đủ. Danh sách này trình bày một số câu hỏi cần xem xét khi bạn đánh giá các công cụ mà bạn có thể muốn mua. Tôi có muốn một smorgasbord hoặc một nhà hàng ngồi xuống? Cược rằng bạn không mong đợi một câu hỏi như thế này ...
Kho dữ liệu tối cao - núm vú
Kho dữ liệu hiện đại ngày nay trông giống như một kho dữ liệu phức tạp sang trọng . Kho dữ liệu của ngày mai, mặc dù - kho dữ liệu tối cao - sẽ trông khá khác nhau. Có rất ít doanh nghiệp đã mạo hiểm theo hướng này, mặc dù do tổng chi phí và khả năng, rất hiếm khi tìm thấy nhiều kho dữ liệu supremes. ...
Mười dấu hiệu của một dự án kho dữ liệu trong Trouble - dummies
Bạn có thể dễ dàng nói rằng dữ liệu của bạn dự án kho hàng đang gặp rắc rối khi bạn không có bất cứ điều gì để thể hiện cho những nỗ lực của bạn khi bạn nghĩ bạn sẽ. Hãy thử để có được một số dấu hiệu cho thấy rằng sự cố của pha, tuy nhiên, trước khi bạn đạt đến điểm đó. Danh sách này trình bày mười dấu hiệu cảnh báo sớm. Giai đoạn của dự án kết thúc bằng ...
Mười bí mật để quản lý dự án của bạn một cách thành công - núm vú
Là quản lý dự án kho dữ liệu thành công có nghĩa là bạn phải làm nhiều hơn - nhiều hơn nữa - hơn là chỉ đơn giản là tạo ra kế hoạch dự án và yêu cầu các thành viên trong nhóm quay lại báo cáo tình trạng hàng tuần. Đây là một số bí quyết thành công. Nói với nó là nó không quan trọng cho dù bạn đang làm việc với người sử dụng, các nhà tài trợ điều hành, ...
Sự phát triển của các mô hình triển khai trong kỷ nguyên dữ liệu lớn - kỷ nguyên
Với sự xuất hiện của dữ liệu lớn , các mô hình triển khai để quản lý dữ liệu đang thay đổi. Kho dữ liệu truyền thống thường được thực hiện trên một hệ thống lớn duy nhất trong trung tâm dữ liệu. Chi phí của mô hình này đã dẫn các tổ chức tối ưu hóa các kho này và hạn chế phạm vi và kích thước của dữ liệu đang được quản lý. Tuy nhiên, khi ...
Mười lĩnh vực chủ đề để trang bìa với các nhà cung cấp kho dữ liệu - những con vú
ĐâY là mười lĩnh vực mà bạn nên thảo luận với bất kỳ nhà cung cấp sản phẩm lưu trữ dữ liệu nào, bất kể loại sản phẩm nào (công cụ thông tin kinh doanh, công cụ trung gian hoặc RDBMS) bạn đang cân nhắc mua. Cũng có một câu hỏi cụ thể mà bạn có thể muốn hỏi. Tất cả những câu hỏi này hơi kỳ quặc vì chúng không liên quan gì đến vấn đề này ...
Tương lai của các kho dữ liệu trong dữ liệu lớn Era - núm vú
Thị trường kho dữ liệu thực sự bắt đầu thay đổi và phát triển với sự xuất hiện của dữ liệu lớn. Trong quá khứ, nó đơn giản là không tiết kiệm cho các công ty để lưu trữ số lượng lớn dữ liệu từ một số lượng lớn các hệ thống hồ sơ. Việc thiếu các kiến trúc máy tính phân tán hiệu quả về chi phí và thực tiễn có nghĩa là dữ liệu ...
Các thể loại chính của Business Intelligence - núm vú
Ngay từ đầu dự án kho dữ liệu của bạn, không tập trung vào loại công cụ bạn cần - tuy nhiên. Thay vào đó, hãy tập trung vào việc tìm ra các loại câu hỏi mà người dùng sẽ hỏi đối với nội dung của kho dữ liệu, các loại báo cáo sẽ được chạy và cho mục đích gì, và các mô hình xử lý chung ...
Data Warehouse Lite - núm vú
Kho dữ liệu là một không gian trang nhã, không có xương sống, cách tiếp cận công nghệ thấp để cung cấp dữ liệu có thể giúp ích cho một số quyết định kinh doanh của bạn. Không khoe khoang có nghĩa là bạn đã cùng nhau, khi có thể, các khả năng đã được kiểm chứng và các công cụ đã có trong tổ chức của bạn để xây dựng hệ thống của bạn. Một kho dữ liệu ...
Mối quan hệ giữa Bảng điều khiển, Thẻ điểm và các phần khác của Tình báo Kinh doanh - những người có núm vú
Bảng điều khiển và phiếu ghi điểm thường liên quan đến kết quả từ các công cụ thông minh kinh doanh khác, đại diện cho cơ chế trình bày chứ không phải là cơ chế phân tích. Ví dụ, bạn có thể tạo ra "các trang" của một cuốn sách tóm tắt từ kết quả của các báo cáo khác nhau chuẩn (chạy từ công cụ báo cáo) ngoài một phân tích đa nguyên thô sơ từ tổ chức ...
Tầm nhìn của Tình báo Kinh doanh Hợp tác - núm vú
Sự thông minh hợp tác kinh doanh là có thật trong nhiều tình huống tiêu dùng. eBay, Amazon và Google đều tận dụng dữ liệu chính để cung cấp thông tin cho bạn, người tiêu dùng. Các công ty như eBay thậm chí đang cân nhắc các sản phẩm trong lĩnh vực kho dữ liệu và kinh doanh thông minh để hỗ trợ các nhà cung cấp trong các sản phẩm di chuyển tốt hơn thông qua nền tảng của họ. Nhưng những công nghệ này cần ...
Ba khía cạnh của tình báo nghiệp vụ hợp tác - núm vú
Thông minh kinh doanh hợp tác là môi trường trong đó người dùng có thể dễ dàng cộng tác và giao tiếp với nhau, chia sẻ ý tưởng, thông tin, và ra quyết định trong cộng đồng của họ. Duy trì kiến thức Mỗi ngày, không có ai thu thập được hàng triệu mặt hàng sở hữu trí tuệ (các cuộc hội thoại, e-mail, và các cuộc điện thoại) trong các tổ chức trên toàn thế giới. Sử dụng phần mềm hợp tác để ...
Từ trên xuống, dữ liệu Quick-Strike Marts - những núm vú
ĐôI khi bạn không có một kho dữ liệu để lấy dữ liệu cho dữ liệu của bạn, vì vậy bạn phải tự lấy dữ liệu từ các ứng dụng.
Lời khuyên dành cho Tư vấn Kho hàng Dữ liệu - đầu
Hầu hết thông tin trên trang web về việc lưu trữ dữ liệu được định hướng chủ yếu hướng tới cộng đồng người dùng và làm thế nào những người trong đó có thể tìm và giữ lại các tư vấn cho các dự án kho dữ liệu của họ. Tuy nhiên, nếu bạn là một nhà tư vấn về lưu trữ dữ liệu, đây là một số lời khuyên trọn vẹn: Hãy luôn đứng trên tất cả những thay đổi đang diễn ra ...
Phương pháp lưu trữ dữ liệu truyền thống Phương pháp phân tích các kiểu dữ liệu truyền thống
Khi lên kế hoạch cho việc lưu trữ dữ liệu, cảnh quan hiện nay bao gồm một loạt các kênh thông tin mới, các nguồn dữ liệu mới và các yêu cầu về phân tích và báo cáo mới. Theo các nhóm phân tích, gần 80-85 phần trăm dữ liệu ngày nay không có cấu trúc, và các kênh thông tin mới như Web, e-mail, voice over IP, tức thời ...
Cảnh báo đối với Người dùng Đám mây dữ liệu Lớn - núm vú
Cảnh báo! Các dịch vụ dựa trên đám mây có thể cung cấp giải pháp kinh tế cho các nhu cầu dữ liệu lớn của bạn, nhưng đám mây có vấn đề. Điều quan trọng là phải làm bài tập về nhà trước khi di chuyển dữ liệu lớn ở đó. Dưới đây là một số vấn đề cần xem xét: Tính toàn vẹn dữ liệu: Bạn cần đảm bảo rằng nhà cung cấp của bạn có quyền kiểm soát tại chỗ để đảm bảo ...
Xem dữ liệu bên ngoài từ một quan điểm của người dùng - núm vú
ĐâY là một phác thảo về cách người dùng kho dữ liệu nhìn thấy bên ngoài dữ liệu và tầm quan trọng của nó. Xem xét hai bảng. Bảng này cho thấy hiệu quả bán hàng của Good Guys, Inc., và bảng dưới đây cho thấy hiệu quả kinh doanh của Bad Guys, Inc. Good Guys, Inc. Hiệu suất Bán hàng 2007 Q1 Kết quả 2008 Q1 ...
Chức năng nào một công cụ Truy vấn và Báo cáo Cung cấp? - núm vú
Để Giúp bạn hiểu được chức năng mà một công cụ truy vấn và báo cáo cung cấp, danh sách này mô tả một số nhiệm vụ họ có thể giúp bạn thực hiện: Chạy báo cáo thường xuyên. Tổ chức của bạn thường xuyên có thể tạo ra các báo cáo tiêu chuẩn đến từ một hệ thống hoạt động hoặc từ dữ liệu được trích từ một hoặc nhiều hệ thống đó. Tạo danh sách có tổ chức. ...
Middleware là gì? - middleware
ĐượC xác định một cách lỏng lẻo, middleware là một tập hợp các dịch vụ thực hiện các chức năng khác nhau trong một môi trường điện toán phân tán, thông qua một loạt các máy chủ và hệ thống máy khách. Về bản chất, middleware là phần mềm máy tính kết nối các thành phần phần mềm. Dưới đây là một số loại dịch vụ trung gian: Bảo mật: Xác thực một chương trình khách hàng cụ thể cho một số thành phần hệ thống để xác minh, ...
Tại sao Bạn nên Sử dụng Hadoop cho dữ liệu lớn? - núm vú
Những người đổi mới công cụ tìm kiếm như Yahoo! và Google đã phải đối mặt với một vấn đề dữ liệu bog. Họ cần phải tìm ra một cách để hiểu được lượng dữ liệu khổng lồ mà động cơ của họ đang thu thập. Các công ty này cần hiểu cả những thông tin họ thu thập và làm thế nào họ có thể kiếm tiền từ dữ liệu đó để hỗ trợ họ ...
Hệ thống quản lý cơ sở dữ liệu tương lai là gì? - núm vú
Quên tất cả về cơ sở toán học của mô hình quan hệ, các nguyên tắc bình thường, và các khía cạnh kỹ thuật cao khác của RDBMS. Nếu bạn quan tâm, hãy tham khảo bất kỳ một trong số nhiều sách giáo khoa có sẵn thảo luận về các nguyên tắc và công nghệ RDBMS cụ thể. Một RDBMS là một hệ thống phần mềm quản lý cơ sở dữ liệu quan hệ. Vì vậy, một cơ sở dữ liệu quan hệ là gì? ...
ĐIều gì Quản lý cần biết về Kho dữ liệu? - núm vú
Một nơi nào đó trong hệ thống phân cấp tổ chức của bạn, ai đó có quyền kiểm soát ngân quỹ mà họ có thể phân bổ cho dự án kho dữ liệu của bạn hoặc dự án khác ở nơi khác trong tổ chức, để mua thiết bị vốn (ví dụ như nhiều máy tính hơn) ), hoặc để trả cho một số mục đích khác. Ai đó cần phải được bán cho dự án kho dữ liệu ...
Thử nghiệm trong tiếp thị trực tiếp - núm vú
Có lẽ là ứng dụng phổ biến nhất cho các thí nghiệm trong khai thác dữ liệu, thí nghiệm có kiểm soát hợp pháp giống như mà các nhà khoa học sử dụng là tiếp thị trực tiếp. Tiếp thị trực tiếp liên quan đến việc liên hệ với từng cá nhân. Khi bạn nhận được một văn bản hoặc một email từ một nhà bán lẻ, đó là tiếp thị trực tiếp. Các danh mục đặt hàng qua thư điện tử truyền thống, các cuộc gọi điện thoại từ các tổ chức từ thiện, và các lá thư vận động từ ...
ĐIều gì sẽ Đặt trong một Dữ liệu Mart - núm vú
Nếu một data mart là một phiên bản nhỏ hơn của kho dữ liệu, câu hỏi này xuất hiện: "quy mô nhỏ hơn" có ý nghĩa gì khi tham chiếu đến nội dung của một siêu dữ liệu? Câu trả lời cho câu hỏi này thường là dữ liệu sẽ là tập con của dữ liệu doanh nghiệp tổng thể. Dữ liệu có giới hạn địa lý Một data mart có thể ...
Mở rộng Lớp dữ liệu của bạn với NoSQL - núm vú
Một cơ sở dữ liệu làm một điều rất tốt: Nó lưu trữ dữ liệu. Tuy nhiên, vì tất cả các ứng dụng cần thêm phần mềm để hoàn thành thì bạn cần đảm bảo rằng cơ sở dữ liệu NoSQL đã chọn của bạn có các công cụ và phần mềm đối tác cung cấp chức năng mở rộng mà bạn yêu cầu. Không đảm bảo rằng chức năng mở rộng được hỗ trợ sẽ có nghĩa là bạn sẽ kết thúc cài đặt ...
Cách tìm số lượng các yếu tố trong luồng dữ liệu - núm vú
Bộ lọc có thể theo dõi các đối tượng đến từ một dòng suối, nó không thể cho biết có bao nhiêu đối tượng ở đó. Một vector bit đầy bởi những cái có thể (phụ thuộc vào số lượng băm và xác suất va chạm) ẩn số thực của các đối tượng được băm tại cùng một địa chỉ. Biết được số khác biệt của ...
ĐịNh dạng dữ liệu đúng cách - con người
Con người sử dụng kinh nghiệm khi họ giải thích dữ liệu mà họ nhìn thấy, nhưng máy tính không thể. Phần mềm khai thác dữ liệu của bạn sẽ cố gắng hết sức để xác định loại dữ liệu trong từng cột, nhưng các loại dữ liệu thường mơ hồ. Khi bạn thấy một danh sách các mã ZIP, bạn không cố thêm và trừ chúng. Bạn biết rằng họ ...
Năm Thực tiễn Tốt nhất Dữ liệu - núm vú
Dữ liệu lớn chỉ ở giai đoạn đầu tiên, nhưng không bao giờ là quá sớm bắt đầu với những thực tiễn tốt nhất. Cũng như mọi công nghệ sắp tới quan trọng, điều quan trọng là phải có một chiến lược đúng đắn và biết bạn đang ở đâu. Thiết lập một lộ trình dữ liệu lớn Ở giai đoạn này, bạn đã thử nghiệm các dữ liệu lớn ...
Năm kế hoạch cho thành công dữ liệu lớn - núm vú
Trong khi dữ liệu lớn chỉ ở giai đoạn đầu, bạn muốn lên kế hoạch cho sự thành công. Không bao giờ là quá sớm để bắt đầu với kế hoạch và thực hành tốt để bạn có thể tận dụng những gì bạn đang học và kinh nghiệm bạn đang đạt được. Lập kế hoạch các mục tiêu dữ liệu lớn của bạn Nhiều tổ chức bắt đầu cuộc hành trình dữ liệu lớn của họ
Bốn giai đoạn lập kế hoạch kinh doanh với dữ liệu lớn - núm vú
Kế hoạch kinh doanh hy vọng đạt được bằng cách tận dụng dữ liệu lớn? Đây là một câu hỏi không dễ để trả lời. Các công ty khác nhau trong các ngành khác nhau cần phải quản lý dữ liệu của họ một cách khác nhau. Nhưng một số vấn đề kinh doanh phổ biến là trọng tâm của cách dữ liệu lớn được xem như là một cách để lên kế hoạch ...
Đồ Thị Khi các cấu trúc dữ liệu thuật toán - núm vú
Đồ Thị là một dạng của cấu trúc dữ liệu chung được sử dụng trong các thuật toán. Bạn thấy đồ thị được sử dụng ở những nơi như bản đồ cho GPS và tất cả các loại nơi khác mà cách tiếp cận trên cùng của cấu trúc cây sẽ không hoạt động. Một đồ thị là một loại của một phần mở rộng cây. Giống như cây, bạn có các nút kết nối ...
3 Hadoop Cấu hình Cụm - núm vú
Nhiều quyết định bạn cần phải thực hiện về thành phần của kệ và mạng là phụ thuộc vào quy mô của cụm Hadoop của bạn. Nó có ba hoán vị chính.
ĐưA các thuật toán vào kinh doanh - con người
Con người hiện nay ở một giao điểm đáng kinh ngạc của khối lượng dữ liệu chưa từng thấy, phần cứng nhỏ hơn và mạnh mẽ hơn, và được phân tích theo các thuật toán mà quá trình này cũng giúp phát triển. Nó không chỉ đơn giản là vấn đề thể tích mà bản thân nó là một thách thức khó khăn. Như đã được chính thức công bố bởi công ty nghiên cứu Gartner vào năm 2001 và ...
Apache Khoan - núm vú
Apache Drill là một dự án ứng dụng trong vườn ươm Apache. Apache Drill không phải là đặc biệt là ốm yếu, mặc dù. Các công nghệ ứng dụng của Apache Software Foundation (ASF) đều bắt đầu như là các dự án ấp trứng trước khi trở thành các công nghệ ASF chính thức. Bạn có thể đọc về Vườn ươm Apache. Bạn có thể đọc về Drill. Lấy cảm hứng từ công nghệ Dremel của Google, mục tiêu đã đề ra cho ...
Apache Bigtop và Hadoop - núm vú
Để Giúp bạn bắt đầu với Hadoop, dưới đây là hướng dẫn về cách nhanh chóng tải xuống và thiết lập up Hadoop trên máy tính xách tay của riêng bạn. Cụm sao của bạn sẽ chạy ở chế độ phân phối giả trên một máy ảo, vì vậy bạn sẽ không cần phần cứng đặc biệt. Một máy ảo (VM) là một máy tính mô phỏng mà bạn có thể chạy trên ...
Cloudera Impala và Hadoop - đầu
Cloudera là một phần mềm và dịch vụ phần mềm Apache Hadoop hàng đầu trong thị trường dữ liệu lớn. Giống như Apache Drill, công nghệ Impala của Cloudera nhằm cải thiện thời gian phản hồi truy vấn tương tác cho người dùng Hadoop. Apache Hive đã cung cấp cơ chế truy vấn quen thuộc và mạnh mẽ cho người dùng Hadoop, nhưng thời gian phản hồi lại thường không được chấp nhận do sự tin cậy của Hive ...