Trang Chủ Tài chính Cá nhân Cách tìm kiếm Dữ liệu Analytics tiên đoán của bạn - những con cần có

Cách tìm kiếm Dữ liệu Analytics tiên đoán của bạn - những con cần có

Mục lục:

Video: Hướng dẫn dự đoán chi phí, số lần nhấp chuột và thứ hạng từ khóa | Alada.vn 2025

Video: Hướng dẫn dự đoán chi phí, số lần nhấp chuột và thứ hạng từ khóa | Alada.vn 2025
Anonim

dữ liệu phân tích tiên đoán của bạn cần biết cách tìm thông tin bạn muốn tìm. Có hai khái niệm chính về tìm kiếm dữ liệu của bạn để chuẩn bị cho việc sử dụng nó trong phân tích tiên đoán:

  • Sẵn sàng vượt qua tìm kiếm từ khóa cơ bản

  • Làm cho dữ liệu của bạn có thể tìm kiếm theo ngữ nghĩa

Cách sử dụng tìm kiếm dựa trên từ khoá trong dự đoán phân tích

Hãy tưởng tượng nếu bạn được giao nhiệm vụ tìm kiếm số lượng lớn dữ liệu. Một cách để tiếp cận vấn đề là đưa ra một truy vấn tìm kiếm bao gồm (rõ ràng) các từ. Công cụ tìm kiếm sẽ tìm các từ phù hợp trong cơ sở dữ liệu, kho dữ liệu hoặc đi lục lọi qua bất kỳ văn bản nào mà dữ liệu của bạn cư trú.

Giả sử bạn đang thực hiện truy vấn tìm kiếm sau: Tổng thống Hoa Kỳ thăm Châu Phi . Kết quả tìm kiếm sẽ bao gồm văn bản có chứa chính xác một hoặc một sự kết hợp của các từ Tổng thống, Hoa Kỳ, thăm, Châu Phi . Bạn có thể nhận được thông tin chính xác mà bạn đang tìm kiếm, nhưng không phải luôn luôn.

Còn các tài liệu không chứa bất kỳ từ nào đã đề cập trước đó, nhưng một số sự kết hợp sau đây: Chuyến đi của Obama tới Kenya .

Không có từ nào bạn tìm kiếm ban đầu ở đó - nhưng kết quả tìm kiếm là ngữ nghĩa (có ý nghĩa) hữu ích. Làm thế nào bạn có thể chuẩn bị dữ liệu của bạn được lấy lại ngữ nghĩa? Làm thế nào bạn có thể vượt xa việc tìm kiếm từ khóa truyền thống? Câu trả lời của bạn có thể được tìm thấy nếu bạn tiếp tục đọc.

Một ví dụ về cách các công trình nghiên cứu dựa trên ngữ nghĩa là một dự án mà Anasse Bari lãnh đạo tại Ngân hàng Thế giới, một tổ chức quốc tế có nhiệm vụ chính là để chống lại đói nghèo trên toàn thế giới.

Dự án nhằm mục đích điều tra các tìm kiếm và phân tích doanh nghiệp có quy mô lớn hiện có trên thị trường và xây dựng một mẫu thử nghiệm cho một khuôn khổ tiên tiến để tổ chức dữ liệu của Ngân hàng Thế giới - hầu hết là một bộ sưu tập tài liệu, ấn phẩm, báo cáo dự án không có cấu trúc, tóm tắt, và nghiên cứu trường hợp.

Kiến thức quý giá này là một nguồn lực được sử dụng cho sứ mệnh chính của Ngân hàng trong việc giảm đói nghèo trên thế giới. Nhưng thực tế là nó không có cấu trúc làm cho nó khó khăn để truy cập, chụp, chia sẻ, hiểu, tìm kiếm, khai thác dữ liệu, và hình dung.

Ngân hàng Thế giới là một tổ chức bao la, với nhiều đơn vị trên toàn cầu. Một trong những bộ phận chính đang phấn đấu để có một khuôn khổ và sẵn sàng phân bổ nguồn lực để hỗ trợ nhóm Bari là Mạng lưới Phát triển Con người trong Ngân hàng Thế giới.

Phó chủ tịch của Mạng lưới Phát triển con người vạch ra một vấn đề phát sinh từ sự mơ hồ: Bộ phận của ông đã sử dụng một số thuật ngữ và khái niệm có ý nghĩa chung chung nhưng khác biệt.

Chẳng hạn, các thuật ngữ như khí hậu học, thay đổi khí hậu, suy giảm khí ozone, và

phát thải khí nhà kính đều liên quan đến ngữ nghĩa nhưng không giống nhau về ý nghĩa. Anh ấy muốn có khả năng tìm kiếm đủ thông minh để trích xuất các tài liệu chứa các khái niệm liên quan khi ai đó tìm kiếm bất kỳ từ nào trong số những từ này. Khung nguyên mẫu "cho khả năng đó mà nhóm Bari đã chọn là Kiến trúc Quản lý Thông tin phi cấu trúc (UIMA), một giải pháp dựa trên phần mềm. Được thiết kế bởi IBM Research, UIMA có sẵn trong phần mềm IBM như IBM Content Analytics, một trong những công cụ hỗ trợ IBM Watson, máy tính nổi tiếng đã giành được trò chơi Jeopardy. Nhóm Bari đã hợp sức với một đội ngũ rất tài năng từ IBM Content Management và Enterprise Search, và sau đó là một nhóm IBM Watson, để cộng tác trong dự án này. Giải pháp quản lý thông tin phi cấu trúc

là một hệ thống phần mềm phân tích khối lượng lớn các thông tin phi cấu trúc (văn bản, âm thanh, video, hình ảnh, v.v.) để khám phá, tổ chức và cung cấp kiến ​​thức có liên quan tới khách hàng hoặc ứng dụng người dùng cuối.

Bản thể luận

của một tên miền là một loạt các khái niệm và các thuật ngữ liên quan đến tên miền. Giải pháp dựa trên UIMA sử dụng bản thể luận để cung cấp khả năng gắn thẻ ngữ nghĩa, cho phép tìm kiếm phong phú hơn so với định dạng dữ liệu (văn bản, phát biểu, thuyết trình PowerPoint, e-mail, video …). UIMA nối thêm một lớp khác vào dữ liệu đã chụp, sau đó thêm siêu dữ liệu để xác định dữ liệu có thể được tìm kiếm theo cấu trúc và ngữ nghĩa.

Tìm kiếm ngữ nghĩa dựa trên ý nghĩa ngữ cảnh của cụm từ tìm kiếm khi chúng xuất hiện trong không gian dữ liệu có thể tìm kiếm mà UIMA xây dựng. Tìm kiếm ngữ nghĩa là chính xác hơn so với tìm kiếm dựa trên từ khóa thông thường bởi vì truy vấn của người dùng trả về kết quả tìm kiếm không chỉ các tài liệu có chứa các cụm từ tìm kiếm, mà cả các tài liệu có liên quan đến ngữ nghĩa có liên quan đến truy vấn. đa dạng sinh học ở Châu Phi , một tìm kiếm điển hình (từ khoá) sẽ trả lại các tài liệu có các từ chính xác đa dạng sinh học

và Châu Phi

. Một tìm kiếm ngữ nghĩa dựa trên UIMA sẽ trả lại không chỉ các tài liệu có hai từ đó, mà còn là bất cứ điều gì có liên quan đến ngữ nghĩa với các tài liệu "đa dạng sinh học ở Châu Phi" có chứa các từ như là "tài nguyên thực vật ở châu Phi", "nguồn động vật Ma-rốc "hoặc" nguồn gen ở Zimbabwe. " Thông qua các ngữ nghĩa gắn thẻ và sử dụng các bản thể luận, thông tin trở nên có khả năng truy xuất ngữ nghĩa, độc lập với ngôn ngữ hoặc môi trường mà thông tin được tạo ra (Word, PowerPoint, e-mail, video, v.v.). Giải pháp này cung cấp một trung tâm duy nhất mà dữ liệu có thể được thu thập, tổ chức, trao đổi, và mang lại khả năng truy xuất ngữ nghĩa. Từ điển đồng nghĩa và các thuật ngữ có liên quan là mã nguồn mở (có sẵn miễn phí) - hoặc bạn có thể phát triển các từ điển riêng của mình cho tên miền hoặc dữ liệu của bạn. Bạn có thể xây dựng bảng tính có từ gốc và các từ, từ đồng nghĩa và các từ liên quan tương ứng. Bảng tính có thể được tải lên trong một công cụ tìm kiếm như IBM Content Analytics (ICA) để cấp quyền cho phân tích nội dung và tìm kiếm doanh nghiệp.

Cách tìm kiếm Dữ liệu Analytics tiên đoán của bạn - những con cần có

Lựa chọn của người biên tập

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Tiếp thị web, một cách để đảm bảo khả năng hiển thị là để loại bỏ đăng ký và các hình thức đăng nhập. Khách truy cập thường phải hoàn thành các biểu mẫu này trước khi họ có thể tải xuống một số loại nội dung cao cấp, chẳng hạn như giấy trắng hoặc trước khi họ có thể đọc một số bài viết trên trang web. Các công ty đã đưa chúng vào vị trí vì họ muốn dẫn ...

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Duplicate nội dung cần tránh trong web tiếp thị và Google cung cấp công cụ để phát hiện thông tin lặp lại. Không có gì gây tổn hại cho việc tìm kiếm nội dung có liên quan của công cụ tìm kiếm cũng như tìm ra chính xác những từ giống nhau trên hai trang khác nhau. Sao chép là xấu vì những lý do này: Sao chép được sử dụng để được một chiến thuật được sử dụng để đánh lừa ...

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Trong bài hát của họ. Là một nhà tiếp thị web, việc xử lý các liên kết hỏng này có thể giúp đảm bảo sự thành công của trang web của bạn. Nếu một công cụ tìm kiếm đạt đến một liên kết bị hỏng, nó không thể tìm thấy trang bạn dự định (rõ ràng) - nhưng nó cũng có thể bỏ trên trang web của bạn hoặc giảm sự liên quan ...

Lựa chọn của người biên tập

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Số dấu phẩy động là số có các phần phân đoạn (thường được thể hiện bằng dấu thập phân). Bạn nên sử dụng một kiểu điểm nổi trong các chương trình Java bất cứ khi nào bạn cần một số có số thập phân, như là 19. 95 hoặc 3. 1415. Java có hai kiểu nguyên thủy cho các số dấu phẩy: float: Sử dụng 4 byte gấp đôi: Sử dụng 8 bytes Trong hầu hết tất cả ...

Tải phiên bản mới nhất của Java - núm vú

Tải phiên bản mới nhất của Java - núm vú

Trước khi bạn có thể viết các chương trình Java cho các thiết bị Android, bạn cần một số phần mềm công cụ, bao gồm cả phiên bản mới nhất của Java. Bạn có thể có được phiên bản Java mới nhất và lớn nhất bằng cách truy cập vào trang web Java. Trang web cung cấp một số lựa chọn thay thế. (Được giới thiệu) Nhấp chuột vào nút Free Java Download trên trang chính của trang web. Đối với hầu hết các máy tính, ...

Thử nghiệm với JShell - núm vú

Thử nghiệm với JShell - núm vú

JShell là một công cụ Java 9 cho phép bạn khám phá về lập trình. JShell làm cho nó dễ dàng để chơi xung quanh mà không sợ hậu quả thảm khốc. Các chương trình Java thường sử dụng cùng kiểu cũ, lúng túng: public class SomethingOrOther {public static void main (String args []) {Một chương trình Java đòi hỏi sự giới thiệu này bởi vì trong Java ...

Lựa chọn của người biên tập

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Bản quyền © 2014 AARP Tất cả các quyền được bảo lưu. Tâm linh và tôn giáo, tình dục, những trò vui nhộn nhịp, sự tham gia của gia đình, lối sống và tiền bạc - tất cả những điều này thường quan trọng đối với những người trên 50 tuổi, nhưng bạn có thể đặt một số cao hơn những người khác. Trong bất kỳ trường hợp nào, điều quan trọng là phải suy nghĩ về họ trước để bạn có thể thảo luận ...

Hẹn hò Sau 50: Nói về Monogami - vú

Hẹn hò Sau 50: Nói về Monogami - vú

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Một vợ một chồng là một vấn đề lớn cho dù bạn là người chưa sẵn sàng cho vợ chồng một vợ chồng và muốn hẹn hò xung quanh hay người chỉ có thể quan hệ tình dục với một người một lần. Đảm bảo đối tác hẹn hò của bạn biết bạn đang đứng ở đâu (hoặc nằm xuống) đối với vợ chồng một vợ chồng ...

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Nếu bạn bị bệnh mãn tính hoặc đe dọa đến mạng sống khi bạn còn nhỏ, bạn đã có kinh nghiệm về sức khoẻ của mình. Có thể bạn phải liên tục kể câu chuyện về vết sẹo ngực hoặc nẹp chân hoặc giải thích số ít các viên thuốc mà bạn phải dùng mỗi ngày. Nó không phải ...