Trang Chủ Tài chính Cá nhân Các khái niệm cơ bản của quá trình phân loại dữ liệu Analytics tiên đoán - núm vú

Các khái niệm cơ bản của quá trình phân loại dữ liệu Analytics tiên đoán - núm vú

Video: Mạng nơ-ron nhân tạo - Neural Networks | Tự học machine learning cơ bản 2025

Video: Mạng nơ-ron nhân tạo - Neural Networks | Tự học machine learning cơ bản 2025
Anonim

Ở cấp độ đồng thau, phân tích dữ liệu phân tích tiên đoán bao gồm hai giai đoạn: giai đoạn học tập và giai đoạn dự đoán. Giai đoạn học tập đòi hỏi phải đào tạo mô hình phân loại bằng cách chạy một tập dữ liệu đã được chỉ định thông qua bộ phân loại. Mục đích là để dạy mô hình của bạn để chiết xuất và khám phá các mối quan hệ và quy tắc ẩn - các quy tắc phân loại 999 từ dữ liệu lịch sử (đào tạo). Mô hình này thực hiện bằng cách sử dụng một thuật toán phân loại.

Giai đoạn dự báo đi sau giai đoạn học tập bao gồm việc mô hình dự đoán các nhãn lớp mới hoặc các giá trị số mà phân loại dữ liệu mà nó chưa từng thấy (đó là dữ liệu thử nghiệm).

Để minh họa các giai đoạn này, giả sử bạn là chủ sở hữu của một cửa hàng trực tuyến bán đồng hồ. Bạn đã sở hữu cửa hàng trực tuyến trong một thời gian và thu thập được rất nhiều dữ liệu giao dịch và dữ liệu cá nhân về khách hàng đã mua đồng hồ từ cửa hàng của bạn. Giả sử bạn đã nắm bắt dữ liệu đó thông qua trang web của bạn bằng cách cung cấp biểu mẫu web, ngoài dữ liệu giao dịch mà bạn đã thu thập qua các hoạt động.

Bạn cũng có thể mua dữ liệu từ bên thứ ba cung cấp cho bạn thông tin về khách hàng của bạn ngoài sự quan tâm của họ đối với đồng hồ. Đó không phải là khó khăn như nó âm thanh; có những công ty có mô hình kinh doanh là để theo dõi khách hàng trực tuyến và thu thập và bán thông tin có giá trị về họ.

Hầu hết các công ty bên thứ ba thu thập dữ liệu từ các trang truyền thông xã hội và áp dụng các phương pháp khai thác dữ liệu để khám phá mối quan hệ giữa người dùng cá nhân với sản phẩm. Trong trường hợp này, là chủ cửa hàng đồng hồ, bạn sẽ quan tâm đến mối quan hệ giữa khách hàng và sự quan tâm của họ trong việc mua đồng hồ.

Bạn có thể suy luận loại thông tin này từ việc phân tích, ví dụ như một hồ sơ mạng xã hội của khách hàng, hoặc một nhận xét về blog nhỏ của loại mà bạn tìm thấy trên Twitter.

Để đo mức độ quan tâm đến đồng hồ của một cá nhân, bạn có thể áp dụng bất kỳ công cụ phân tích văn bản nào có thể khám phá các tương quan như vậy trong văn bản viết của một cá nhân (các trạng thái mạng xã hội, tweet, bài đăng trên blog và như vậy) hoặc hoạt động trực tuyến chẳng hạn như tương tác xã hội trực tuyến, tải ảnh lên và tìm kiếm).

Sau khi bạn thu thập tất cả dữ liệu về các giao dịch trong quá khứ và các sở thích hiện tại của khách hàng - dữ liệu huấn luyện

cho thấy mô hình của bạn cần tìm kiếm gì - bạn cần tổ chức nó vào một cấu trúc tạo ra dễ truy cập và sử dụng (chẳng hạn như cơ sở dữ liệu).

Tại thời điểm này, bạn đã đạt đến giai đoạn phân loại dữ liệu thứ hai: giai đoạn dự báo, tất cả về kiểm tra mô hình của bạn và tính chính xác của các quy tắc phân loại mà nó đã tạo ra. Với mục đích đó, bạn cần thêm dữ liệu khách hàng lịch sử, được gọi là

dữ liệu thử nghiệm (khác với dữ liệu huấn luyện). Bạn cho dữ liệu thử nghiệm này vào mô hình của bạn và đo độ chính xác của các dự đoán kết quả. Bạn tính thời gian mà mô hình dự đoán chính xác hành vi tương lai của khách hàng được trình bày trong dữ liệu thử nghiệm của bạn. Bạn cũng đếm thời gian mà mô hình đã dự đoán sai. Tại thời điểm này, bạn chỉ có hai kết quả: Hoặc bạn hài lòng với tính chính xác của mô hình hoặc bạn không: Nếu bạn hài lòng, sau đó bạn có thể bắt đầu chuẩn bị cho mô hình dự đoán là một phần của hệ thống sản xuất.

Nếu bạn không hài lòng với dự đoán, khi đó bạn sẽ cần phải đào tạo lại mô hình của mình bằng tập dữ liệu đào tạo mới.

Nếu dữ liệu huấn luyện ban đầu của bạn không đủ tiêu chuẩn cho nhóm khách hàng của bạn - hoặc chứa dữ liệu ồn ào đã loại bỏ kết quả của mô hình bằng cách đưa ra các tín hiệu giả mạo - thì có nhiều việc phải làm để làm cho mô hình của bạn hoạt động. Hoặc là kết quả là hữu ích theo cách của mình.

Các khái niệm cơ bản của quá trình phân loại dữ liệu Analytics tiên đoán - núm vú

Lựa chọn của người biên tập

Tìm kiếm Cơ sở dữ liệu của Chính phủ cho dữ liệu Infographics của bạn - núm vú

Tìm kiếm Cơ sở dữ liệu của Chính phủ cho dữ liệu Infographics của bạn - núm vú

Một Infographic tốt có thể trực quan kể một câu chuyện hoặc làm một số trừu tượng hoặc điểm số dễ hiểu, nhưng không có điều này xảy ra mà không có một cơ sở dữ liệu tốt. Các chính phủ thế giới và các tổ chức liên chính phủ duy trì các cơ sở dữ liệu về tất cả các loại thống kê. Dữ liệu về nhân khẩu học, kinh tế, sức khoẻ và văn hoá của vô số nước có sẵn trực tuyến cho ...

Tương lai của Infographics cho Giáo dục - núm vú

Tương lai của Infographics cho Giáo dục - núm vú

Sinh viên ngày nay có dây từ khi sinh ra, và khi họ đến trường tuổi, họ đã quen với các bài thuyết trình đầy màu sắc, đồ họa và giải trí. Nhập thông tin đồ họa. Có thể có một vài cách mà các biểu đồ chữ ký sẽ đóng vai trò mạnh mẽ hơn trong giáo dục trong thập kỷ tới và hơn thế nữa: Giải thích các khái niệm phức tạp: Chúng ta đã phải vật lộn qua một thứ gì đó trong trường học. ...

Lời khuyên cho việc định vị văn bản trên các hình ảnh hoá dữ liệu - núm vú

Lời khuyên cho việc định vị văn bản trên các hình ảnh hoá dữ liệu - núm vú

Bạn có thể đã nghe nói rằng " đặt nó ", mà không thể được truer khi nói đến thêm văn bản để hình dung dữ liệu. Văn bản bị đặt sai trái có thể dẫn đến hiểu sai về dữ liệu. Bạn nên thực hiện theo hai phương pháp hay nhất để đưa văn bản vào hình dung dữ liệu của bạn: Giữ toàn bộ văn bản theo chiều ngang. Nonhorizontal ...

Lựa chọn của người biên tập

GRE Câu hỏi mẫu: Hoàn thành văn bản - những con vú

GRE Câu hỏi mẫu: Hoàn thành văn bản - những con vú

Câu hỏi Hoàn thành văn bản trên GRE bao gồm một câu hoặc đoạn văn với một, hai hoặc ba không gian trống cho một từ hoặc từ bị thiếu. Công việc của bạn là chọn từ hoặc từ thích hợp nhất để điền vào chỗ trống trong câu. Đây là một số ví dụ để bạn thử. Mẫu ...

Làm thế nào để giải quyết vấn đề về toán học trên GRE - núm vú

Làm thế nào để giải quyết vấn đề về toán học trên GRE - núm vú

Khi bạn phải dịch một vấn đề từ vào toán học trên GRE, biết đâu để bắt đầu thường là thách thức khó khăn nhất. Điều quan trọng là bắt đầu với những gì bạn biết và làm việc theo những gì bạn không biết. Bạn có thể giải quyết hầu hết các vấn đề từ bằng cách tiếp cận theo từng bước: Đọc toàn bộ ...

Làm thế nào để Tối đa hóa điểm TOE GRE của bạn - núm vú

Làm thế nào để Tối đa hóa điểm TOE GRE của bạn - núm vú

Viết luận văn (và ghi điểm) trên GRE là chủ quan đến một mức độ nào. Không có câu trả lời đúng hay sai, và mỗi bài luận hơi khác nhau, dựa trên quan điểm, kiến ​​thức, kinh nghiệm, cách viết của người thử nghiệm, v.v ... Tuy nhiên, những người đánh giá, có một danh sách các tiêu chuẩn cụ thể để phân loại bài luận của bạn. Để thực hiện tốt, hãy chắc chắn làm ...

Lựa chọn của người biên tập

Chèn nội dung vào một slide PowerPoint trong Office 2011 for Mac - núm vú

Chèn nội dung vào một slide PowerPoint trong Office 2011 for Mac - núm vú

Ribbon trong PowerPoint 2011 cho Mac cho phép bạn thêm nội dung bằng các tùy chọn trên tab Trang chủ, trong nhóm Chèn. Mỗi lần bạn thêm một nội dung nào đó vào trang trình chiếu, nó được đặt trong một lớp trên đầu của tất cả các đối tượng hiện có trên trang trình bày. Chèn nội dung văn bản vào trang trình bày PowerPoint Nhấp vào tab Trang chủ của Ribbon và ...

Văn phòng 2011 dành cho Mac: Thêm đoạn nhạc vào bài trình chiếu PowerPoint - núm vú

Văn phòng 2011 dành cho Mac: Thêm đoạn nhạc vào bài trình chiếu PowerPoint - núm vú

Tăng cường PowerPoint 2011 của bạn cho Mac trình bày với các đoạn âm thanh. Sử dụng âm thanh và âm nhạc là một cách hay để thu hút khán giả của bạn. Trong PowerPoint 2011 dành cho Mac, bạn có thể chọn một trong hai cách để kích hoạt hộp thoại Insert Audio: Từ Media Browser: Sử dụng tab Audio và kéo từ trình duyệt sang PowerPoint. ...

Office 2011 dành cho Mac: Khởi động Đoạn hoặc Phim Tạp chí trên Các trang trình bày của PowerPoint - những đầu

Office 2011 dành cho Mac: Khởi động Đoạn hoặc Phim Tạp chí trên Các trang trình bày của PowerPoint - những đầu

Bao gồm cả phương tiện truyền thông trong trình tự hoạt hình của bạn là một ý tưởng tuyệt vời. Trong PowerPoint 2011 dành cho máy Mac, bạn không còn bị hạn chế khi xem phim trên đầu. Phim bây giờ hoạt động độc đáo trong lớp của riêng mình và có thể hoạt ảnh giống như bất kỳ đối tượng khác. Phim thậm chí có thể chồng chéo và theo dõi các đường dẫn chuyển động khi chúng chơi. Chỉ cần nhớ ...