Video: Mạng nơ-ron nhân tạo - Neural Networks | Tự học machine learning cơ bản 2025
Ở cấp độ đồng thau, phân tích dữ liệu phân tích tiên đoán bao gồm hai giai đoạn: giai đoạn học tập và giai đoạn dự đoán. Giai đoạn học tập đòi hỏi phải đào tạo mô hình phân loại bằng cách chạy một tập dữ liệu đã được chỉ định thông qua bộ phân loại. Mục đích là để dạy mô hình của bạn để chiết xuất và khám phá các mối quan hệ và quy tắc ẩn - các quy tắc phân loại 999 từ dữ liệu lịch sử (đào tạo). Mô hình này thực hiện bằng cách sử dụng một thuật toán phân loại.
Bạn cũng có thể mua dữ liệu từ bên thứ ba cung cấp cho bạn thông tin về khách hàng của bạn ngoài sự quan tâm của họ đối với đồng hồ. Đó không phải là khó khăn như nó âm thanh; có những công ty có mô hình kinh doanh là để theo dõi khách hàng trực tuyến và thu thập và bán thông tin có giá trị về họ.
Hầu hết các công ty bên thứ ba thu thập dữ liệu từ các trang truyền thông xã hội và áp dụng các phương pháp khai thác dữ liệu để khám phá mối quan hệ giữa người dùng cá nhân với sản phẩm. Trong trường hợp này, là chủ cửa hàng đồng hồ, bạn sẽ quan tâm đến mối quan hệ giữa khách hàng và sự quan tâm của họ trong việc mua đồng hồ.
Bạn có thể suy luận loại thông tin này từ việc phân tích, ví dụ như một hồ sơ mạng xã hội của khách hàng, hoặc một nhận xét về blog nhỏ của loại mà bạn tìm thấy trên Twitter.
Để đo mức độ quan tâm đến đồng hồ của một cá nhân, bạn có thể áp dụng bất kỳ công cụ phân tích văn bản nào có thể khám phá các tương quan như vậy trong văn bản viết của một cá nhân (các trạng thái mạng xã hội, tweet, bài đăng trên blog và như vậy) hoặc hoạt động trực tuyến chẳng hạn như tương tác xã hội trực tuyến, tải ảnh lên và tìm kiếm).Sau khi bạn thu thập tất cả dữ liệu về các giao dịch trong quá khứ và các sở thích hiện tại của khách hàng - dữ liệu huấn luyện
cho thấy mô hình của bạn cần tìm kiếm gì - bạn cần tổ chức nó vào một cấu trúc tạo ra dễ truy cập và sử dụng (chẳng hạn như cơ sở dữ liệu).
Tại thời điểm này, bạn đã đạt đến giai đoạn phân loại dữ liệu thứ hai: giai đoạn dự báo, tất cả về kiểm tra mô hình của bạn và tính chính xác của các quy tắc phân loại mà nó đã tạo ra. Với mục đích đó, bạn cần thêm dữ liệu khách hàng lịch sử, được gọi là
dữ liệu thử nghiệm (khác với dữ liệu huấn luyện). Bạn cho dữ liệu thử nghiệm này vào mô hình của bạn và đo độ chính xác của các dự đoán kết quả. Bạn tính thời gian mà mô hình dự đoán chính xác hành vi tương lai của khách hàng được trình bày trong dữ liệu thử nghiệm của bạn. Bạn cũng đếm thời gian mà mô hình đã dự đoán sai. Tại thời điểm này, bạn chỉ có hai kết quả: Hoặc bạn hài lòng với tính chính xác của mô hình hoặc bạn không: Nếu bạn hài lòng, sau đó bạn có thể bắt đầu chuẩn bị cho mô hình dự đoán là một phần của hệ thống sản xuất.
Nếu bạn không hài lòng với dự đoán, khi đó bạn sẽ cần phải đào tạo lại mô hình của mình bằng tập dữ liệu đào tạo mới.
Nếu dữ liệu huấn luyện ban đầu của bạn không đủ tiêu chuẩn cho nhóm khách hàng của bạn - hoặc chứa dữ liệu ồn ào đã loại bỏ kết quả của mô hình bằng cách đưa ra các tín hiệu giả mạo - thì có nhiều việc phải làm để làm cho mô hình của bạn hoạt động. Hoặc là kết quả là hữu ích theo cách của mình.