Mục lục:
- Học viên giám sát
- xảy ra khi bạn trình bày các thuật toán với các ví dụ thiếu nhãn, như trong học tập không giám sát. Tuy nhiên, bạn có thể đi kèm với một ví dụ với phản hồi tích cực hoặc tiêu cực theo giải pháp mà thuật toán đề xuất.Học tập nâng cao được kết nối với các ứng dụng mà thuật toán phải đưa ra quyết định (vì vậy sản phẩm mang tính quy định, không chỉ mô tả, như trong học tập không theo giám sát) và các quyết định mang lại hậu quả. Trong thế giới con người, nó giống như học hỏi bằng cách dùng thử và sai lầm.
Video: Dạy Bé Học Các Loại Phương Tiện Giao Thông Máy Bay, Xe Bê Tông, Xe Máy Xúc - Dạy Bé Nhanh Biết Nói 2025
Học viên giám sát
- Học tập không giám sát
- Học tập nâng cao
- Học cách giám sát
Học viên giám sát
xảy ra khi một thuật toán học từ ví dụ dữ liệu và các phản hồi mục tiêu liên quan có thể bao gồm các giá trị số hoặc nhãn chuỗi, chẳng hạn như các lớp hoặc thẻ, để dự đoán phản hồi chính xác khi đặt ra với các ví dụ mới. Cách tiếp cận có giám sát thực sự giống với việc học của con người dưới sự giám sát của giáo viên. Giáo viên cung cấp các ví dụ tốt cho học sinh để ghi nhớ, và học sinh sau đó rút ra các quy tắc chung từ những ví dụ cụ thể này.
Học tập không giám sát
xảy ra khi một thuật toán học được từ các ví dụ đơn giản mà không có bất kỳ phản ứng liên quan, để lại cho thuật toán để xác định các mẫu dữ liệu riêng của mình. Kiểu thuật toán này có xu hướng tái cấu trúc dữ liệu vào một cái gì đó khác, chẳng hạn như các tính năng mới có thể đại diện cho một lớp hoặc một loạt các giá trị không tương quan. Chúng rất hữu ích trong việc cung cấp cho con người những hiểu biết sâu sắc về ý nghĩa của dữ liệu và những đầu vào hữu ích mới cho các thuật toán học máy có giám sát.
Là một loại học tập, nó giống với các phương pháp mà con người sử dụng để tìm ra rằng các đối tượng hoặc sự kiện nhất định là từ cùng một lớp, chẳng hạn như bằng cách quan sát mức độ tương đồng giữa các đối tượng. Một số hệ thống khuyến nghị mà bạn tìm thấy trên web dưới hình thức tự động hóa tiếp thị được dựa trên loại hình học tập này.
Thuật toán tự động tiếp thị đưa ra các gợi ý từ những gì bạn đã mua trong quá khứ. Các đề xuất dựa trên ước tính nhóm khách hàng nào bạn giống nhất và sau đó suy ra sở thích của bạn dựa trên nhóm đó.Học tập nâng cao
Học tập nâng cao
xảy ra khi bạn trình bày các thuật toán với các ví dụ thiếu nhãn, như trong học tập không giám sát. Tuy nhiên, bạn có thể đi kèm với một ví dụ với phản hồi tích cực hoặc tiêu cực theo giải pháp mà thuật toán đề xuất.Học tập nâng cao được kết nối với các ứng dụng mà thuật toán phải đưa ra quyết định (vì vậy sản phẩm mang tính quy định, không chỉ mô tả, như trong học tập không theo giám sát) và các quyết định mang lại hậu quả. Trong thế giới con người, nó giống như học hỏi bằng cách dùng thử và sai lầm.
Lỗi giúp bạn tìm hiểu vì họ bị phạt thêm (chi phí, mất thời gian, hối tiếc, đau đớn, vân vân), dạy bạn rằng một hành động nhất định ít thành công hơn người khác. Một ví dụ thú vị về học tập củng cố xảy ra khi các máy tính tự học chơi game. Trong trường hợp này, một ứng dụng trình bày các thuật toán với các ví dụ của các tình huống cụ thể, chẳng hạn như có các game thủ mắc kẹt trong một mê cung trong khi tránh một kẻ thù. Ứng dụng cho phép thuật toán biết được kết quả của hành động cần thiết, và học tập xảy ra trong khi cố gắng để tránh những gì nó phát hiện ra là nguy hiểm và theo đuổi sự sống còn. Bạn có thể xem cách công ty Google DeepMind đã tạo ra một chương trình học tập củng cố chơi các trò chơi điện tử cũ của Atari. Khi xem video, hãy thông báo chương trình ban đầu là vụng về và không có tay nghề nhưng dần dần cải thiện với việc đào tạo cho đến khi nó trở thành một nhà vô địch.