Video: SCP-093 Red Sea Object | euclid | portal / extradimensional scp 2025
Máy vector hỗ trợ (SVM) là thuật toán phân loại dữ liệu phân tích tiên đoán phân bổ mới các yếu tố dữ liệu vào một trong những danh mục được dán nhãn. Trong hầu hết các trường hợp, SVM là một bộ phân loại nhị phân ; nó giả định rằng dữ liệu được đề cập có hai giá trị mục tiêu có thể có.
Một phiên bản khác của thuật toán SVM, multiclass SVM, bổ sung SVM để được sử dụng làm trình phân loại trên tập dữ liệu có nhiều hơn một lớp (nhóm hoặc loại). SVM đã được sử dụng thành công trong nhiều ứng dụng như nhận diện hình ảnh, chẩn đoán y tế và phân tích văn bản.
Giả sử bạn đang thiết kế một mô hình phân tích tiên đoán sẽ tự động nhận ra và dự đoán tên của một đối tượng trong một bức tranh. Đây thực sự là vấn đề nhận diện hình ảnh - hoặc cụ thể hơn là nhận diện khuôn mặt: Bạn muốn trình phân loại nhận dạng tên của một người trong bức ảnh. Vâng, trước khi giải quyết mức độ phức tạp đó, hãy xem xét một phiên bản đơn giản hơn của cùng một vấn đề: Giả sử bạn có hình ảnh của từng miếng trái cây và bạn muốn người phân loại của bạn dự đoán những loại quả nào xuất hiện trong bức tranh. Giả sử bạn chỉ có hai loại trái cây: quả táo và quả lê, mỗi quả một.
Giả sử bạn có 200 bức ảnh của những quả táo khác nhau, và 200 quả lê. Bước học tập bao gồm việc đưa những hình ảnh đó cho người phân loại để nó biết được quả táo trông như thế nào và hình quả lê trông như thế nào. Trước khi bước vào bước đầu tiên này, bạn cần phải chuyển đổi từng ảnh thành một ma trận dữ liệu, sử dụng gói phần mềm R (nói).
Như bạn có thể tưởng tượng, đại diện cho một hình ảnh như một ma trận các con số không phải là một nhiệm vụ đơn giản. Một khu vực nghiên cứu hoàn toàn khác biệt dành cho việc thể hiện hình ảnh.
Sau đây cho thấy cách một máy vector hỗ trợ có thể dự đoán lớp của quả (ghi nhãn toán học như
quả táo hoặc quả lê ), dựa trên những gì thuật toán đã học được trong quá khứ. Giả sử bạn đã chuyển đổi tất cả các hình ảnh thành ma trận dữ liệu. Sau đó, máy vector hỗ trợ có hai đầu vào chính:
Dữ liệu trước (đào tạo): Bộ ma trận này tương ứng với hình ảnh trước đây của quả táo và quả lê.
-
Dữ liệu mới (không nhìn thấy) bao gồm một hình ảnh chuyển đổi thành ma trận. Mục đích là dự đoán tự động những gì trong bức tranh - quả táo hoặc quả lê.
-
Vòng hỗ trợ sử dụng hàm toán học, thường được gọi là hàm
hạt nhân là một chức năng toán học khớp với dữ liệu mới với hình ảnh tốt nhất từ dữ liệu huấn luyện để dự đoán nhãn của ảnh không rõ (táo hay lê). So với các phân loại khác, các máy vector hỗ trợ tạo ra các dự đoán chính xác, mạnh mẽ, ít bị ảnh hưởng bởi dữ liệu ồn ào và ít bị ảnh hưởng. Tuy nhiên, lưu ý rằng các máy vector hỗ trợ thích hợp nhất để phân loại nhị phân - khi bạn chỉ có hai loại (như táo hoặc lê).