Video: SchoolTV || Tập 15: Tết Là Để Về Nhà | Official 2025
Những người hàng xóm gần nhất là một thuật toán đơn giản được sử dụng rộng rãi trong phân tích tiên đoán để phân cụm dữ liệu bằng cách gán một mục vào một cụm bằng cách xác định những mục khác tương tự nhất. Một sử dụng điển hình của thuật toán Hàng xóm Gần nhất theo các bước sau:
-
Lấy ma trận tương tự từ các mục trong tập dữ liệu.
Ma trận này, được gọi là ma trận khoảng cách , sẽ giữ các giá trị tương tự cho mỗi và mọi mục trong tập dữ liệu. (Các giá trị này được trình bày chi tiết trong ví dụ tiếp theo.)
-
Với ma trận tại chỗ, so sánh mỗi mục trong tập dữ liệu với mọi mục khác và tính toán giá trị tương tự.
-
Sử dụng ma trận khoảng cách, kiểm tra từng mục để xem liệu khoảng cách với các hàng xóm của nó có thấp hơn giá trị mà bạn đã xác định hay không.
Giá trị này được gọi là ngưỡng .
-
Thuật toán đưa mỗi phần tử vào một nhóm riêng biệt, phân tích các mục và quyết định những mục nào tương tự và thêm các mục tương tự vào cùng một cụm.
-
Thuật toán dừng lại khi tất cả các mục đã được kiểm tra.
Xem xét, tập dữ liệu gồm tám vị trí địa lý nơi các cá nhân sinh sống. Mục đích là chia các cá nhân này thành các nhóm dựa trên vị trí địa lý của họ, được xác định bởi Hệ thống định vị toàn cầu.
Biểu đồ này cho thấy một tập dữ liệu đơn giản của dữ liệu địa lý của các cá nhân. Giả sử rằng tất cả các dữ liệu thu thập được về tám cá thể này đều được thu thập tại một thời điểm cụ thể.
GPS> 1> 25 | GPS 3 | 8 |
---|---|---|
4 | 4 | 5 |
8 | 5 | 7 |
5 | 6 | 6 |
4 | 7 | 1 |
2 | 8 | 4 |
9 | Như với K-means, bước đầu tiên là tính các giá trị tương tự cho mỗi cặp. Một cách để tính toán sự tương tự giữa hai hạng mục là xác định khoảng cách Euclide. Giá trị tương tự giữa hai điểm được tính như đã trình bày ở trên. | Tính tương tự giữa mục A và mục B = |
√ (f | a, 1 | - f |
b, 1 | ) | 2 |
+ (f > b
- f
b, n > 2 Đây là tính năng đầu tiên của mục A, f a, 2 là tính năng thứ hai của mục A và các giá trị tương ứng b đại diện cho các tính năng của Mục B. Biến n là số tính năng. Trong ví dụ này, n là 2. Ví dụ, sự tương tự giữa khoản 1 và khoản 2 được tính như sau: Tính tương tự giữa khoản 1 và khoản 2 = √ (2-2) 2 + (10-5) 2 = 59999