Video: 10 dấu hiệu nhận biết nhà bạn có ma và cách trừ 2025
Chức năng cor () trong R có thể giải quyết các giá trị dữ liệu bị mất theo nhiều cách. Đối với điều đó, bạn thiết lập các đối số sử dụng để một trong những giá trị văn bản có thể. Giá trị cho đối số sử dụng đặc biệt quan trọng nếu bạn tính toán các tương quan của các biến trong một khung dữ liệu. Bằng cách thiết lập đối số này với các giá trị khác nhau, bạn có thể
-
Sử dụng tất cả các quan sát bằng cách đặt use = 'everything' . Điều này có nghĩa là nếu có một giá trị NA trong một trong các biến, mối tương quan kết quả cũng là NA. Đây là mặc định.
-
Loại trừ tất cả các quan sát có NA cho ít nhất một biến số. Đối với điều này, bạn đặt use = 'complete. obs '. Lưu ý rằng điều này có thể để lại cho bạn chỉ với một vài quan sát nếu các giá trị bị thiếu được truyền qua bộ dữ liệu hoàn chỉnh.
-
Loại trừ quan sát với NA giá trị cho mỗi cặp biến bạn kiểm tra. Cho điều đó, bạn đặt tham số use = 'pairwise'. Điều này đảm bảo rằng bạn có thể tính toán tương quan cho mỗi cặp biến mà không làm mất thông tin vì thiếu các giá trị trong các biến khác.
Trong thực tế, bạn có thể tính toán các biện pháp tương quan khác nhau. Theo mặc định, R tính toán các hệ số tương quan chuẩn Pearson. Đối với dữ liệu không phải là phân phối bình thường, bạn có thể sử dụng hàm cor () để tính toán mối tương quan bậc Spearman hoặc tau của Kendall. Đối với điều này, bạn phải thiết lập các đối số phương pháp đến giá trị thích hợp.