Video: Lọc dữ liệu trùng nhau, không trùng nhau giữa 2 sheet 2025
Một ứng dụng hữu ích khác của việc làm subsetting các khung dữ liệu là tìm và xóa các hàng có dữ liệu bị mất. Chức năng R để kiểm tra cho điều này là hoàn tất. các trường hợp(). Bạn có thể thử tính năng này trên bộ dữ liệu tích hợp sẵn, khung dữ liệu với số lượng dữ liệu bị thiếu: >> str (airquality)> đầy đủ. trường hợp (tính chất không khí)
Kết quả hoàn thành. trường hợp () là một vector logic có giá trị TRUE cho các hàng đã hoàn thành, và FALSE cho hàng có một số giá trị NA. Để loại bỏ các hàng có dữ liệu bị thiếu từ tính không khí, hãy thử những điều sau:
Như mọi khi với R, có nhiều cách để đạt được mục đích của bạn. Trong trường hợp này, bạn có thể sử dụng na. bỏ qua () để bỏ qua tất cả các hàng có chứa các giá trị NA: >> x <- na. bỏ qua (airquality)
Khi bạn chắc chắn rằng dữ liệu của bạn sạch sẽ, bạn có thể bắt đầu phân tích nó bằng cách thêm lĩnh vực tính.
Nếu bạn sử dụng bất kỳ phương pháp nào trong số những phương pháp này để chia nhỏ dữ liệu của bạn hoặc xóa các giá trị còn thiếu, hãy lưu trữ kết quả trong một đối tượng mới. R không thay đổi bất cứ thứ gì trong khung dữ liệu ban đầu trừ khi bạn ghi đè nó một cách rõ ràng. Đó là một điều tốt, bởi vì bạn không thể tình cờ lộn xộn dữ liệu của bạn.
