Video: Cách xóa công thức chỉ để lại giá trị trong Excel 2025
Một ứng dụng rất hữu ích của việc chia nhỏ dữ liệu là tìm và loại bỏ các giá trị trùng lặp. R có một chức năng hữu ích, duplicated (), tìm các giá trị trùng lặp và trả về một vector logic cho biết giá trị cụ thể có trùng lặp với giá trị trước hay không. Điều này có nghĩa là đối với các giá trị nhân bản, sao chép () trả về FALSE cho lần xuất hiện đầu tiên và TRUE cho mỗi lần xảy ra sau đó của giá trị đó, như trong ví dụ sau:
Nếu bạn cố gắng này trên một khung dữ liệu, R tự động kiểm tra các quan sát (có nghĩa, nó xử lý mỗi hàng là một giá trị). Ví dụ: với khung dữ liệu iris:duplicated (iris) [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE [10] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE … [136] FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE [145] FALSE FALSE FALSE FALSE FALSE FALSE
Nếu bạn cẩn thận, bạn nhận thấy rằng hàng 143 là một bản sao (vì phần tử 143 của kết quả của bạn có giá trị TRUE). Bạn cũng có thể cho biết điều này bằng cách sử dụng đó () chức năng:
Chỉ định một vector logic, trong đó
FALSE-
có nghĩa là phần tử đó sẽ bị loại trừ. ! (dấu chấm than) là một sự phủ định hợp lý. Điều này có nghĩa là nó chuyển đổi TRUE thành FALSE và ngược lại. Vì vậy, để loại bỏ các bản sao từ iris, bạn làm như sau:
Nói cách khác: -
