Video: Tổng hợp dữ liệu từ nhiều file excel vào 1 file không cần mở file 2025
Bạn có thể muốn kết hợp dữ liệu từ các nguồn khác nhau trong phân tích của mình. Nói chung, bạn có thể sử dụng R để kết hợp các bộ dữ liệu khác nhau theo ba cách:
-
Bằng cách thêm các cột: Nếu hai bộ dữ liệu có một tập các dãy bằng nhau, và thứ tự các hàng giống nhau, thêm cột có ý nghĩa. Tùy chọn của bạn để làm điều này là dữ liệu. khung hoặc cbind ().
-
Bằng cách thêm các hàng: Nếu cả hai bộ dữ liệu có các cột giống nhau và bạn muốn thêm hàng vào cuối, hãy sử dụng rbind ().
-
Bằng cách kết hợp dữ liệu với các hình dạng khác nhau: Hàm merge () kết hợp dữ liệu dựa trên các cột phổ biến, cũng như các hàng thông dụng. Trong ngôn ngữ cơ sở dữ liệu, điều này thường được gọi là tham gia dữ liệu.
Bạn sử dụng hợp nhất () để tìm giao lộ, cũng như công đoàn của các bộ dữ liệu khác nhau. Bạn cũng xem xét các cách làm việc khác với bảng tra cứu, sử dụng các hàm match () và% in%.
Đôi khi bạn muốn kết hợp dữ liệu, nơi không đơn giản chỉ cần thêm các cột hoặc hàng. Có thể là bạn muốn kết hợp dữ liệu dựa trên các giá trị của các khóa đã tồn tại trong dữ liệu. Đây là nơi hợp nhất () chức năng là hữu ích. Bạn có thể sử dụng hợp nhất () để kết hợp dữ liệu chỉ khi điều kiện kết hợp nhất định được đáp ứng.
Nói ví dụ, bạn có thông tin về các quốc gia ở một quốc gia. Nếu một bộ dữ liệu chứa thông tin về dân số và một thông tin khác có chứa thông tin về các vùng và cả hai đều có thông tin về tên trạng thái, bạn có thể sử dụng hợp nhất () để kết hợp các kết quả của mình.