Mục lục:
Video: Sử dụng Consolidate trong Excel để tổng hợp lương 2025
Bạn sử dụng tapply () để tạo các bảng tổng kết dữ liệu trong R. Với tapply (), bạn có thể dễ dàng tóm tắt các phân nhóm con trong dữ liệu. Hàm này có ba đối số:
-
X : Một vector
-
INDEX : Một yếu tố hoặc danh sách các yếu tố
-
FUN : Ví dụ: tính độ dài khoảng cách trung bình trong dải số liệu:
áp dụng (iris $ Sepal Chiều, iris $ Loài, ý nghĩa) setosa versicolor virginica 5. 006 5. 936 6. 588
Với điều này ngắn dòng mã, bạn làm một số công cụ mạnh mẽ. Bạn nói với R để lấy Sepal. Chiều dài cột, phân chia theo các Loài, và sau đó tính trung bình cho mỗi nhóm.
Tất nhiên, sử dụng hàm z (), bạn có thể viết dòng mã của bạn bằng một cách dễ đọc hơn: >> với (iris, tapply (Sepal. Length, Species, mean)) setosa versicolor virginica 5 006 5. 936 6. 588
Sử dụng tapply (), bạn cũng có thể tạo các bảng phức tạp hơn để tóm tắt dữ liệu của bạn. Bạn thực hiện việc này bằng cách sử dụng danh sách làm đối số INDEX của mình.
Ví dụ: hãy thử tóm tắt mtcars khung dữ liệu, khung dữ liệu được xây dựng với dữ liệu về động cơ xe ô tô và hiệu suất. Cũng như bất kỳ đối tượng nào, bạn có thể sử dụng str () để kiểm tra cấu trúc của nó:
str (mtcars)Biến số am là một vector số chỉ ra động cơ có tự động (0) hay bằng tay (1) hộp số. Bởi vì đây không phải là mô tả, hãy bắt đầu bằng cách tạo một đối tượng mới, xe ô tô, đó là bản sao của mtcars và thay đổi cột là một yếu tố:
ô tô <- bên trong (mtcars, + am <- factor (am, levels = 0: 1, labels = c ("tự động", "Hướng dẫn sử dụng")) +) Bây giờ sử dụng tapply () để tìm dặm bình mỗi gallon (mpg) đối với từng loại hộp số: >> với (xe hơi, tapply (mpg, đang, có nghĩa)) tự động bằng tay 17. 14.737 24. 39.231Yes, bạn hoàn toàn đúng. Đây chỉ là một bảng một chiều. Bây giờ, cố gắng tạo một bảng hai chiều với loại hộp số (am) và số bánh răng (bánh răng):
với (ô tô, áp dụng (mpg, danh sách (bánh răng, am), có nghĩa là) 3 16. 10667 NA 4 21. 05000 26. 275 5 NA 21. 380Bạn sử dụng tapply () để tạo tóm tắt dữ liệu. Đây là một chút tương tự như bảng () chức năng. Tuy nhiên, bảng () chỉ có thể tạo ra các bảng dự phòng (có nghĩa là các bảng đếm), trong khi với tapply () bạn có thể chỉ định bất kỳ hàm nào như là hàm tổng hợp.Nói cách khác, với tapply (), bạn có thể đếm số, phương tiện, hay bất kỳ giá trị nào khác.Nếu bạn muốn tóm tắt số liệu thống kê trên một vector, tapply () rất hữu ích và nhanh chóng sử dụng.
Cách sử dụng aggregate ()Một hàm R khác làm một điều rất giống nhau là tổng hợp (): >> với (xe, tổng hợp (mpg, danh sách (gear = gear, am = am), có ý nghĩa)) gear am x 1 3 Tự động 16. 10667 2 4 Tự động 21. 05000 3 4 Hướng dẫn sử dụng 26. 27500 4 5 Hướng dẫn sử dụng 21. 38000
Tiếp theo bạn đưa tổng hợp () sang các cao mới sử dụng giao diện công thức.