Video: Sao chép & di chuyển dữ liệu sang thẻ SD 2025
Nếu bạn có dataset lỏng (một tập dữ liệu dài), bạn đã sẵn sàng thay đổi hình dạng đó bằng R. Để minh họa rằng quá trình định hình lại giữ nguyên dữ liệu của bạn, hãy thử tái tạo lại bản gốc: >> dcast (mgoals, Venue + Game ~ variable, sum) Nơi chơi Granny Geraldine Gertrude 1 1st Bruges 12 5 11 2 2nd Ghent 4 4 5 3 3 Ghent 5 2 6 4 Bruges 4 6 4 7
Bạn có thể thấy cách dcast () lấy một công thức làm đối số thứ hai của nó? Thêm thông tin về điều đó trong một phút, nhưng trước tiên hãy kiểm tra kết quả của bạn. Nó phải khớp với khung dữ liệu gốc.
Bạn sử dụng chức năng dcast () để đúc một khung dữ liệu nóng chảy. Để rõ ràng, bạn sử dụng tính năng này để chuyển đổi từ định dạng dài sang định dạng rộng, nhưng bạn cũng có thể sử dụng nó để tổng hợp thành các định dạng trung gian, tương tự như cách mà một bảng trụ làm việc.
Chức năng dcast () mất ba đối số:
-
: Khung dữ liệu nóng chảy. công thức
-
: Công thức chỉ định cách bạn muốn truyền dữ liệu. Công thức này có dạng x_variable ~ y_variable. Nhưng nó được đơn giản hóa nó để làm cho một điểm. Bạn có thể sử dụng nhiều x -biến, nhiều y -biến và thậm chí z -biến. vui vẻ. aggregate
-
: Một hàm để sử dụng nếu công thức đúc kết quả trong tập hợp dữ liệu (ví dụ chiều dài (), sum (), hoặc mean ().
Nếu bạn muốn lấy một bảng với địa điểm chạy xuống các hàng và người chơi trên các cột, công thức đúc của bạn nên được Địa điểm ~ biến: >> dcast (mgoals, Venue ~ biến, tổng hợp) Địa điểm Granny Geraldine Gertrude 1 Bruges 18 9 18 2 Ghent 9 6 11
Có thể có các công thức đúc phức tạp hơn. Theo trang trợ giúp cho dcast (), công thức đúc có dạng này:
x_variable + x_2 ~ y_variable + y_2 ~ z_variable ~ …
Lưu ý rằng bạn có thể kết hợp nhiều biến trong mỗi chiều với dấu cộng (+), và bạn tách từng chiều với dấu ngã (~). Ngoài ra, nếu bạn có hai hay nhiều dấu ngã trong công thức (nghĩa là, bạn bao gồm một
z
-biến), kết quả của bạn sẽ là mảng đa chiều.
Vì vậy, để có được một bản tóm tắt các mục tiêu theo Địa điểm, người chơi (biến thể), và trò chơi, bạn làm như sau: >> dcast (mgoals, Venue + variable ~ Game, tổng hợp) Địa điểm biến 1st 2nd 3rd 4th 1 Bruges Granny 12 0 0 6 2 Bruges Geraldine 5 0 0 4 3 Bruges Gertrude 11 0 0 7 4 Ghent Granny 0 4 5 0 5 Ghent Geraldine 0 4 2 0 6 Ghent Gertrude 0 5 6 0 Một trong những lý do bạn nên hiểu dữ liệu ở định dạng dài là cả hai gói đồ họa lattice và ggplot2 sử dụng rộng rãi các dữ liệu định dạng dài.Lợi ích là bạn có thể dễ dàng tạo ra các mảnh dữ liệu của bạn để so sánh các phân nhóm khác nhau.
thư viện (ggplot2)> ggplot (mgoals, aes (x = biến, y = giá trị, fill = trò chơi)) + geom_bar ()