Mục lục:
- Hình ảnh của bạn trông giống như âm mưu bên trái hình ảnh bên dưới.
- (địa phương làm mịn). Thông báo cũng nói rằng bạn có thể sử dụng phương pháp làm mịn thay thế.
Video: Bài giảng G4: Biểu đồ hộp (box plot) 2025
Sau dữ liệu, lập bản đồ và địa lý, phần tử thứ tư của một lớp ggplot2 trong R mô tả cách tổng hợp dữ liệu. Trong ggplot2, bạn tham khảo bản tóm tắt thống kê này dưới dạng stat.
Một tính năng rất tiện lợi của ggplot2 là phạm vi chức năng của nó để tóm tắt dữ liệu của bạn trong cốt truyện. Điều này có nghĩa là bạn thường không phải tóm tắt trước dữ liệu của mình. Chẳng hạn, chiều cao của các thanh trong biểu đồ cho thấy có bao nhiêu quan sát của một cái gì đó bạn có trong dữ liệu của mình. Tóm tắt thống kê cho điều này là đếm các quan sát. Các nhà thống kê xem tiến trình này là binning, và stat mặc định cho geom_bar () là stat_bin ().
Tương tự như cách mỗi geom có một stat mặc định liên quan, mỗi stat cũng có một geom mặc định.
Vì vậy, điều này làm nảy sinh câu hỏi: Bạn quyết định sử dụng geom hay stat như thế nào? Về lý thuyết nó không quan trọng cho dù bạn chọn geom hoặc stat trước. Tuy nhiên, trong thực tế, thường thì trực quan bắt đầu với một loại âm mưu đầu tiên - nói cách khác, chỉ định một geom. Nếu bạn muốn thêm một lớp tóm tắt thống kê khác, hãy sử dụng một stat.
Đếm số lần quan sát trong thùng rác
geom_bar ()
stat_smooth () | Tạo một đường thẳng trơn geom_line () | |
---|---|---|
stat_sum () | Thêm giá trị. | geom_point () |
stat_identity () | Không có tóm tắt. | geom_point () |
stat_boxplot () | Tóm tắt dữ liệu cho một hộp-và-râu âm mưu. | geom_boxplot () |
|
Bạn đã biết làm thế nào để sử dụng stat_bin () để tóm tắt dữ liệu của bạn vào trong thùng, bởi vì đây là stat mặc định của geom_bar (). Điều này có nghĩa là hai dòng mã sau đây tạo ra các mảng giống nhau: >> ggplot (trắc địa, aes (x = chiều sâu)) + geom_bar (binwidth = 50)> ggplot (trũng, aes (x = chiều sâu)) + stat_bin (binwid th = 50) | Dữ liệu làm mịn hơn |
Gói ggplot2 cũng giúp bạn tạo các dòng hồi quy thông qua dữ liệu rất dễ dàng. Bạn sử dụng hàm stat_smooth () để tạo kiểu đường này. | Điều thú vị về stat_smooth () là nó sử dụng hồi quy cục bộ theo mặc định. R có một số chức năng có thể thực hiện việc này, nhưng ggplot2 sử dụng hàm less () để hồi quy cục bộ. Điều này có nghĩa là nếu bạn muốn tạo ra một mô hình hồi quy tuyến tính, bạn phải nói với stat_smooth () để sử dụng một chức năng mượt mà hơn.Bạn làm điều này với đối số phương pháp. | Để minh hoạ việc sử dụng một cách êm hơn, hãy bắt đầu bằng cách tạo ra một bảng chia thất nghiệp trong tập dữ liệu về dài hạn: >> p p |
Hình ảnh của bạn trông giống như âm mưu bên trái hình ảnh bên dưới.
Đôi khi, ggplot2 tạo ra các thông báo với các mẹo và thông tin bổ sung. Miễn là bạn không thấy cảnh báo hoặc lỗi, bạn có thể bỏ qua những thông báo này một cách an toàn. Trong trường hợp này, stat_smooth () cho bạn biết rằng mặc định mượt mà hơn là một phương pháp gọi là
less
(địa phương làm mịn). Thông báo cũng nói rằng bạn có thể sử dụng phương pháp làm mịn thay thế.
Cuối cùng, sử dụng stat_smooth () để phù hợp và vẽ một mô hình hồi quy tuyến tính. Bạn làm điều này bằng cách thêm các phương pháp đối số = "lm": >> p + stat_smooth (method = "lm")
Hình ảnh của bạn bây giờ trông giống như âm mưu bên phải.
stat_smooth (). "
Không làm gì với nhận dạng
Đôi khi bạn không muốn ggplot2 tóm tắt dữ liệu của bạn trong cốt truyện.Điều này thường xảy ra khi dữ liệu của bạn là đã được tổng kết trước hoặc khi mỗi dòng của khung dữ liệu của bạn phải được vẽ riêng biệt Trong những trường hợp này, bạn muốn nói với ggplot2 để làm gì cả, và stat để làm điều này là stat_identity () Bạn có thể nhận thấy rằng stat_identity là thống kê mặc định cho điểm và đường thẳng.