Trang Chủ Tài chính Cá nhân Làm thế nào để Suss Stats trong ggplot2 trong R - núm vú

Làm thế nào để Suss Stats trong ggplot2 trong R - núm vú

Mục lục:

Video: Bài giảng G4: Biểu đồ hộp (box plot) 2025

Video: Bài giảng G4: Biểu đồ hộp (box plot) 2025
Anonim

Sau dữ liệu, lập bản đồ và địa lý, phần tử thứ tư của một lớp ggplot2 trong R mô tả cách tổng hợp dữ liệu. Trong ggplot2, bạn tham khảo bản tóm tắt thống kê này dưới dạng stat.

Một tính năng rất tiện lợi của ggplot2 là phạm vi chức năng của nó để tóm tắt dữ liệu của bạn trong cốt truyện. Điều này có nghĩa là bạn thường không phải tóm tắt trước dữ liệu của mình. Chẳng hạn, chiều cao của các thanh trong biểu đồ cho thấy có bao nhiêu quan sát của một cái gì đó bạn có trong dữ liệu của mình. Tóm tắt thống kê cho điều này là đếm các quan sát. Các nhà thống kê xem tiến trình này là binning, và stat mặc định cho geom_bar () là stat_bin ().

Tương tự như cách mỗi geom có ​​một stat mặc định liên quan, mỗi stat cũng có một geom mặc định.

Vì vậy, điều này làm nảy sinh câu hỏi: Bạn quyết định sử dụng geom hay stat như thế nào? Về lý thuyết nó không quan trọng cho dù bạn chọn geom hoặc stat trước. Tuy nhiên, trong thực tế, thường thì trực quan bắt đầu với một loại âm mưu đầu tiên - nói cách khác, chỉ định một geom. Nếu bạn muốn thêm một lớp tóm tắt thống kê khác, hãy sử dụng một stat.

geom_bar (). Trong sơ đồ này, bạn đã sử dụng cùng một dữ liệu để tạo ra một scatterplot với geom_point (), và sau đó bạn thêm một dòng trơn với stat_smooth (

stat_bin ()

Đếm số lần quan sát trong thùng rác

geom_bar ()

stat_smooth () Tạo một đường thẳng trơn geom_line ()
stat_sum () Thêm giá trị. geom_point ()
stat_identity () Không có tóm tắt. geom_point ()
stat_boxplot () Tóm tắt dữ liệu cho một hộp-và-râu âm mưu. geom_boxplot ()
> Dữ liệu Binning
Bạn đã biết làm thế nào để sử dụng stat_bin () để tóm tắt dữ liệu của bạn vào trong thùng, bởi vì đây là stat mặc định của geom_bar (). Điều này có nghĩa là hai dòng mã sau đây tạo ra các mảng giống nhau: >> ggplot (trắc địa, aes (x = chiều sâu)) + geom_bar (binwidth = 50)> ggplot (trũng, aes (x = chiều sâu)) + stat_bin (binwid th = 50) Dữ liệu làm mịn hơn
Gói ggplot2 cũng giúp bạn tạo các dòng hồi quy thông qua dữ liệu rất dễ dàng. Bạn sử dụng hàm stat_smooth () để tạo kiểu đường này. Điều thú vị về stat_smooth () là nó sử dụng hồi quy cục bộ theo mặc định. R có một số chức năng có thể thực hiện việc này, nhưng ggplot2 sử dụng hàm less () để hồi quy cục bộ. Điều này có nghĩa là nếu bạn muốn tạo ra một mô hình hồi quy tuyến tính, bạn phải nói với stat_smooth () để sử dụng một chức năng mượt mà hơn.Bạn làm điều này với đối số phương pháp. Để minh hoạ việc sử dụng một cách êm hơn, hãy bắt đầu bằng cách tạo ra một bảng chia thất nghiệp trong tập dữ liệu về dài hạn: >> p p
Tiếp theo, thêm một mượt mà hơn. Điều này đơn giản bằng cách thêm stat_smooth () vào dòng mã của bạn. >> p + stat_smooth ()

Hình ảnh của bạn trông giống như âm mưu bên trái hình ảnh bên dưới.

Đôi khi, ggplot2 tạo ra các thông báo với các mẹo và thông tin bổ sung. Miễn là bạn không thấy cảnh báo hoặc lỗi, bạn có thể bỏ qua những thông báo này một cách an toàn. Trong trường hợp này, stat_smooth () cho bạn biết rằng mặc định mượt mà hơn là một phương pháp gọi là

less

(địa phương làm mịn). Thông báo cũng nói rằng bạn có thể sử dụng phương pháp làm mịn thay thế.

Cuối cùng, sử dụng stat_smooth () để phù hợp và vẽ một mô hình hồi quy tuyến tính. Bạn làm điều này bằng cách thêm các phương pháp đối số = "lm": >> p + stat_smooth (method = "lm")

Hình ảnh của bạn bây giờ trông giống như âm mưu bên phải.

stat_smooth (). "

Không làm gì với nhận dạng

Đôi khi bạn không muốn ggplot2 tóm tắt dữ liệu của bạn trong cốt truyện.Điều này thường xảy ra khi dữ liệu của bạn là đã được tổng kết trước hoặc khi mỗi dòng của khung dữ liệu của bạn phải được vẽ riêng biệt Trong những trường hợp này, bạn muốn nói với ggplot2 để làm gì cả, và stat để làm điều này là stat_identity () Bạn có thể nhận thấy rằng stat_identity là thống kê mặc định cho điểm và đường thẳng.

Làm thế nào để Suss Stats trong ggplot2 trong R - núm vú

Lựa chọn của người biên tập

ĐịNh dạng Kiểm thử GED trên máy vi tính và các kỹ năng bắt buộc

ĐịNh dạng Kiểm thử GED trên máy vi tính và các kỹ năng bắt buộc

Thử GED được thực hiện trên máy vi tính. Điều đó có nghĩa là bạn cần phải quen thuộc với một máy tính, bàn phím và chuột. Nếu trước đây bạn chưa thử nghiệm trên máy tính, đây là một số điểm khác biệt bạn nên biết: Kỹ năng đánh máy là một tài sản. Bạn không phải là người đánh máy cảm ứng ...

Khi Không Có Thông tin để Trả lời Câu hỏi GED - những núm vú

Khi Không Có Thông tin để Trả lời Câu hỏi GED - những núm vú

Một số câu hỏi về GED kiểm tra có thể không cung cấp cho bạn đủ thông tin để tìm câu trả lời đúng. Ví dụ, một câu hỏi có thể yêu cầu một kết luận mà bạn không thể làm từ các thông tin được đưa ra. Ngay cả khi bạn biết một số thông tin có thể giúp bạn giải quyết vấn đề, đừng sử dụng nó. Khi bạn lấy GED, ...

Việc phải làm Ngay trước khi Bạn Lấy GED - núm vú

Việc phải làm Ngay trước khi Bạn Lấy GED - núm vú

Làm tốt bài kiểm tra GED nhiều hơn đi vào vị trí kiểm tra và trả lời các câu hỏi. Bạn cần phải chuẩn bị cho những thách thức trong các bài kiểm tra. Để đảm bảo rằng bạn đã sẵn sàng để giải quyết bài kiểm tra đầu vào, hãy chắc chắn rằng bạn làm những điều sau đây dẫn đến kiểm tra: Đủ ngủ. Đó là sự thật ...

Lựa chọn của người biên tập

Máy tính Độ phân giải Màn hình - núm vú

Máy tính Độ phân giải Màn hình - núm vú

Như máy ảnh kỹ thuật số, màn hình máy tính (và các thiết bị hiển thị khác) tạo mọi thứ bạn thấy trên màn hình pixels. Bạn thường có thể chọn từ một số cài đặt màn hình, mỗi kết quả đều có một số điểm ảnh màn hình khác nhau. Đây là các cài đặt chuẩn: 800 x 600 pixel 1024 x 768 pixel 1280 x 1024 pixel 1600 x ...

Ghi Các tùy chọn cho máy ảnh SLR kỹ thuật số của bạn - núm vú

Ghi Các tùy chọn cho máy ảnh SLR kỹ thuật số của bạn - núm vú

Các cài đặt cơ bản của máy ảnh dSLR và chỉnh sửa phim chụp SLR kỹ thuật số và lưu ảnh và phim, cũng như các tùy chọn liên quan đến ảnh và tiếp xúc khác. Thanh cuộn ở phía bên phải của hệ thống menu cho bạn biết bạn đang ở đâu - lên hoặc xuống - khi bạn xem xét các lựa chọn riêng lẻ trong ...

Máy tính Độ phân giải máy in - độ dày

Máy tính Độ phân giải máy in - độ dày

Độ Phân giải máy in được đo bằng các chấm trên mỗi inch (dpi). Hình ảnh được in được tạo thành bởi các chấm nhỏ màu sắc, và có bao nhiêu dpi mà máy in có thể sản xuất xác định độ phân giải của máy in. Độ phân giải càng cao, điểm chấm nhỏ hơn và hình ảnh in càng tốt. Nhưng các máy in khác nhau sử dụng các công nghệ in khác nhau, một số trong đó ...

Lựa chọn của người biên tập

Nhân chủng học Các chủ đề để nghiên cứu cho bài kiểm tra tương tự Miller (MAT) - những con voi

Nhân chủng học Các chủ đề để nghiên cứu cho bài kiểm tra tương tự Miller (MAT) - những con voi

Nhân chủng học là nghiên cứu về con người và hành vi của chúng. Để nghiên cứu nhân chủng học cho bài kiểm tra Miller Analogies (MAT), bạn sẽ cần phải tập trung vào các thuật ngữ và các con số quan trọng được liệt kê ở đây. Nếu bạn từng tự hỏi tại sao mọi người hành động theo cách họ làm, bạn có thể thấy nhân học hấp dẫn. Các thuật ngữ nhân học xuất hiện trên bài kiểm tra MAT ...

Các chủ đề kiến ​​trúc cho Nghiên cứu Thử nghiệm Tương tự Miller (MAT) - núm vú

Các chủ đề kiến ​​trúc cho Nghiên cứu Thử nghiệm Tương tự Miller (MAT) - núm vú

Cho Thử nghiệm Tương tự Miller, bạn nên làm quen với các ví dụ nổi tiếng về kiến ​​trúc - như Đấu trường La Mã La Mã. Trên sàn MAT, kiến ​​trúc không phải là lớn như một loại hình nghệ thuật, do đó bao phủ các căn cứ có thể được một chút dễ dàng hơn. Các danh sách dưới đây sẽ làm quen với các kiến ​​trúc sư và kiến ​​trúc sư quan trọng nhất trong lịch sử của bạn và