Mục lục:
- Làm thế nào để tính toán dải dữ liệu trong R
- Phạm vi vẫn cho bạn thông tin hạn chế. Thông thường các nhà thống kê báo cáo phần trăm thứ nhất và thứ ba
- quantile (cars $ mpg, probs = c (0, 05, 0.95) ) 5% 95% 11. 995 31. 300
Video: Cách thực hiện thống kê mô tả cùng phần mềm thống kê R [Thống kê căn bản] 2025
Một số duy nhất không cho bạn biết nhiều về dữ liệu của bạn. Thường thì điều quan trọng là phải biết sự lây lan của dữ liệu của bạn. Bạn có thể sử dụng R để xem xét sự lây lan này bằng cách sử dụng một số cách tiếp cận khác nhau.
Trước tiên, bạn có thể tính toán độ lệch hoặc độ lệch chuẩn để tóm tắt sự lây lan trong một số duy nhất. Vì vậy, bạn có các chức năng thuận tiện var () cho phương sai và sd () cho độ lệch tiêu chuẩn. Ví dụ: bạn tính độ lệch chuẩn của mpg biến trong khung dữ liệu xe ô tô như sau:
sd (cars $ mpg) [1] 6. 026948
Bên cạnh ý nghĩa và biến tấu, bạn cũng có thể nhìn vào số liệu. A quantile, hoặc percentile, cho bạn biết số lượng dữ liệu của bạn nằm dưới một giá trị nhất định. Chẳng hạn, số lượng 50 phần trăm là số trung bình. Một lần nữa, R có một số chức năng thuận tiện để giúp bạn nhìn quantiles.
Làm thế nào để tính toán dải dữ liệu trong R
Các số lượng được sử dụng nhiều nhất thực sự là số 0 và 100 phần trăm quantiles. Bạn có thể dễ dàng gọi họ là tối thiểu và tối đa, bởi vì đó là những gì họ đang có. Bạn có thể nhận cả hai hàm min () và max () với nhau bằng cách sử dụng hàm range (). Chức năng này thuận tiện cho bạn phạm vi dữ liệu. Vì vậy, để biết giữa hai giá trị tất cả các mileages nằm, bạn chỉ cần làm như sau:
Cách tính toán các phần tư liệu trong R
Phạm vi vẫn cho bạn thông tin hạn chế. Thông thường các nhà thống kê báo cáo phần trăm thứ nhất và thứ ba
phần tư bên cạnh phạm vi và trung vị. Các phân vị này tương ứng với số lượng 25 phần trăm và 75 phần trăm, đó là số liệu mà một phần tư và ba phần tư dữ liệu nhỏ hơn. Bạn nhận được những con số này bằng cách sử dụng hàm quantile (), như sau:
Làm thế nào để có được về tốc độ với các chức năng quantile trong R
Các quantile () chức năng có thể cung cấp cho bạn quantile bất kỳ mà bạn muốn. Đối với điều đó, bạn sử dụng các đối số probs. Bạn cung cấp cho probs (hoặc xác suất) như một số phân số. Ví dụ, đối với số lượng 20 phần trăm, bạn sử dụng 0. 20 làm đối số cho giá trị.Đối số này cũng lấy một vector như là một giá trị, ví dụ bạn có thể lấy được 5% và 95% số lượng như sau:
quantile (cars $ mpg, probs = c (0, 05, 0.95)) 5% 95% 11. 995 31. 300
Giá trị mặc định cho đối số probs là vector đại diện cho mức tối thiểu (0), phần tư thứ nhất (0.25), trung vị (0.5), thứ ba phần tư (0.75) và tối đa (1).
Tất cả các chức năng này đều có một đối số na. rm cho phép bạn loại bỏ tất cả các giá trị NA trước khi tính thống kê tương ứng. Nếu bạn không làm điều này, bất kỳ vector có chứa NA sẽ có NA như là một kết quả. Điều này hoạt động giống hệt với na. rm đối số của hàm sum ().