Video: Cách download và cài đặt phần mềm thống kê R [Thống kê căn bản] 2025
Các vector, danh sách, và khung dữ liệu đóng một vai trò quan trọng trong việc đại diện cho dữ liệu trong R, do đó có thể ngắn gọn và chính xác xác định một tập hợp các dữ liệu của bạn là rất quan trọng.
Có ba toán tử chính mà bạn có thể sử dụng để chia nhỏ dữ liệu của bạn:
-
$: Chiết xuất một phần tử theo tên từ một danh sách hoặc khung dữ liệu. Ví dụ, iris $ Sepal. Chiều dài chiết xuất cột Sepal. Chiều dài từ khung dữ liệu iris.
-
[[: Chiết xuất một phần tử theo tên hoặc vị trí từ một danh sách hoặc khung dữ liệu. Ví dụ, iris [["Sepal. Chiều dài "]] chiết xuất cột Sepal. Chiều dài từ khung dữ liệu; iris; iris [[2]] chiết xuất phần tử thứ hai từ iris.
-
[: Trích xuất nhiều phần tử từ một vector, mảng, danh sách hoặc khung dữ liệu. Ví dụ, iris [c ("Sepal. Length", "Species")] chiết xuất các cột Sepal. Chiều dài và Loài từ mống mắt; iris [1: 10,] chiết xuất mười hàng đầu tiên từ iris; và Iris [1: 10, "Species"] chiết xuất mười phần tử đầu tiên của cột Các loài từ mống mắt.
Nhà điều hành tập hợp con dấu, [cho phép bạn trả lại nhiều phần tử. Bạn xác định tập hợp con theo một trong năm cách:
-
Trống: Trả về mọi thứ. Ví dụ, iris [] trả về tất cả các iris.
-
Số dương: Chỉ bao gồm các phần tử này. Ví dụ, iris [1: 100, 5] chiết xuất hàng trăm yếu tố đầu tiên của cột thứ năm của iris.
-
Số âm: Loại trừ các yếu tố này. Ví dụ, iris [- (1: 100)] không bao gồm hàng trăm hàng từ iris, trong khi iris [-5] loại trừ cột thứ năm từ mống mắt.
-
Lý luận: Bao gồm nếu TRUE; loại trừ nếu FALSE. Ví dụ, iris [iris $ Species == "setosa", chỉ chiết xuất những hàng từ iris mà giá trị Species là "setosa".
-
Tên: Bao gồm tất cả các tên phù hợp. Ví dụ, iris [c ("Species", "Petal Width")] chiết xuất các cột Species và Petal. Chiều rộng từ mống mắt.