Video: Bài giảng 4: Cách đọc dữ liệu từ Excel vào R 2025
Thống kê viên thường phải lấy mẫu dữ liệu và sau đó tính thống kê. Lấy mẫu dễ dàng với R vì một mẫu thực sự không có gì nhiều hơn một tập con của dữ liệu. Để làm như vậy, bạn sử dụng mẫu (), lấy một vector như đầu vào; sau đó bạn cho biết có bao nhiêu mẫu để vẽ từ danh sách đó.
Nói rằng bạn muốn mô phỏng cuộn của một cái chết, và bạn muốn có được mười kết quả. Bởi vì kết quả của một cuộn duy nhất của một cái chết là một số từ một đến sáu, mã của bạn sẽ như sau:
Bạn cho biết mẫu () để trả lại mười giá trị, khoảng 1: 6. Bởi vì mỗi cuộn của khuôn là độc lập với mỗi cuộn của khuôn, bạn đang lấy mẫu với sự thay thế. Điều này có nghĩa là bạn lấy một mẫu từ danh sách và đặt lại danh sách về trạng thái ban đầu của nó (nói cách khác, bạn đặt phần tử bạn vừa vẽ lại vào danh sách).
Bởi vì giá trị trả lại của hàm mẫu () là một số ngẫu nhiên xác định, nếu bạn thử chức năng này nhiều lần, bạn sẽ nhận được kết quả khác nhau mỗi lần. Đây là hành vi chính xác trong hầu hết các trường hợp, nhưng đôi khi bạn có thể muốn nhận được kết quả lặp lại mỗi khi bạn chạy chức năng.
Thông thường, điều này sẽ xảy ra chỉ khi bạn phát triển và kiểm tra mã của bạn hoặc nếu bạn muốn chắc chắn rằng người khác có thể kiểm tra mã của bạn và nhận được cùng các giá trị bạn đã làm. Trong trường hợp này, bạn thường định nghĩa giá trị hạt giống
.
Nhưng nếu bạn không đặt hạt giống, R rút ra từ trạng thái hiện tại của máy phát số ngẫu nhiên (RNG). Khi khởi động R có thể thiết lập một hạt giống ngẫu nhiên để khởi tạo RNG, nhưng mỗi lần bạn gọi nó, R bắt đầu từ giá trị tiếp theo trong dòng RNG. Bạn có thể đọc Trợ giúp? RNG để biết thêm chi tiết.
Trong R, bạn sử dụng tập hợp. seed () để xác định giá trị bắt đầu của hạt giống. Các đối số để thiết lập. seed () là bất kỳ số nguyên nào. >> thiết lập. (1)> mẫu (1: 6, 10, thay thế = TRUE) [1] 2 3 4 6 2 6 6 4 4 1
Nếu bạn vẽ một mẫu khác, không đặt hạt giống, bạn sẽ có một bộ kết quả, như bạn mong đợi: >> mẫu (1: 6, 10, thay thế = TRUE) [1] 2 2 5 3 5 3 5 6 3 5
Bây giờ, để chứng minh rằng thiết lập.hạt giống () thực sự không đặt lại RNG, thử lại. Nhưng lần này, đặt hạt giống một lần nữa: >> set. (1)> mẫu (1: 6, 10, thay thế = TRUE) [1] 2 3 4 6 2 6 6 4 4 1
Bạn nhận được chính xác kết quả tương tự như lần đầu tiên bạn sử dụng bộ. hạt giống (1).
Bạn có thể sử dụng mẫu () để lấy mẫu từ khung dữ liệu iris. Trong trường hợp này, bạn có thể muốn sử dụng đối số replace = FALSE. Bởi vì đây là giá trị mặc định của đối số thay thế, bạn không cần phải viết nó một cách rõ ràng: >> set. hạt giống (123)> chỉ số chỉ mục [1] 44 119 62 133 142> iris [index,] Sepal. Chiều dài Sepal. Rộng cánh hoa. Chiều dài cánh hoa. Rộng Loài 44 5. 0 3. 5 1. 6 0. 6 setosa 119 7. 7 2. 6 6. 9 2. 3 virginica 62 5. 9 3. 0 4. 2 1. 5 versicolor 133 6. 4 2. 8 5. 6 2. 2 virginica 142 6. 9 3. 1 5. 1 2. 3 virginica