Trang Chủ Tài chính Cá nhân Làm thế nào để lấy mẫu từ dữ liệu trong R - núm vú

Làm thế nào để lấy mẫu từ dữ liệu trong R - núm vú

Video: Bài giảng 4: Cách đọc dữ liệu từ Excel vào R 2025

Video: Bài giảng 4: Cách đọc dữ liệu từ Excel vào R 2025
Anonim

Thống kê viên thường phải lấy mẫu dữ liệu và sau đó tính thống kê. Lấy mẫu dễ dàng với R vì một mẫu thực sự không có gì nhiều hơn một tập con của dữ liệu. Để làm như vậy, bạn sử dụng mẫu (), lấy một vector như đầu vào; sau đó bạn cho biết có bao nhiêu mẫu để vẽ từ danh sách đó.

Nói rằng bạn muốn mô phỏng cuộn của một cái chết, và bạn muốn có được mười kết quả. Bởi vì kết quả của một cuộn duy nhất của một cái chết là một số từ một đến sáu, mã của bạn sẽ như sau:

>> mẫu (1: 6, 10, thay thế = TRUE) [1] 2 2 5 3 5 3 5 6 3 5
Bạn cho biết mẫu () để trả lại mười giá trị, khoảng 1: 6. Bởi vì mỗi cuộn của khuôn là độc lập với mỗi cuộn của khuôn, bạn đang lấy mẫu với sự thay thế. Điều này có nghĩa là bạn lấy một mẫu từ danh sách và đặt lại danh sách về trạng thái ban đầu của nó (nói cách khác, bạn đặt phần tử bạn vừa vẽ lại vào danh sách).

Để làm điều này, bạn thêm đối số replace = TRUE, như trong ví dụ.

Bởi vì giá trị trả lại của hàm mẫu () là một số ngẫu nhiên xác định, nếu bạn thử chức năng này nhiều lần, bạn sẽ nhận được kết quả khác nhau mỗi lần. Đây là hành vi chính xác trong hầu hết các trường hợp, nhưng đôi khi bạn có thể muốn nhận được kết quả lặp lại mỗi khi bạn chạy chức năng.

Thông thường, điều này sẽ xảy ra chỉ khi bạn phát triển và kiểm tra mã của bạn hoặc nếu bạn muốn chắc chắn rằng người khác có thể kiểm tra mã của bạn và nhận được cùng các giá trị bạn đã làm. Trong trường hợp này, bạn thường định nghĩa giá trị hạt giống

.

Nếu bạn cung cấp giá trị hạt giống, chuỗi số ngẫu nhiên sẽ được đặt lại thành một trạng thái đã biết. Điều này là do R không tạo ra những con số thực sự ngẫu nhiên, nhưng chỉ những con số giả ngẫu nhiên. Một chuỗi giả ngẫu nhiên là một tập các con số, cho tất cả các mục đích thực tế, dường như ngẫu nhiên nhưng được tạo ra bởi một thuật toán. Khi bạn thiết lập một hạt giống bắt đầu cho một quá trình giả ngẫu nhiên, R luôn trả về cùng một chuỗi giả ngẫu nhiên.

Nhưng nếu bạn không đặt hạt giống, R rút ra từ trạng thái hiện tại của máy phát số ngẫu nhiên (RNG). Khi khởi động R có thể thiết lập một hạt giống ngẫu nhiên để khởi tạo RNG, nhưng mỗi lần bạn gọi nó, R bắt đầu từ giá trị tiếp theo trong dòng RNG. Bạn có thể đọc Trợ giúp? RNG để biết thêm chi tiết.

Trong R, bạn sử dụng tập hợp. seed () để xác định giá trị bắt đầu của hạt giống. Các đối số để thiết lập. seed () là bất kỳ số nguyên nào. >> thiết lập. (1)> mẫu (1: 6, 10, thay thế = TRUE) [1] 2 3 4 6 2 6 6 4 4 1

Nếu bạn vẽ một mẫu khác, không đặt hạt giống, bạn sẽ có một bộ kết quả, như bạn mong đợi: >> mẫu (1: 6, 10, thay thế = TRUE) [1] 2 2 5 3 5 3 5 6 3 5

Bây giờ, để chứng minh rằng thiết lập.hạt giống () thực sự không đặt lại RNG, thử lại. Nhưng lần này, đặt hạt giống một lần nữa: >> set. (1)> mẫu (1: 6, 10, thay thế = TRUE) [1] 2 3 4 6 2 6 6 4 4 1

Bạn nhận được chính xác kết quả tương tự như lần đầu tiên bạn sử dụng bộ. hạt giống (1).

Bạn có thể sử dụng mẫu () để lấy mẫu từ khung dữ liệu iris. Trong trường hợp này, bạn có thể muốn sử dụng đối số replace = FALSE. Bởi vì đây là giá trị mặc định của đối số thay thế, bạn không cần phải viết nó một cách rõ ràng: >> set. hạt giống (123)> chỉ số chỉ mục [1] 44 119 62 133 142> iris [index,] Sepal. Chiều dài Sepal. Rộng cánh hoa. Chiều dài cánh hoa. Rộng Loài 44 5. 0 3. 5 1. 6 0. 6 setosa 119 7. 7 2. 6 6. 9 2. 3 virginica 62 5. 9 3. 0 4. 2 1. 5 versicolor 133 6. 4 2. 8 5. 6 2. 2 virginica 142 6. 9 3. 1 5. 1 2. 3 virginica
Làm thế nào để lấy mẫu từ dữ liệu trong R - núm vú

Lựa chọn của người biên tập

ĐịNh dạng Kiểm thử GED trên máy vi tính và các kỹ năng bắt buộc

ĐịNh dạng Kiểm thử GED trên máy vi tính và các kỹ năng bắt buộc

Thử GED được thực hiện trên máy vi tính. Điều đó có nghĩa là bạn cần phải quen thuộc với một máy tính, bàn phím và chuột. Nếu trước đây bạn chưa thử nghiệm trên máy tính, đây là một số điểm khác biệt bạn nên biết: Kỹ năng đánh máy là một tài sản. Bạn không phải là người đánh máy cảm ứng ...

Khi Không Có Thông tin để Trả lời Câu hỏi GED - những núm vú

Khi Không Có Thông tin để Trả lời Câu hỏi GED - những núm vú

Một số câu hỏi về GED kiểm tra có thể không cung cấp cho bạn đủ thông tin để tìm câu trả lời đúng. Ví dụ, một câu hỏi có thể yêu cầu một kết luận mà bạn không thể làm từ các thông tin được đưa ra. Ngay cả khi bạn biết một số thông tin có thể giúp bạn giải quyết vấn đề, đừng sử dụng nó. Khi bạn lấy GED, ...

Việc phải làm Ngay trước khi Bạn Lấy GED - núm vú

Việc phải làm Ngay trước khi Bạn Lấy GED - núm vú

Làm tốt bài kiểm tra GED nhiều hơn đi vào vị trí kiểm tra và trả lời các câu hỏi. Bạn cần phải chuẩn bị cho những thách thức trong các bài kiểm tra. Để đảm bảo rằng bạn đã sẵn sàng để giải quyết bài kiểm tra đầu vào, hãy chắc chắn rằng bạn làm những điều sau đây dẫn đến kiểm tra: Đủ ngủ. Đó là sự thật ...

Lựa chọn của người biên tập

Máy tính Độ phân giải Màn hình - núm vú

Máy tính Độ phân giải Màn hình - núm vú

Như máy ảnh kỹ thuật số, màn hình máy tính (và các thiết bị hiển thị khác) tạo mọi thứ bạn thấy trên màn hình pixels. Bạn thường có thể chọn từ một số cài đặt màn hình, mỗi kết quả đều có một số điểm ảnh màn hình khác nhau. Đây là các cài đặt chuẩn: 800 x 600 pixel 1024 x 768 pixel 1280 x 1024 pixel 1600 x ...

Ghi Các tùy chọn cho máy ảnh SLR kỹ thuật số của bạn - núm vú

Ghi Các tùy chọn cho máy ảnh SLR kỹ thuật số của bạn - núm vú

Các cài đặt cơ bản của máy ảnh dSLR và chỉnh sửa phim chụp SLR kỹ thuật số và lưu ảnh và phim, cũng như các tùy chọn liên quan đến ảnh và tiếp xúc khác. Thanh cuộn ở phía bên phải của hệ thống menu cho bạn biết bạn đang ở đâu - lên hoặc xuống - khi bạn xem xét các lựa chọn riêng lẻ trong ...

Máy tính Độ phân giải máy in - độ dày

Máy tính Độ phân giải máy in - độ dày

Độ Phân giải máy in được đo bằng các chấm trên mỗi inch (dpi). Hình ảnh được in được tạo thành bởi các chấm nhỏ màu sắc, và có bao nhiêu dpi mà máy in có thể sản xuất xác định độ phân giải của máy in. Độ phân giải càng cao, điểm chấm nhỏ hơn và hình ảnh in càng tốt. Nhưng các máy in khác nhau sử dụng các công nghệ in khác nhau, một số trong đó ...

Lựa chọn của người biên tập

Nhân chủng học Các chủ đề để nghiên cứu cho bài kiểm tra tương tự Miller (MAT) - những con voi

Nhân chủng học Các chủ đề để nghiên cứu cho bài kiểm tra tương tự Miller (MAT) - những con voi

Nhân chủng học là nghiên cứu về con người và hành vi của chúng. Để nghiên cứu nhân chủng học cho bài kiểm tra Miller Analogies (MAT), bạn sẽ cần phải tập trung vào các thuật ngữ và các con số quan trọng được liệt kê ở đây. Nếu bạn từng tự hỏi tại sao mọi người hành động theo cách họ làm, bạn có thể thấy nhân học hấp dẫn. Các thuật ngữ nhân học xuất hiện trên bài kiểm tra MAT ...

Các chủ đề kiến ​​trúc cho Nghiên cứu Thử nghiệm Tương tự Miller (MAT) - núm vú

Các chủ đề kiến ​​trúc cho Nghiên cứu Thử nghiệm Tương tự Miller (MAT) - núm vú

Cho Thử nghiệm Tương tự Miller, bạn nên làm quen với các ví dụ nổi tiếng về kiến ​​trúc - như Đấu trường La Mã La Mã. Trên sàn MAT, kiến ​​trúc không phải là lớn như một loại hình nghệ thuật, do đó bao phủ các căn cứ có thể được một chút dễ dàng hơn. Các danh sách dưới đây sẽ làm quen với các kiến ​​trúc sư và kiến ​​trúc sư quan trọng nhất trong lịch sử của bạn và