Mục lục:
Video: [Thống kê căn bản] Bài 4: Phương sai và độ lệch chuẩn, công thức tính và ý nghĩa thống kê 2025
Trong lập trình R cho các phân tích tiên đoán, dữ liệu loại đôi khi bị nhầm lẫn với dữ liệu cấu trúc . Mỗi biến trong bộ nhớ chương trình có một kiểu dữ liệu. Chắc chắn, bạn có thể nhận được đi với có một số biến trong chương trình của bạn và vẫn còn được quản lý. Nhưng có lẽ sẽ không hoạt động tốt nếu bạn có hàng trăm (hoặc hàng ngàn) các biến; bạn phải cung cấp cho mỗi biến một tên để bạn có thể truy cập nó.
Hiệu quả hơn là lưu trữ tất cả các biến trong một bộ sưu tập hợp lý.
Các loại dữ liệu
Giống như các ngôn ngữ lập trình đầy đủ khác, R cung cấp nhiều loại dữ liệu và cấu trúc dữ liệu. Không cần chỉ định loại mà bạn đang gán cho một biến; thông dịch viên sẽ làm điều đó cho bạn. Tuy nhiên, bạn có thể chỉ định hoặc chuyển đổi kiểu nếu cần thiết; cái này được gọi là đúc . Ba loại dữ liệu như sau:
-
Số: Đây là những số thập phân điển hình của bạn. Đây được gọi là nổi (viết tắt của số dấu chấm động ) hoặc đôi> bằng các ngôn ngữ khác. Ký tự:
-
Đây là các chuỗi của bạn được tạo thành với sự kết hợp của chữ cái, ký tự và số. Chúng không có ý nghĩa số. Đây được gọi là chuỗi bằng các ngôn ngữ khác.
-
TRUE hoặc FALSE. Luôn sử dụng các giá trị này trong R. Các giá trị này được gọi là Booleans bằng các ngôn ngữ khác. So sánh một chuỗi các số với một số kết quả trong trình thông dịch chuyển đổi chuỗi số thành số và sau đó làm một so sánh số.
Các ví dụ về các kiểu dữ liệu như sau: >> ijkm <- i == j # logical> n <- i == k # logical
Sau khi bạn thực hiện các dòng mã, bạn có thể tìm ra giá trị và kiểu bằng cách sử dụng hàm str (). Thao tác này sẽ như sau: >> str (i) num 10> str (j) num 10> str (k) chr "10"> str (m) logi TRUE> str (n) logi TRUE
biểu thức trong bài tập n là một ví dụ của trình thông dịch tạm thời chuyển đổi kiểu dữ liệu của k thành một số để thực hiện việc đánh giá giữa số i và ký tự k.
Cấu trúc dữ liệu
R sẽ cần một nơi để lưu trữ các nhóm các loại dữ liệu để hoạt động với nó một cách hiệu quả. Đây được gọi là
cấu trúc dữ liệu
.
Một ví dụ thực tế của khái niệm này là một garage đỗ xe: Đó là một cấu trúc chứa ô tô hiệu quả. Nó được thiết kế để đậu xe ô tô nhiều nhất có thể, và cho phép xe ô tô nhập và ra khỏi kết cấu một cách hiệu quả.Ngoài ra, không có các vật thể khác ngoài xe ô tô nên được đậu trong một cấu trúc đậu xe. Cấu trúc dữ liệu bao gồm: Vectors:
Vectors lưu một tập các giá trị của một kiểu dữ liệu. Hãy nghĩ về nó như một hộp thuốc hàng tuần. Mỗi ngăn trong hộp thuốc phiện chỉ có thể lưu trữ một loại đối tượng nhất định. Sau khi bạn đặt một số viên thuốc vào một trong các ngăn, tất cả các ngăn khác cũng phải được lấp đầy bằng thuốc không hoặc thuốc nhiều hơn.
Bạn không thể đặt đồng xu trong cùng một hộp; bạn phải sử dụng một hộp thuốc khác (vector) cho điều đó. Tương tự như vậy, khi bạn lưu trữ một số trong một véc tơ, tất cả các giá trị trong tương lai cũng phải là số. Nếu không, thông dịch viên sẽ chuyển đổi tất cả các số của bạn cho các ký tự.
-
Ma trận: Ma trận
ma trận
-
trông giống như một bảng tính Excel: Về cơ bản nó là một bảng gồm các hàng và cột. Dữ liệu nạp các ô trống theo thứ tự hàng hoặc cột, trong đó bạn chỉ định khi tạo ma trận. Tất cả các cột phải có cùng kiểu dữ liệu. Khung dữ liệu: Khung dữ liệu tương tự như ma trận, ngoại trừ các cột dữ liệu có thể chứa các loại dữ liệu khác nhau. Các bộ dữ liệu được sử dụng trong mô hình tiên đoán được nạp vào các khung dữ liệu và lưu trữ ở đó để sử dụng trong mô hình.
Yếu tố:
-
Yếu tố
-
giống như một vector với một số giới hạn các giá trị khác biệt. Số lượng các giá trị khác biệt được gọi là mức . Bạn có thể sử dụng các yếu tố để điều trị một cột có số lượng giá trị giới hạn và được biết đến dưới dạng giá trị phân loại. Theo mặc định, dữ liệu ký tự được nạp vào các khung dữ liệu làm các yếu tố. Bạn truy cập vectơ, ma trận, và khung dữ liệu bằng cách sử dụng ký hiệu mảng . Ví dụ, bạn gõ
v <599 để truy cập phần tử thứ năm của vector v. Đối với ma trận hai chiều và khung dữ liệu, bạn đặt số hàng và số cột, cách nhau bởi dấu phẩy, bên trong dấu ngoặc vuông. Ví dụ: bạn nhập m [2, 3] để truy cập hàng thứ hai, giá trị cột thứ ba cho ma trận m . Cấu trúc dữ liệu là một môn học tiên tiến trong khoa học máy tính. Bây giờ, chúng tôi đang gắn bó với thực tế. Chỉ cần nhớ rằng cấu trúc dữ liệu được xây dựng để lưu trữ các loại dữ liệu cụ thể và chúng có chức năng chèn, xóa và truy xuất dữ liệu.