Video: QD - Hướng Dẫn Chuyển Đổi Các Hệ Cơ Số Bằng Máy Tính Casio Fx-570es Plus 2025
Trước khi bạn cố gắng mô tả dữ liệu của bạn trong R, bạn phải đảm bảo rằng dữ liệu của bạn ở đúng định dạng. Điều này có nghĩa là
-
Đảm bảo tất cả dữ liệu của bạn được chứa trong một khung dữ liệu (hoặc trong một vector nếu đó là một biến duy nhất)
-
Đảm bảo rằng tất cả các biến là đúng loại
-
Kiểm tra rằng các giá trị đã được xử lý đúng
Một số dữ liệu có thể chỉ có một số giới hạn các giá trị khác nhau. Ví dụ, người ta có thể là nam hay nữ, và bạn có thể mô tả hầu hết các kiểu tóc chỉ với một vài màu.
Đôi khi có nhiều giá trị về mặt lý thuyết có thể nhưng không thực tế. Chẳng hạn, ô tô có thể có nhiều hơn 16 xilanh trong động cơ, nhưng bạn sẽ không tìm thấy nhiều trong số đó. Bằng cách này hay cách khác, tất cả dữ liệu này có thể được xem dưới dạng phân loại . Theo định nghĩa này, dữ liệu phân loại cũng bao gồm dữ liệu thứ tự.
Mặt khác, bạn có dữ liệu có thể có một số lượng không giới hạn các giá trị có thể. Điều này không nhất thiết có nghĩa là các giá trị có thể là bất kỳ giá trị nào bạn thích. Ví dụ, số dặm của một chiếc xe được thể hiện trong dặm cho mỗi gallon, thường được làm tròn đến cả dặm. Tuy nhiên, giá trị thực sẽ khác một chút cho mỗi chiếc xe.
Điều duy nhất xác định có bao nhiêu giá trị bạn cho phép là độ chính xác mà bạn thể hiện dữ liệu. Dữ liệu có thể được biểu diễn với bất kỳ độ chính xác nào đã chọn là liên tục . Cả hai dữ liệu được chia tỷ lệ khoảng cách và dữ liệu tỷ lệ tỷ số thường là dữ liệu liên tục.
Sự khác biệt giữa dữ liệu phân loại và dữ liệu liên tục không phải lúc nào cũng rõ ràng. Tuổi là, về bản chất, một biến số liên tục, nhưng nó thường được biểu thị bằng số năm kể từ khi sinh ra.
Bạn vẫn có nhiều giá trị có thể nếu bạn làm điều đó, nhưng điều gì sẽ xảy ra nếu bạn nhìn vào độ tuổi của trẻ ở trường trung học địa phương của bạn? Đột nhiên, bạn chỉ có năm, có thể sáu, các giá trị khác nhau trong dữ liệu của bạn. Vào thời điểm đó, bạn có thể nhận được nhiều hơn trong phân tích của bạn nếu bạn coi dữ liệu đó là phân loại.
Khi mô tả dữ liệu của bạn, bạn cần phải phân biệt giữa dữ liệu có lợi ích từ việc chuyển đổi sang một yếu tố và dữ liệu cần ở lại số. Nếu bạn có thể xem dữ liệu của bạn dưới dạng phân loại, chuyển nó sang một yếu tố giúp phân tích nó.