Video: #1 Chân mệnh sử gia khiến Trấn Thành, Tóc Tiên,... vạn phục | SIÊU TRÍ TUỆ VIỆT NAM | FTLTVC08 2025
Khi làm việc với số liệu thống kê lớn, bạn xác định sự lan rộng của một tập dữ liệu từ trung tâm với một số các biện pháp tóm tắt khác nhau: variance, standard độ lệch, quartiles, phạm vi liênquanh (IQR).
Biến động là độ lệch bình phương trung bình giữa các phần tử của tập dữ liệu với giá trị trung bình. Đối với một mẫu dữ liệu, phương sai được tính như sau:
Trong đó
-
x i là giá trị của một phần tử duy nhất trong mẫu.
-
là trung bình mẫu.
-
n là cỡ mẫu.
Độ lệch tiêu chuẩn là căn bậc hai của phương sai. Đối với hầu hết các ứng dụng, độ lệch tiêu chuẩn là thuận tiện hơn để sử dụng hơn so với phương sai như là một biện pháp lây lan. Đó là bởi vì phương sai được đo trong bình phương đơn vị, trong khi độ lệch tiêu chuẩn được đo bằng đơn vị giống như dữ liệu. Ví dụ, độ biến thiên của một bộ dữ liệu bao gồm giá sẽ được đo bằng đô la bình phương, và độ lệch chuẩn sẽ được tính bằng đô la. Độ lệch chuẩn là thước đo được sử dụng rộng rãi nhất của sự lây lan trong một tập dữ liệu.
Phần tứ phân chia một tập dữ liệu thành bốn phần bằng nhau. Phần tư thứ nhất (Q 1 ) chia dữ liệu thành 25% quan sát thấp nhất và 75% cao nhất (25% quan sát Q 1 < và 75% lớn hơn Q 1 ). Phần tư thứ hai (Q 2 ) chia dữ liệu thành 50 phần trăm thấp nhất các quan sát và 50 phần trăm cao nhất. Phần tư thứ ba (Q 3 ) chia dữ liệu thành thấp nhất 75 phần trăm số quan sát và 25 phần trăm cao nhất. Khoảng giữa các phần tư (IQR) tương đương với sự khác nhau giữa tứ phân thứ ba và thứ nhất:
Các phần tư của một tập dữ liệu được minh họa tốt nhất với một ô hộp
. Biểu đồ sau đây cho thấy một hộp lô hàng trả về hàng ngày cho ExxonMobil trong năm 2013. Hộp lô hàng trả về hàng ngày cho cổ phiếu của ExxonMobil trong năm 2013.
Biểu đồ hộp cho thấy một số thống kê chính cho thu nhập của ExxonMobil: > Lợi nhuận tối thiểu được hiển thị trên một đồ thị dưới dạng một điểm duy nhất ở cuối ô (một ô ô cho thấy các điểmbên ngoài
là các điểm riêng biệt). Q 1 được hiển thị dưới đáy hộp, Q 2 là đường màu đen rắn ở giữa hộp, và Q 3 là đầu của cái hộp. Sự trở lại tối đa được thể hiện như là một điểm duy nhất ở phía trên cùng của cốt truyện.