Mục lục:
- Quan trọng không phải lúc nào cũng có ý nghĩa quan trọng
- Sự hồi quy không phải lúc nào cũng là tuyến tính
- Xóa ngoài phạm vi mô hình phân tán mẫu là một ý tưởng tồi
- Kiểm tra sự biến đổi xung quanh đường hồi quy
- Một mẫu có thể quá lớn
- Người tiêu dùng: Biết trục của bạn
- Vẽ đồ thị một biến phân loại như thể nó là một biến định lượng chỉ là sai
- Khi nào thích hợp, hãy bao gồm biến đổi trong biểu đồ của bạn
- Hãy cẩn thận khi liên quan đến các khái niệm thống kê thống kê cho Excel
Video: 12 cách để bảo vệ ngôi nhà của bạn khi bạn ra ngoài 2025
Thế giới thống kê đầy những cạm bẫy, nhưng nó cũng đầy cơ hội. Cho dù bạn là người dùng số liệu thống kê hoặc ai đó để giải thích chúng, bạn có thể rơi vào những cạm bẫy. Cũng có thể đi bộ xung quanh họ. Đây là mười lời khuyên và bẫy từ các lĩnh vực thử nghiệm giả thuyết, hồi quy, tương quan, và đồ thị.
Quan trọng không phải lúc nào cũng có ý nghĩa quan trọng
, theo nhiều cách, là một thuật ngữ được lựa chọn không rõ ràng. Khi một bài kiểm tra thống kê cho kết quả đáng kể và quyết định từ chối H 0 , điều đó không đảm bảo rằng nghiên cứu đằng sau dữ liệu là một trong những vấn đề quan trọng. Thống kê chỉ có thể giúp quyết định về số lượng và suy luận về các quy trình sản xuất chúng. Họ không thể làm cho những quy trình này trở nên quan trọng hoặc trái đất tan vỡ. Tầm quan trọng là cái gì bạn phải tự thẩm định - và không có bài kiểm tra thống kê nào có thể làm điều đó cho bạn.
Sự hồi quy không phải lúc nào cũng là tuyến tính
Khi cố gắng để phù hợp với một mô hình hồi quy cho một điểm phân tán, sự cám dỗ là sử dụng một đường thẳng ngay lập tức. Đây là mô hình hồi quy được hiểu rõ nhất, và khi bạn nhận được hang của nó, độ dốc và chặn không phải là tất cả những khó khăn.
Nhưng hồi quy tuyến tính không phải là loại hồi quy duy nhất. Có thể để phù hợp với một đường cong thông qua một scatterplot. Đừng bị lừa: Các khái niệm thống kê đằng sau hồi quy curvilinear khó hiểu hơn các khái niệm đằng sau hồi quy tuyến tính.
Tuy nhiên, có thể dành thời gian để làm chủ những khái niệm đó. Đôi khi, đường cong phù hợp hơn so với đường thẳng.
Xóa ngoài phạm vi mô hình phân tán mẫu là một ý tưởng tồi
Cho dù bạn đang làm việc với hồi quy tuyến tính hay hồi qui đường cong, hãy nhớ rằng nó không phù hợp để khái quát vượt ra ngoài ranh giới của trình phân tán.
Giả sử bạn đã thiết lập một mối quan hệ dự đoán vững chắc giữa một bài kiểm tra khả năng toán học và hiệu suất trong các môn học toán học, và điểm phân tán của bạn chỉ bao gồm một phạm vi hẹp của khả năng toán học. Bạn không có cách nào để biết liệu mối quan hệ có vượt quá phạm vi đó hay không. Các dự đoán bên ngoài phạm vi đó không hợp lệ.
Cách tốt nhất là mở rộng scatterplot bằng cách kiểm tra nhiều người hơn. Bạn có thể thấy rằng mối quan hệ ban đầu chỉ nói một phần của câu chuyện.
Kiểm tra sự biến đổi xung quanh đường hồi quy
Phân tích cẩn thận số dư (sự chênh lệch giữa giá trị quan sát và dự đoán) có thể cho bạn biết rất nhiều về mức độ phù hợp của dữ liệu. Một giả định nền tảng là sự thay đổi xung quanh một đường hồi qui là giống nhau về phía trên và xuống dưới.Nếu không, mô hình có thể không được dự đoán như bạn nghĩ. Nếu độ biến thiên là hệ thống (biến đổi lớn hơn ở một đầu hơn ở phía kia), hồi qui đường cong có thể thích hợp hơn tuyến tính. Lỗi tiêu chuẩn ước lượng sẽ không phải lúc nào cũng là chỉ số.
Một mẫu có thể quá lớn
Tin hay không, điều này đôi khi xảy ra với hệ số tương quan. Một mẫu rất lớn có thể làm cho một hệ số tương quan nhỏ có ý nghĩa thống kê.
Nhưng hệ số tương quan thực sự nghĩa là gì? Hệ số xác định -r 2 - chỉ là. 038, có nghĩa là hồi quy của SS nhỏ hơn 4% SS Tổng . Đó là một hiệp hội rất nhỏ.
Dòng dưới cùng: Khi xem xét một hệ số tương quan, hãy chú ý đến kích cỡ mẫu. Nếu nó đủ lớn, nó có thể làm cho một hiệp hội tầm thường hóa ra đáng kể về mặt thống kê. (Hmmm … Ý nghĩa - Có một lần nữa!)
Người tiêu dùng: Biết trục của bạn
Khi bạn nhìn vào đồ thị, hãy chắc chắn rằng bạn biết những gì ở mỗi trục. Hãy chắc chắn rằng bạn hiểu các đơn vị đo lường. Bạn có hiểu được biến độc lập không? Bạn có hiểu được biến phụ thuộc? Bạn có thể miêu tả từng chữ theo cách của bạn? Nếu câu trả lời cho bất kỳ câu hỏi nào trong số này là "Không", bạn không hiểu đồ thị bạn đang xem.
Khi xem biểu đồ trong quảng cáo truyền hình, hãy thận trọng nếu nó biến mất quá nhanh, trước khi bạn có thể thấy những gì trên các trục. Nhà quảng cáo có thể đang cố tạo ra một ấn tượng sai lầm kéo dài về mối quan hệ không có thật bên trong biểu đồ. Mối quan hệ bằng đồ thị có thể có giá trị như các yếu tố chính trong quảng cáo truyền hình - bằng chứng khoa học qua phim hoạt hình: Những bàn chải cọ động động nhỏ nhặt làm sạch răng phim hoạt hình có thể không nhất thiết đảm bảo răng trắng hơn cho bạn nếu bạn mua sản phẩm.
Vẽ đồ thị một biến phân loại như thể nó là một biến định lượng chỉ là sai
Vì vậy, bạn chỉ là về sẵn sàng để cạnh tranh trong Rock-Paper-Scissors World Series. Để chuẩn bị cho giải đấu quốc tế này, bạn đã tính tất cả các trận đấu của mình trong 10 năm qua, liệt kê tỷ lệ số lần bạn giành được khi bạn đóng từng vai trò.
Để tóm tắt tất cả các kết quả, sử dụng các khả năng đồ họa của Excel để tạo ra một biểu đồ.
Rất nhiều người tạo ra các loại đồ thị này - những người cần biết rõ hơn. Dòng trong biểu đồ ngụ ý sự liên tục từ điểm này sang điểm khác. Với những dữ liệu này, tất nhiên, đó là điều không thể. Cái gì giữa đá và giấy? Tại sao chúng lại có những đơn vị như nhau? Tại sao ba loại theo thứ tự đó?
Đơn giản chỉ cần đặt, một biểu đồ đường không phải là đồ thị thích hợp khi ít nhất một trong các biến của bạn là một tập các loại. Thay vào đó, hãy tạo biểu đồ cột. Biểu đồ hình tròn hoạt động ở đây, bởi vì dữ liệu là phần trăm và bạn chỉ có một vài lát.
Khi nào thích hợp, hãy bao gồm biến đổi trong biểu đồ của bạn
Khi các điểm trong biểu đồ của bạn đại diện có nghĩa là, đảm bảo rằng biểu đồ bao gồm các lỗi chuẩn của mỗi phương tiện.Điều này cho người xem một ý tưởng về sự biến đổi trong dữ liệu - đó là một khía cạnh quan trọng của dữ liệu.
Phương tiện của bản thân không phải lúc nào cũng nói cho bạn biết toàn bộ câu chuyện. Tận dụng mọi cơ hội để kiểm tra sai lệch và độ lệch chuẩn. Bạn có thể tìm thấy một số nuggets ẩn. Biến thể có tính hệ thống - ví dụ như biến thể có ý nghĩa lớn liên quan đến các phương tiện lớn - có thể là một đầu mối về mối quan hệ mà bạn chưa từng thấy.
Hãy cẩn thận khi liên quan đến các khái niệm thống kê thống kê cho Excel
Nếu bạn nghiêm túc làm công việc thống kê, có thể bạn sẽ có cơ hội nhìn vào một văn bản thống kê hoặc hai. Ghi nhớ rằng các biểu tượng trong một số lĩnh vực thống kê không phải là tiêu chuẩn.
Kết nối sách giáo khoa khái niệm với các chức năng thống kê của Excel có thể là một thách thức vì các văn bản và vì Excel. Thông báo trong các hộp thoại và trong các tệp trợ giúp có thể chứa các ký hiệu khác với những ký tự bạn đọc hoặc chúng có thể sử dụng các ký hiệu tương tự nhưng theo một cách khác. Sự chênh lệch này có thể khiến bạn nhập sai một tham số vào một hộp thoại, dẫn đến một lỗi rất khó để theo dõi.