Trang Chủ Tài chính Cá nhân 10 Lỗi thông thường về khai thác dữ liệu (Điều đó bạn sẽ không thực hiện) - những cái đầu

10 Lỗi thông thường về khai thác dữ liệu (Điều đó bạn sẽ không thực hiện) - những cái đầu

Video: 8 bí ẩn kì lạ xoay quanh chiếc máy tính của bạn 2025

Video: 8 bí ẩn kì lạ xoay quanh chiếc máy tính của bạn 2025
Anonim

Việc khai thác dữ liệu được thực hiện bằng cách dùng thử và sai sót, và vì thế, đối với những người khai thác dữ liệu, những sai lầm chỉ là tự nhiên. Những sai lầm có thể có giá trị, nói cách khác, ít nhất là trong một số điều kiện. Tuy nhiên, không phải tất cả những sai lầm đều được tạo ra như nhau. Một số chỉ tránh được tốt hơn. Danh sách sau đây cung cấp mười sai lầm như vậy. Nếu bạn đọc cẩn thận, và cam kết với trí nhớ, bạn chỉ có thể tránh một vài va chạm trên đường cong học tập:

  • Xóa kiểm tra chất lượng dữ liệu: Hầu hết các chuyên viên khai thác dữ liệu nghĩ rằng phát triển các mô hình tiên đoán là thú vị hơn so với xem lại dữ liệu về các vấn đề về chất lượng. Nhưng nếu bạn không phát hiện được và sửa vấn đề chất lượng dữ liệu, bạn có thể kết thúc bằng những dự đoán vô giá trị.

  • Thiếu điểm: Bạn đã khám phá ra một điều thú vị! Đó là tốt đẹp, nhưng nếu nó không phải là cũng có liên quan đến vấn đề kinh doanh bạn đặt ra để giải quyết, tốt, nó không có liên quan ở tất cả. Lấy lại phong độ.

  • Bạn khám phá một tập dữ liệu và nhận thấy rằng khi Biến A tăng lên, B biến cũng tăng. Điều này có thể xảy ra do biến A ảnh hưởng đến biến B hoặc vì biến B ảnh hưởng đến biến A. Mặt khác, có thể cả hai đều chịu ảnh hưởng bởi một số biến khác mà bạn chưa xem xét. Hoặc nó có thể là một sự trùng hợp một lần. Ai có thể nói?

    Kéo dài các kết luận quá xa:
  • Đừng giả sử rằng các mối quan hệ bạn quan sát trong dữ liệu sẽ lặp lại trong những hoàn cảnh khác nhau. Nếu dữ liệu của bạn được thu thập trong một môi trường mát mẻ, đừng cho rằng mọi thứ sẽ hoạt động theo cùng một cách trong cài đặt nhà máy nóng. Cược vào các kết quả không có ý nghĩa:

  • Các phương pháp khai thác dữ liệu là không chính thức và thường không được hỗ trợ bằng phương pháp và lý thuyết khoa học, vì vậy kết quả của bạn có ý nghĩa kinh doanh tốt hơn. Nếu không có lời giải thích chung cho kết quả bạn đưa ra, quản lý điều hành của bạn có lẽ sẽ không nghiêm túc, và họ không nên. Yêu thích một phương pháp mô hình đặc biệt:

  • Không có kiểu mô hình khai thác dữ liệu đơn nào phù hợp với mọi tình huống. Đưa một mô hình vào sản xuất mà không có kiểm tra đầy đủ:

  • Không đặt cược doanh nghiệp của bạn trên mô hình dự đoán cho đến khi bạn kiểm tra nó với dữ liệu holdout và trên một quy mô nhỏ tại hiện trường. Bỏ qua các kết quả bạn không thích:

  • Nếu bạn bỏ qua dữ liệu của bạn bây giờ, nó sẽ trở lại một ngày và nói, "Tôi đã nói với bạn như vậy. " Sử dụng khai thác dữ liệu để giải quyết mọi nhu cầu phân tích dữ liệu:

  • Khai thác dữ liệu có giá trị to lớn, nhưng một số ứng dụng vẫn đòi hỏi các phương pháp thu thập dữ liệu nghiêm ngặt, phân tích thống kê chính thức và phương pháp khoa học. Giả sử rằng các kỹ thuật phân tích dữ liệu truyền thống không còn quan trọng nữa:

  • Hãy tham khảo mục đầu tiên.

10 Lỗi thông thường về khai thác dữ liệu (Điều đó bạn sẽ không thực hiện) - những cái đầu

Lựa chọn của người biên tập

Tìm kiếm Cơ sở dữ liệu của Chính phủ cho dữ liệu Infographics của bạn - núm vú

Tìm kiếm Cơ sở dữ liệu của Chính phủ cho dữ liệu Infographics của bạn - núm vú

Một Infographic tốt có thể trực quan kể một câu chuyện hoặc làm một số trừu tượng hoặc điểm số dễ hiểu, nhưng không có điều này xảy ra mà không có một cơ sở dữ liệu tốt. Các chính phủ thế giới và các tổ chức liên chính phủ duy trì các cơ sở dữ liệu về tất cả các loại thống kê. Dữ liệu về nhân khẩu học, kinh tế, sức khoẻ và văn hoá của vô số nước có sẵn trực tuyến cho ...

Tương lai của Infographics cho Giáo dục - núm vú

Tương lai của Infographics cho Giáo dục - núm vú

Sinh viên ngày nay có dây từ khi sinh ra, và khi họ đến trường tuổi, họ đã quen với các bài thuyết trình đầy màu sắc, đồ họa và giải trí. Nhập thông tin đồ họa. Có thể có một vài cách mà các biểu đồ chữ ký sẽ đóng vai trò mạnh mẽ hơn trong giáo dục trong thập kỷ tới và hơn thế nữa: Giải thích các khái niệm phức tạp: Chúng ta đã phải vật lộn qua một thứ gì đó trong trường học. ...

Lời khuyên cho việc định vị văn bản trên các hình ảnh hoá dữ liệu - núm vú

Lời khuyên cho việc định vị văn bản trên các hình ảnh hoá dữ liệu - núm vú

Bạn có thể đã nghe nói rằng " đặt nó ", mà không thể được truer khi nói đến thêm văn bản để hình dung dữ liệu. Văn bản bị đặt sai trái có thể dẫn đến hiểu sai về dữ liệu. Bạn nên thực hiện theo hai phương pháp hay nhất để đưa văn bản vào hình dung dữ liệu của bạn: Giữ toàn bộ văn bản theo chiều ngang. Nonhorizontal ...

Lựa chọn của người biên tập

GRE Câu hỏi mẫu: Hoàn thành văn bản - những con vú

GRE Câu hỏi mẫu: Hoàn thành văn bản - những con vú

Câu hỏi Hoàn thành văn bản trên GRE bao gồm một câu hoặc đoạn văn với một, hai hoặc ba không gian trống cho một từ hoặc từ bị thiếu. Công việc của bạn là chọn từ hoặc từ thích hợp nhất để điền vào chỗ trống trong câu. Đây là một số ví dụ để bạn thử. Mẫu ...

Làm thế nào để giải quyết vấn đề về toán học trên GRE - núm vú

Làm thế nào để giải quyết vấn đề về toán học trên GRE - núm vú

Khi bạn phải dịch một vấn đề từ vào toán học trên GRE, biết đâu để bắt đầu thường là thách thức khó khăn nhất. Điều quan trọng là bắt đầu với những gì bạn biết và làm việc theo những gì bạn không biết. Bạn có thể giải quyết hầu hết các vấn đề từ bằng cách tiếp cận theo từng bước: Đọc toàn bộ ...

Làm thế nào để Tối đa hóa điểm TOE GRE của bạn - núm vú

Làm thế nào để Tối đa hóa điểm TOE GRE của bạn - núm vú

Viết luận văn (và ghi điểm) trên GRE là chủ quan đến một mức độ nào. Không có câu trả lời đúng hay sai, và mỗi bài luận hơi khác nhau, dựa trên quan điểm, kiến ​​thức, kinh nghiệm, cách viết của người thử nghiệm, v.v ... Tuy nhiên, những người đánh giá, có một danh sách các tiêu chuẩn cụ thể để phân loại bài luận của bạn. Để thực hiện tốt, hãy chắc chắn làm ...

Lựa chọn của người biên tập

Chèn nội dung vào một slide PowerPoint trong Office 2011 for Mac - núm vú

Chèn nội dung vào một slide PowerPoint trong Office 2011 for Mac - núm vú

Ribbon trong PowerPoint 2011 cho Mac cho phép bạn thêm nội dung bằng các tùy chọn trên tab Trang chủ, trong nhóm Chèn. Mỗi lần bạn thêm một nội dung nào đó vào trang trình chiếu, nó được đặt trong một lớp trên đầu của tất cả các đối tượng hiện có trên trang trình bày. Chèn nội dung văn bản vào trang trình bày PowerPoint Nhấp vào tab Trang chủ của Ribbon và ...

Văn phòng 2011 dành cho Mac: Thêm đoạn nhạc vào bài trình chiếu PowerPoint - núm vú

Văn phòng 2011 dành cho Mac: Thêm đoạn nhạc vào bài trình chiếu PowerPoint - núm vú

Tăng cường PowerPoint 2011 của bạn cho Mac trình bày với các đoạn âm thanh. Sử dụng âm thanh và âm nhạc là một cách hay để thu hút khán giả của bạn. Trong PowerPoint 2011 dành cho Mac, bạn có thể chọn một trong hai cách để kích hoạt hộp thoại Insert Audio: Từ Media Browser: Sử dụng tab Audio và kéo từ trình duyệt sang PowerPoint. ...

Office 2011 dành cho Mac: Khởi động Đoạn hoặc Phim Tạp chí trên Các trang trình bày của PowerPoint - những đầu

Office 2011 dành cho Mac: Khởi động Đoạn hoặc Phim Tạp chí trên Các trang trình bày của PowerPoint - những đầu

Bao gồm cả phương tiện truyền thông trong trình tự hoạt hình của bạn là một ý tưởng tuyệt vời. Trong PowerPoint 2011 dành cho máy Mac, bạn không còn bị hạn chế khi xem phim trên đầu. Phim bây giờ hoạt động độc đáo trong lớp của riêng mình và có thể hoạt ảnh giống như bất kỳ đối tượng khác. Phim thậm chí có thể chồng chéo và theo dõi các đường dẫn chuyển động khi chúng chơi. Chỉ cần nhớ ...