Trang Chủ Tài chính Cá nhân Xóa bỏ dữ liệu bạn cần - núm vú

Xóa bỏ dữ liệu bạn cần - núm vú

Mục lục:

Video: Shape-shifting tech will change work as we know it | Sean Follmer 2024

Video: Shape-shifting tech will change work as we know it | Sean Follmer 2024
Anonim

Khi bạn khai thác dữ liệu, đôi khi bạn sẽ có nhiều dữ liệu hơn bạn cần cho một dự án nhất định. Đây là cách để giảm xuống chỉ cần những gì bạn cần.

Thu hẹp các trường

Khi bạn có nhiều biến trong tập dữ liệu, có thể khó tìm hoặc thấy những điểm mà bạn quan tâm. Và nếu tập dữ liệu của bạn lớn và bạn không cần tất cả các biến số, việc giữ các tính năng bổ sung làm tăng tài nguyên không cần thiết. Vì vậy, đôi khi bạn cần giữ một số biến và thả những người khác. Hình này cho thấy một ví dụ trong KNIME, ở đó đúng công cụ được gọi là Bộ lọc Cột.

Một thiết lập ví dụ cho công cụ này được hiển thị trong hình dưới đây.

Để thu hẹp các trường, hãy tìm một công cụ lựa chọn có thể thay đổi trong ứng dụng khai thác dữ liệu của bạn; chúng được tìm thấy với các công cụ khác để thao tác dữ liệu. Giống như các công cụ khai thác dữ liệu khác, tên khác nhau giữa các sản phẩm. Tìm các biến thể trên từ cột, biến, hoặc lĩnh vực, và lựa chọn hoặc lọc.

Chọn trường hợp có liên quan

Các trường hợp có dữ liệu chưa đầy đủ có thể được lọc ra trước khi xây dựng mô hình. Xóa trường hợp không đầy đủ là một ví dụ phổ biến về chọn dữ liệu hoặc lọc.

Nhưng bạn chọn những trường hợp thích hợp cho từng phân đoạn mà bạn quan tâm như thế nào? Bạn muốn sử dụng công cụ chọn dữ liệu.

Hình dưới đây cho thấy một công cụ lựa chọn dữ liệu trong một ứng dụng khai thác dữ liệu khác.

Hình tiếp theo cho thấy cách bạn thiết lập công cụ đó cho một loại lựa chọn khác, điều này dựa trên giá trị của một biến.

Thông thường, bạn sử dụng kiểu lựa chọn dữ liệu này và một số ứng dụng cung cấp tất cả các loại chức năng được cài sẵn để giúp bạn xác định chính xác các trường hợp bạn muốn. Điều này có một số tính năng đặc biệt; nó sẽ hiển thị thống kê tóm tắt cho biến và cho bạn biết chính xác bao nhiêu trường hợp đáp ứng các tiêu chí lựa chọn.

Hầu hết các ứng dụng khai thác dữ liệu đều có các công cụ để lựa chọn các trường hợp bạn cần. Tìm trong menu (hoặc tìm kiếm) cho chọn bộ lọc hoặc .

Lấy mẫu

Một quan niệm phổ biến hiện nay là dữ liệu nhiều hơn là dữ liệu tốt hơn. Đây không phải là một ý kiến ​​mới. Các ứng dụng khai thác dữ liệu luôn được phát triển để làm việc với số lượng lớn dữ liệu. Ngay cả tên "khai thác dữ liệu" cho thấy số lượng lớn. Nhưng thường xuyên, làm việc với một mẫu dữ liệu của bạn sẽ cung cấp cho bạn thông tin hữu ích, làm cho công việc của bạn dễ dàng hơn, và tiết kiệm thời gian và nguồn lực của bạn.

Lấy mẫu đóng vai trò quan trọng trong việc khai thác dữ liệu. Nếu dữ liệu được cân bằng có nghĩa là mô hình sử dụng số trường hợp tương đương nhau trong mỗi nhóm được so sánh (trong ví dụ đó, nhóm là tài sản thay đổi tay và tài sản không có), mặc dù một nhóm có nhiều trường hợp hơn khác trong dữ liệu ban đầu.

Sau đó, dữ liệu được chia nhỏ, chia thành một tập con để sử dụng cho việc đào tạo mô hình và một cho thử nghiệm. Chỉ sử dụng một mẫu dữ liệu trong một mảng tọa độ song song có thể làm cho nó dễ dàng hơn để xem và giải thích. (Scatterplots với hàng ngàn điểm có thể khó đọc được!) Có lẽ điều quan trọng nhất là việc lấy mẫu chỉ làm giảm lượng dữ liệu, vì vậy mọi thứ chạy nhanh hơn.

Xóa bỏ dữ liệu bạn cần - núm vú

Lựa chọn của người biên tập

Thực hành phân tích Lý luận LSAT - núm vú

Thực hành phân tích Lý luận LSAT - núm vú

LSAT liên quan đến một phần câu hỏi gọi là lý luận phân tích. Bạn chắc chắn sẽ được hưởng lợi từ một số thực tế khi nói đến những câu hỏi này. Hãy xem các ví dụ sau đây để có được một ý tưởng về những gì bạn sẽ phải đối mặt vào ngày thử nghiệm. Các câu hỏi lý luận phân tích Một phòng tập yoga cung cấp các lớp học trong ba loại ...

11 LSAT Những thần thoại - những người có đầu

11 LSAT Những thần thoại - những người có đầu

Những người đi học luật thường là những người cụ thể và chính xác. Họ học xếp hạng trường luật, bực bội về điểm số của họ và điểm số của LSAT, và thường nắm bắt bất kỳ "sự thật" hiển nhiên nào giúp họ giải quyết được quá trình nảy lửa của việc khởi nghiệp pháp lý. Đó là lý do tại sao huyền thoại về LSAT rất nhiều. Các LSAT không có ...

Làm thế nào để trả lời những câu hỏi về suy nghĩ thiếu sót về LSAT-núm vú

Làm thế nào để trả lời những câu hỏi về suy nghĩ thiếu sót về LSAT-núm vú

Lập luận đang xé nát đối thủ của bạn. Các LSAT sẽ kiểm tra khả năng của bạn để tấn công đối số của đối phương. Các luật sư dành ít nhất là nhiều thời gian để tấn công đối số của đối phương khi họ củng cố chính mình. Bất kể trường hợp của bạn mạnh đến thế nào, đối thủ của bạn sẽ có một trường hợp khó khăn ...

Lựa chọn của người biên tập

Hacking Các công cụ bạn không thể sống thiếu - núm vú

Hacking Các công cụ bạn không thể sống thiếu - núm vú

Như một chuyên gia bảo mật thông tin, bộ công cụ của bạn là mục quan trọng nhất mà bạn có thể sở hữu chống lại hacking - ngoài kinh nghiệm thực tế và thông thường. Các công cụ hacking của bạn nên bao gồm những điều sau đây: (và đảm bảo bạn không bao giờ làm việc mà không có chúng): Phần mềm crack mật khẩu, chẳng hạn như ophcrack và Proactive Password Auditor Network scanning ...

Hacking Web 2. 0 - núm vú

Hacking Web 2. 0 - núm vú

Công nghệ web mới hơn, ban đầu được gọi là "Web 2. 0" đã thay đổi cách Internet được sử dụng. Từ YouTube sang Facebook cho Twitter, các công nghệ máy chủ và khách hàng mới, chẳng hạn như các dịch vụ web, Ajax, và Flash, đang được triển khai như thể chúng đi theo phong cách. Và đây không chỉ là những công nghệ tiêu dùng. Các doanh nghiệp nhìn thấy giá trị trong đó, ...

Khám phá các bộ định tuyến TCP / IP - núm vú

Khám phá các bộ định tuyến TCP / IP - núm vú

Router kết nối mạng. Các bộ định tuyến bao gồm máy tính để bàn của ai đó chạy phần mềm chia sẻ Internet tới các hệ thống phần cứng và phần mềm chuyên dụng trị giá hàng tỷ đô la. Trong công việc ban đầu về TCP / TP, các nhà thiết kế muốn có thể di chuyển dữ liệu qua mạng ngay cả khi các bộ phận của mạng bị gián đoạn. Ví dụ: nếu một liên kết mạng được thực hiện ...

Lựa chọn của người biên tập

ĐIều hướng Thanh công cụ trong Office 2011 for Mac - núm vú

ĐIều hướng Thanh công cụ trong Office 2011 for Mac - núm vú

Thanh công cụ tiêu chuẩn trong Office 2011 for Mac hoạt động giống như một số trình duyệt Web thanh công cụ và được kết hợp vào cửa sổ tài liệu. Theo mặc định, bạn gặp thanh công cụ Standard bên dưới thanh trình đơn. Dưới đây là một thanh công cụ chuẩn trong Office 2011 dành cho Mac và những gì bạn sẽ thấy trên đó: Các điều khiển đầu tiên không thực sự ...

Quản lý Tệp với SkyDrive trong Office 2011 for Mac - núm vú

Quản lý Tệp với SkyDrive trong Office 2011 for Mac - núm vú

Nếu bạn quyết định sử dụng SkyDrive để lưu trữ và chia sẻ các tệp Office 2011 của bạn, bạn có hai cách để lưu vào SkyDrive mà không cần trình duyệt Web của bạn. Bạn có thể lưu trực tiếp từ Office sang SkyDrive hoặc bạn có thể lưu vào một thư mục được đồng bộ hóa với SkyDrive. Lưu trữ các tệp trên SkyDrive trong Office 2011 cho Mac Để <

Office 2008 cho Mac Phím tắt - núm vú

Office 2008 cho Mac Phím tắt - núm vú

Nếu có một điều sẽ đẩy nhanh việc sử dụng Office 2008 cho các ứng dụng Mac, nó là để ghi nhớ các phím tắt thường xuyên sử dụng. Nếu bạn giống như hầu hết mọi người, bạn càng giữ cho ngón tay của bạn tắt các phím bàn phím (và tắt chuột), bạn càng hiệu quả khi sử dụng các ứng dụng Office. Tạo một ...