Trang Chủ Tài chính Cá nhân Sử dụng Cross Validation trong Học Máy - núm vú

Sử dụng Cross Validation trong Học Máy - núm vú

Video: Machine learning: Các phương pháp lựa chọn mô hình, cross-validation 2025

Video: Machine learning: Các phương pháp lựa chọn mô hình, cross-validation 2025
Anonim

Đôi khi, học máy đòi hỏi bạn phải dùng đến sự hợp tác chéo. Một vấn đề đáng chú ý với việc chia tách tập huấn / tập kiểm tra là bạn đang thực sự đưa ra sự thiên vị vào thử nghiệm của mình vì bạn đang giảm kích thước dữ liệu đào tạo trong mẫu. Khi bạn tách dữ liệu của mình, bạn có thể thực sự giữ một số ví dụ hữu ích ngoài việc đào tạo. Hơn nữa, đôi khi dữ liệu của bạn quá phức tạp đến nỗi bộ kiểm tra, mặc dù dường như tương tự như tập huấn luyện, không thực sự giống nhau bởi vì sự kết hợp các giá trị khác nhau (điển hình là các bộ dữ liệu chiều sâu).

Những vấn đề này làm tăng tính không ổn định của các kết quả lấy mẫu khi bạn không có nhiều ví dụ. Nguy cơ phân chia dữ liệu của bạn một cách không thuận lợi cũng giải thích tại sao việc chia tách tàu / bài kiểm tra không phải là giải pháp được yêu thích bởi các học viên máy học khi bạn phải đánh giá và điều chỉnh một giải pháp học máy.

Xác nhận chéo dựa trên k-folds thực sự là câu trả lời. Nó dựa vào phân chia ngẫu nhiên, nhưng lần này nó chia tách dữ liệu của bạn thành một số k nếp gấp (phần dữ liệu của bạn) có kích thước bằng nhau. Sau đó, mỗi lần gấp lại được tổ chức lần lượt như là một tập kiểm tra và những người khác được sử dụng để đào tạo. Mỗi lần lặp sử dụng một lần khác như một bài kiểm tra, tạo ra ước lượng lỗi.

Một biểu đồ đồ họa về cách hoạt động của việc kiểm tra chéo.

Quy trình này cung cấp những ưu điểm sau:

Hoạt động tốt bất kể số ví dụ, bởi vì bằng cách tăng số nếp gấp sử dụng, bạn thực sự đang tăng kích cỡ tập luyện của mình (lớn hơn k, tập huấn luyện lớn hơn, giảm thiên vị) và giảm kích thước của bộ kiểm tra.

  • Sự khác biệt trong phân phối cho các nếp gấp cá nhân không quan trọng như nhiều. Khi một lần có phân phối khác so với các phiên bản khác, nó chỉ được sử dụng một lần làm bộ thử nghiệm và pha trộn với những người khác như một phần của tập huấn luyện trong các bài kiểm tra còn lại.
  • Bạn đang thực sự kiểm tra tất cả các quan sát, vì vậy bạn đang kiểm tra hoàn toàn giả thuyết học máy của bạn bằng cách sử dụng tất cả dữ liệu bạn có.
  • Bằng cách lấy ý nghĩa của kết quả, bạn có thể mong đợi một hiệu suất tiên đoán. Ngoài ra, độ lệch tiêu chuẩn của kết quả có thể cho bạn biết bạn có thể mong đợi bao nhiêu biến thể trong dữ liệu thực ngoài dữ liệu. Sự thay đổi cao hơn trong các màn trình diễn được kiểm chứng qua lại cho bạn biết các dữ liệu cực kỳ đa dạng mà thuật toán không có khả năng bắt kịp.
  • Việc sử dụng xác nhận chéo k-fold luôn là sự lựa chọn tối ưu trừ khi dữ liệu bạn đang sử dụng có một số thứ tự quan trọng. Ví dụ: nó có thể bao gồm một loạt thời gian, chẳng hạn như bán hàng. Trong trường hợp đó, bạn không nên sử dụng một phương pháp lấy mẫu ngẫu nhiên mà dựa vào một sự phân chia xe lửa / thử nghiệm dựa trên trình tự ban đầu để đơn đặt hàng được bảo toàn và bạn có thể kiểm tra các ví dụ cuối cùng của loạt lệnh đó.
Sử dụng Cross Validation trong Học Máy - núm vú

Lựa chọn của người biên tập

Khóa Autoexposure Settings trên Rebel T6i / 750D - núm vú

Khóa Autoexposure Settings trên Rebel T6i / 750D - núm vú

Để Giúp đảm bảo tiếp xúc thích hợp, Máy ảnh Rebel T6i / 750D liên tục đo ánh sáng cho đến khi bạn bấm nút chụp một cách đầy đủ để chụp ảnh. Ở chế độ tự động phơi sáng - có nghĩa là, bất kỳ chế độ nào nhưng M - máy ảnh cũng sẽ tiếp tục điều chỉnh cài đặt phơi sáng nếu cần. Đối với hầu hết các tình huống, cách tiếp cận này hoạt động rất tốt, kết quả là

Các chức năng trên Canon EOS Rebel T3 / 1100D của bạn - núm vú

Các chức năng trên Canon EOS Rebel T3 / 1100D của bạn - núm vú

Bạn truy cập nhiều Canon Các tính năng của máy ảnh EOS Rebel T3 / 1100D thông qua các menu nội bộ, đủ thuận tiện, xuất hiện trên màn hình khi bạn nhấn nút Menu, nằm trên góc trên bên trái của camera. Các tính năng được nhóm vào các menu được mô tả trong bảng dưới đây. Một số chức năng trình đơn và thậm chí cả các menu xuất hiện ...

Phim Trình đơn 2 trên Máy Canon EOS Rebel T6 / 1300D của bạn - núm vú

Phim Trình đơn 2 trên Máy Canon EOS Rebel T6 / 1300D của bạn - núm vú

Rebel T6 của bạn cung cấp bạn có một số cài đặt để tùy chỉnh phim. Đặt chế độ quay phim vào vị trí Movie và xem Movie Menu 2. Movie Menu 2 bao gồm các cài đặt sau: Movie Recording Size: Tùy chọn này xác định độ phân giải phim (kích thước khung hình, pixel), khung hình / giây (fps) tỉ lệ. Thiết lập này là ...

Lựa chọn của người biên tập

Làm thế nào để tạo một thư mục phát triển cho các dự án Ruby - núm vú

Làm thế nào để tạo một thư mục phát triển cho các dự án Ruby - núm vú

Bạn nên thiết lập một không gian trên ổ cứng cho công việc của bạn trong Ruby được lưu trữ. Các lập trình viên gọi các thư mục không gian này, nhưng bạn có thể xem chúng như các thư mục. Thiết lập thư mục và tệp của bạn tương đối giống nhau cho cả Mac và Windows. Đầu tiên, tạo một thư mục phát triển để giữ tất cả các Ruby của bạn ...

Làm thế nào để Thêm bộ nhớ trong Ruby bằng cách lưu trữ kết quả trong các biến

Làm thế nào để Thêm bộ nhớ trong Ruby bằng cách lưu trữ kết quả trong các biến

Trong Ruby, you thường đặt tên biến bằng cách sử dụng các chữ cái viết thường, số và dấu gạch dưới (_). Ruby mong muốn một biến bắt đầu với một chữ cái thường, và sau đó bạn có thể sử dụng bất kỳ sự kết hợp của chữ cái viết thường khác, số, hoặc gạch dưới. Quy ước Ruby là sử dụng "snakecase" khi đặt tên một biến. Snakecase tách các từ với một dấu gạch dưới, ...

Làm thế nào để Thực hiện Toán cơ bản trong Ruby - núm vú

Làm thế nào để Thực hiện Toán cơ bản trong Ruby - núm vú

Ruby bao gồm một tập hợp lớn và mạnh mẽ của khả năng tích hợp sẵn . Một trong những cơ bản nhất là khả năng làm số học đơn giản. Nhập 2 + 2 tại dấu nhắc irb và nhấn Return (Enter): 2. 2. 2: 010 & gt; 2 + 2 = & gt; 4 Wow, Ruby có thể làm toán học bạn đã học trong lớp mẫu giáo! Nhìn vào khác ...

Lựa chọn của người biên tập

Làm thế nào để chuyển đổi kiểu thành Vector Shapes and Paths trong Photoshop CS6

Làm thế nào để chuyển đổi kiểu thành Vector Shapes and Paths trong Photoshop CS6

Theo mặc định, kiểu thường được tạo bằng công cụ Type trong Photoshop CS6 là kiểu dựa trên vector, không phải dạng bitmap, loại rasterized. Nhưng bạn cũng có thể chuyển đổi kiểu thông thường (mỗi ký tự) sang các hình dạng vectơ riêng lẻ. Bạn có thể chỉnh sửa các hình dạng như bất kỳ hình dạng được tạo ra bằng các công cụ hình dạng, bằng cách thao tác các điểm neo, và các đoạn thẳng và cong. Bạn ...

Làm thế nào để Chuyển đổi Layer trong Photoshop CS6 - núm vú

Làm thế nào để Chuyển đổi Layer trong Photoshop CS6 - núm vú

Khi ghép nhiều ảnh trong Photoshop CS6, bạn sẽ không nghi ngờ phải biến đổi các lớp trong hình ảnh của bạn để phù hợp với nó vào bố cục của bạn. May mắn thay, Photoshop làm cho việc điều chỉnh tỉ lệ dễ dàng bằng cách cung cấp cho bạn các lệnh Chuyển đổi và Chuyển đổi Miễn phí trên trình đơn Chỉnh sửa. Chuyển đổi các layer gần như giống như việc chuyển đổi các lựa chọn, ngoại trừ bạn ...

Làm thế nào để Turn một lựa chọn vào một đường dẫn trong Photoshop CS6

Làm thế nào để Turn một lựa chọn vào một đường dẫn trong Photoshop CS6

Trong khi đang làm việc trong Photoshop CS6, bạn có thể tạo đường dẫn từ các lựa chọn hiện có. Có thể bạn sẽ không sử dụng tùy chọn này gần như thường xuyên khi bạn sử dụng tùy chọn để biến một đường dẫn thành một vùng lựa chọn, nhưng tùy chọn này có sẵn. Tạo một đường dẫn từ vùng chọn có thể có ích nếu bạn cần lưu một đường dẫn ...