Trang Chủ Tài chính Cá nhân ĐàO tạo, xác nhận và kiểm tra trong học máy - những con vú

ĐàO tạo, xác nhận và kiểm tra trong học máy - những con vú

Video: [HD] Livestream 1 - Trở thành Phi công...bắt đầu từ đâu? 2025

Video: [HD] Livestream 1 - Trở thành Phi công...bắt đầu từ đâu? 2025
Anonim

Trong một thế giới hoàn hảo, bạn có thể thực hiện một bài kiểm tra về dữ liệu mà thuật toán học máy của bạn chưa bao giờ học được từ trước. Tuy nhiên, chờ đợi dữ liệu mới không phải lúc nào cũng khả thi về mặt thời gian và chi phí.

Như một biện pháp khắc phục đơn giản đầu tiên, bạn có thể chia ngẫu nhiên dữ liệu của bạn thành tập huấn luyện và bộ kiểm tra. Sự phân chia thông thường là từ 25 đến 30 phần trăm cho thử nghiệm và 75 đến 70 phần trăm còn lại cho đào tạo. Bạn chia nhỏ dữ liệu của mình bao gồm phản ứng và các tính năng của bạn cùng lúc, giữ sự tương ứng giữa mỗi phản hồi và các tính năng của nó.

Phương pháp thứ hai xảy ra khi bạn cần điều chỉnh thuật toán học tập của bạn. Trong trường hợp này, dữ liệu chia tách thử nghiệm không phải là một thực hành tốt bởi vì nó gây ra một kiểu overfitting khác được gọi là snooping. Để khắc phục snooping, bạn cần một phân chia thứ ba, được gọi là bộ xác nhận hợp lệ. Phân chia được đề xuất là để các ví dụ của bạn được phân chia thành phần ba: 70 phần trăm cho đào tạo, 20 phần trăm cho xác nhận và 10 phần trăm cho thử nghiệm.

Bạn nên thực hiện phân chia ngẫu nhiên, tức là, bất kể thứ tự ban đầu của dữ liệu. Nếu không, kiểm tra của bạn sẽ không đáng tin cậy, vì đặt hàng có thể gây ra đánh giá quá mức (khi có một số đặt hàng có ý nghĩa) hoặc đánh giá thấp (khi phân phối khác quá nhiều). Như một giải pháp, bạn phải đảm bảo rằng sự phân bố tập kiểm tra không phải là rất khác nhau so với phân phối đào tạo, và thứ tự sắp đặt xảy ra trong dữ liệu chia nhỏ.

Ví dụ: kiểm tra xem số nhận dạng (nếu có) có liên tục trong bộ của bạn không. Đôi khi, ngay cả khi bạn thực sự tuân thủ việc lấy mẫu ngẫu nhiên, bạn không thể luôn luôn có được sự phân bố tương tự giữa các bộ, đặc biệt là khi số lượng ví dụ của bạn là nhỏ.

Khi số ví dụ của bạn n cao, chẳng hạn như n> 10, 000, bạn có thể khá tự tin tạo ra một bộ dữ liệu ngẫu nhiên chia tách. Khi bộ dữ liệu nhỏ hơn, so sánh các số liệu thống kê cơ bản như trung bình, chế độ, trung bình, và sai lệch giữa phản hồi và các tính năng trong tập huấn luyện và kiểm tra sẽ giúp bạn hiểu liệu bộ test có không phù hợp không. Khi bạn không chắc chắn rằng việc chia tách là đúng, chỉ cần tính lại một kết quả mới.

ĐàO tạo, xác nhận và kiểm tra trong học máy - những con vú

Lựa chọn của người biên tập

Hiểu Các công cụ vẽ InDesign CS5 - núm vú

Hiểu Các công cụ vẽ InDesign CS5 - núm vú

Thêm các bản vẽ cho InDesign Creative Suite 5 ấn phẩm với các công cụ vẽ của InDesign. Với những công cụ này, bạn sử dụng nét để phác thảo và điền vào các hình dạng màu sắc và để vẽ đường. Các vật thể được rút ra được tạo thành từ các điểm và phân đoạn. Hiểu được mục đích của các công cụ vẽ InDesign CS5 là bước đầu tiên để học làm thế nào để ...

Sử dụng hướng dẫn và chụp nhanh trong InDesign CS5 - núm vú

Sử dụng hướng dẫn và chụp nhanh trong InDesign CS5 - núm vú

Khi bạn tạo bố cục trang trong InDesign Creative Suite 5 , sử dụng hướng dẫn với chức năng bật chụp giúp bạn sắp xếp các phần tử trên trang và các đối tượng vị trí trong cách bố trí. Việc sắp xếp các đối tượng bằng cách đánh mắt họ rất khó bởi vì bạn thường không thể biết liệu một đối tượng nằm ngoài vị trí của một lượng nhỏ trừ khi bạn phóng to ...

Bằng cách sử dụng Bảng Chuyển đổi để Điều khiển Khung văn bản InDesign CS5 - núm vú

Bằng cách sử dụng Bảng Chuyển đổi để Điều khiển Khung văn bản InDesign CS5 - núm vú

Bạn có thể tự di chuyển hoặc thay đổi kích cỡ khung văn bản InDesign Creative Suite 5. Để thay đổi vị trí của khung hoặc kích thước của nó một cách chính xác hơn, thay vào đó hãy sử dụng bảng chuyển đổi. Chọn Window → Object và Layout → Transform. Bảng điều khiển chuyển đổi xuất hiện. Thay đổi các giá trị trong các trường văn bản X và Y. Khung được di chuyển tương ứng, tránh xa phía trên ...

Lựa chọn của người biên tập

Rối loạn mất cân bằng tâm trạng với rối loạn lưỡng cực - núm vú

Rối loạn mất cân bằng tâm trạng với rối loạn lưỡng cực - núm vú

DSM-5 đưa ra một chẩn đoán mới phát triển đối với trẻ em bị rối loạn tâm trạng mãn tính - khó chịu và các cơn bộc phát cảm xúc / hành vi. Khái niệm rối loạn tâm trạng kinh niên đã chồng chéo với chẩn đoán rối loạn lưỡng cực, nhưng chúng không giống nhau.

Lựa chọn của người biên tập

Cấu hình kết nối mạng cho Windows 10 - núm vú

Cấu hình kết nối mạng cho Windows 10 - núm vú

Cửa sổ thường phát hiện sự hiện diện của một bộ điều hợp mạng tự động; thông thường, bạn không phải cài đặt trình điều khiển thiết bị theo cách thủ công cho bộ điều hợp. Khi Windows phát hiện ra một bộ điều hợp mạng, Windows sẽ tự động tạo một kết nối mạng và định cấu hình nó để hỗ trợ các giao thức mạng cơ bản. Bạn có thể cần phải thay đổi cấu hình của một kết nối mạng bằng tay, tuy nhiên. ...

Kết nối mạng của bạn với các đường dây tư nhân tốc độ cao - núm vú

Kết nối mạng của bạn với các đường dây tư nhân tốc độ cao - núm vú

Nếu mạng của bạn lớn và high- tốc độ truy cập Internet là một ưu tiên cao, liên hệ với công ty điện thoại địa phương của bạn (hoặc các công ty) về cài đặt một đường dây tốc độ cao chuyên dụng. Các dòng này có thể làm bạn tốn kém (theo thứ tự hàng trăm đô la mỗi tháng), do đó chúng phù hợp nhất cho các mạng lớn, trong đó có 20 người dùng trở lên ...

Giải pháp của công ty dành cho sao lưu và phục hồi thiết bị di động - núm vú

Giải pháp của công ty dành cho sao lưu và phục hồi thiết bị di động - núm vú

Các tùy chọn sao lưu và phục hồi dữ liệu khác nhau một thiết bị khác. Hầu hết các nhà cung cấp hệ điều hành và thiết bị đều cung cấp các ứng dụng phần mềm để tạo thuận lợi cho việc sao lưu và khôi phục các tính năng trên thiết bị của họ.