Trang Chủ Tài chính Cá nhân Tối ưu hóa các lựa chọn chéo xác nhận trong học máy - núm vú

Tối ưu hóa các lựa chọn chéo xác nhận trong học máy - núm vú

Video: How to Stay Out of Debt: Warren Buffett - Financial Future of American Youth (1999) 2025

Video: How to Stay Out of Debt: Warren Buffett - Financial Future of American Youth (1999) 2025
Anonim

Việc xác minh một giả thuyết học máy học có hiệu quả cho phép tối ưu hoá tiếp theo của thuật toán đã chọn của bạn. Thuật toán cung cấp hầu hết tính năng tiên đoán trên dữ liệu của bạn, cho khả năng phát hiện tín hiệu từ dữ liệu và phù hợp với hình thức chức năng đích thực của chức năng tiên đoán mà không cần overfitting và tạo ra nhiều sự khác biệt của các ước tính. Không phải mọi thuật toán học máy đều phù hợp nhất cho dữ liệu của bạn, và không một thuật toán nào có thể phù hợp với mọi vấn đề. Bạn sẽ tìm thấy đúng đối với một vấn đề cụ thể.

Nguồn cuối cùng của hiệu suất xuất phát từ tinh chỉnh các thông số siêu

999 của thuật toán, đó là các tham số mà bạn quyết định trước khi việc học xảy ra và không được học từ dữ liệu. Vai trò của họ là định nghĩa một giả thuyết, trong khi các thông số khác xác định nó một hậu nghiệm, sau khi thuật toán tương tác với dữ liệu và, bằng cách sử dụng một quá trình tối ưu hoá, thấy rằng các giá trị tham số nhất định làm việc tốt hơn trong việc có được dự đoán tốt. Các kết hợp có thể của các giá trị mà các thông số siêu có thể hình thành nên sẽ quyết định nơi nào cần tìm kiếm tối ưu hóa. Như mô tả khi thảo luận về gradient xuôi, khoảng không tối ưu hóa có thể chứa các kết hợp giá trị thực hiện tốt hơn hoặc tệ hơn. Ngay cả sau khi bạn tìm thấy một sự kết hợp tốt, bạn không chắc chắn rằng đó là lựa chọn tốt nhất. (Đây là vấn đề bị mắc kẹt trong minima cục bộ khi giảm thiểu lỗi.)

Là một cách thực tiễn để giải quyết vấn đề này, cách tốt nhất để xác minh các thông số siêu cho một thuật toán áp dụng cho dữ liệu cụ thể là kiểm tra tất cả xác nhận chéo, và để chọn sự kết hợp tốt nhất. Cách tiếp cận đơn giản này được gọi là lưới tìm kiếm cung cấp những lợi ích không thể tranh cãi được bằng cách cho phép bạn lấy mẫu các giá trị có thể để nhập vào thuật toán một cách có hệ thống và để nhận ra khi nào mức tối thiểu chung xảy ra.

Mặt khác, grid-search cũng có những hạn chế nghiêm trọng vì nó đòi hỏi nhiều tính toán (bạn có thể dễ dàng thực hiện công việc này song song trên các máy tính đa lõi hiện đại) và tốn khá nhiều thời gian. Hơn nữa, các bài kiểm tra có hệ thống và chuyên sâu làm tăng khả năng xảy ra sai sót vì một số kết quả xác nhận nhưng giả mạo có thể do tiếng ồn hiện diện trong bộ dữ liệu.

Một số lựa chọn thay thế cho lưới tìm kiếm có sẵn. Thay vì kiểm tra tất cả mọi thứ, bạn có thể thử khám phá không gian của các giá trị siêu tham số có thể được hướng dẫn bằng các kỹ thuật tối ưu hóa phi tuyến tính phức tạp và toán học phức tạp (như phương pháp Nelder-Mead) sử dụng cách tiếp cận Bayesian (số lượng các bài kiểm tra được giảm thiểu bằng cách lợi thế của các kết quả trước đó) hoặc sử dụng tìm kiếm ngẫu nhiên.

Đáng ngạc nhiên là tìm kiếm ngẫu nhiên hoạt động rất tốt, rất đơn giản để hiểu, và không chỉ dựa trên sự mù quáng, mặc dù ban đầu nó có vẻ như là như vậy. Thực tế, điểm chính của kỹ thuật này là nếu bạn chọn đủ các bài kiểm tra ngẫu nhiên, bạn thực sự có đủ khả năng để nhận ra đúng các thông số mà không lãng phí năng lượng khi kiểm tra các kết hợp hơi khác nhau của các kết hợp tương tự nhau.

Biểu đồ dưới đây giải thích lý do tại sao tìm kiếm ngẫu nhiên hoạt động tốt. Thăm dò có hệ thống, mặc dù có ích, có xu hướng kiểm tra mọi sự kết hợp, biến thành một sự lãng phí năng lượng nếu một số tham số không ảnh hưởng đến kết quả. Một tìm kiếm ngẫu nhiên thực sự kiểm tra kết hợp ít hơn nhưng nhiều hơn trong phạm vi của mỗi hyper-tham số, một chiến lược mà chứng minh chiến thắng nếu, như thường xảy ra, một số thông số quan trọng hơn những người khác.

So sánh lưới tìm kiếm với tìm kiếm ngẫu nhiên.

Để tìm kiếm ngẫu nhiên để thực hiện tốt, bạn nên thực hiện từ 15 đến tối đa 60 bài kiểm tra. Nó có ý nghĩa để nghỉ mát để tìm kiếm ngẫu nhiên nếu một lưới tìm kiếm đòi hỏi một số lượng lớn các thí nghiệm.

Tối ưu hóa các lựa chọn chéo xác nhận trong học máy - núm vú

Lựa chọn của người biên tập

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Tiếp thị web, một cách để đảm bảo khả năng hiển thị là để loại bỏ đăng ký và các hình thức đăng nhập. Khách truy cập thường phải hoàn thành các biểu mẫu này trước khi họ có thể tải xuống một số loại nội dung cao cấp, chẳng hạn như giấy trắng hoặc trước khi họ có thể đọc một số bài viết trên trang web. Các công ty đã đưa chúng vào vị trí vì họ muốn dẫn ...

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Duplicate nội dung cần tránh trong web tiếp thị và Google cung cấp công cụ để phát hiện thông tin lặp lại. Không có gì gây tổn hại cho việc tìm kiếm nội dung có liên quan của công cụ tìm kiếm cũng như tìm ra chính xác những từ giống nhau trên hai trang khác nhau. Sao chép là xấu vì những lý do này: Sao chép được sử dụng để được một chiến thuật được sử dụng để đánh lừa ...

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Trong bài hát của họ. Là một nhà tiếp thị web, việc xử lý các liên kết hỏng này có thể giúp đảm bảo sự thành công của trang web của bạn. Nếu một công cụ tìm kiếm đạt đến một liên kết bị hỏng, nó không thể tìm thấy trang bạn dự định (rõ ràng) - nhưng nó cũng có thể bỏ trên trang web của bạn hoặc giảm sự liên quan ...

Lựa chọn của người biên tập

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Số dấu phẩy động là số có các phần phân đoạn (thường được thể hiện bằng dấu thập phân). Bạn nên sử dụng một kiểu điểm nổi trong các chương trình Java bất cứ khi nào bạn cần một số có số thập phân, như là 19. 95 hoặc 3. 1415. Java có hai kiểu nguyên thủy cho các số dấu phẩy: float: Sử dụng 4 byte gấp đôi: Sử dụng 8 bytes Trong hầu hết tất cả ...

Tải phiên bản mới nhất của Java - núm vú

Tải phiên bản mới nhất của Java - núm vú

Trước khi bạn có thể viết các chương trình Java cho các thiết bị Android, bạn cần một số phần mềm công cụ, bao gồm cả phiên bản mới nhất của Java. Bạn có thể có được phiên bản Java mới nhất và lớn nhất bằng cách truy cập vào trang web Java. Trang web cung cấp một số lựa chọn thay thế. (Được giới thiệu) Nhấp chuột vào nút Free Java Download trên trang chính của trang web. Đối với hầu hết các máy tính, ...

Thử nghiệm với JShell - núm vú

Thử nghiệm với JShell - núm vú

JShell là một công cụ Java 9 cho phép bạn khám phá về lập trình. JShell làm cho nó dễ dàng để chơi xung quanh mà không sợ hậu quả thảm khốc. Các chương trình Java thường sử dụng cùng kiểu cũ, lúng túng: public class SomethingOrOther {public static void main (String args []) {Một chương trình Java đòi hỏi sự giới thiệu này bởi vì trong Java ...

Lựa chọn của người biên tập

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Bản quyền © 2014 AARP Tất cả các quyền được bảo lưu. Tâm linh và tôn giáo, tình dục, những trò vui nhộn nhịp, sự tham gia của gia đình, lối sống và tiền bạc - tất cả những điều này thường quan trọng đối với những người trên 50 tuổi, nhưng bạn có thể đặt một số cao hơn những người khác. Trong bất kỳ trường hợp nào, điều quan trọng là phải suy nghĩ về họ trước để bạn có thể thảo luận ...

Hẹn hò Sau 50: Nói về Monogami - vú

Hẹn hò Sau 50: Nói về Monogami - vú

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Một vợ một chồng là một vấn đề lớn cho dù bạn là người chưa sẵn sàng cho vợ chồng một vợ chồng và muốn hẹn hò xung quanh hay người chỉ có thể quan hệ tình dục với một người một lần. Đảm bảo đối tác hẹn hò của bạn biết bạn đang đứng ở đâu (hoặc nằm xuống) đối với vợ chồng một vợ chồng ...

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Nếu bạn bị bệnh mãn tính hoặc đe dọa đến mạng sống khi bạn còn nhỏ, bạn đã có kinh nghiệm về sức khoẻ của mình. Có thể bạn phải liên tục kể câu chuyện về vết sẹo ngực hoặc nẹp chân hoặc giải thích số ít các viên thuốc mà bạn phải dùng mỗi ngày. Nó không phải ...