Video: 15 điều tuyệt vời bạn chưa biết về cơ thể mình 2025
Máy học tập phụ thuộc rất nhiều vào dữ liệu trong mẫu. Phần dữ liệu của bạn rất quan trọng vì bạn muốn khám phá quan điểm của thế giới, và cũng như mọi quan điểm, nó có thể sai, méo mó hoặc chỉ là một phần. Bạn cũng biết rằng bạn cần một ví dụ ngoài ví dụ để kiểm tra xem quá trình học tập đang làm việc. Tuy nhiên, những khía cạnh này chỉ là một phần của bức tranh.
Khi bạn thực hiện một thuật toán học máy tính làm việc trên dữ liệu để đoán một phản ứng nhất định, bạn đang đánh bạc một cách có hiệu quả, và đánh bạc đó không chỉ vì mẫu bạn sử dụng để học. Còn nữa. Trong thời điểm này, hãy tưởng tượng rằng bạn tự do có quyền truy cập vào các dữ liệu có mẫu, không thiên vị, vì vậy dữ liệu không phải là vấn đề. Thay vào đó bạn cần phải tập trung vào phương pháp học tập và dự đoán.
Ví dụ, bạn không thể xác định đầy đủ hành vi của con người bằng cách biết lịch sử và hành vi của họ. Có thể một ảnh hưởng ngẫu nhiên liên quan đến quá trình sinh ra hành vi của chúng ta (ví dụ như một phần không hợp lý của chúng ta), hoặc có thể vấn đề đi xuống tới ý chí tự do (vấn đề cũng là một triết lý / tôn giáo, và có nhiều quan điểm trái ngược nhau). Do đó, bạn chỉ có thể đoán được một số loại phản hồi và cho nhiều người khác, chẳng hạn như khi bạn cố gắng dự đoán hành vi của người khác, bạn phải chấp nhận một mức độ không chắc chắn nhất định mà với may mắn là chấp nhận được cho các mục đích của bạn.
Một số thuật toán có thể đoán gần như mọi thứ; những người khác thực sự có một bộ tùy chọn giới hạn. Phạm vi của các công thức toán học có thể mà một thuật toán có thể đoán là tập hợp các giả thuyết có thể có của nó. Do đó, một giả thuyết là một thuật toán, được chỉ ra trong tất cả các tham số của nó và do đó có khả năng tạo ra một công thức cụ thể.
Toán học là tuyệt vời. Nó có thể mô tả rất nhiều thế giới thực bằng cách sử dụng một số ký hiệu đơn giản và đó là cốt lõi của việc học máy vì bất kỳ thuật toán học nào có một khả năng nhất định để biểu diễn một công thức toán học.Một số thuật toán, chẳng hạn như hồi quy tuyến tính, sử dụng một cách cụ thể các công thức toán học để mô tả phản ứng như thế nào (ví dụ như giá nhà) liên quan đến một tập các thông tin dự đoán (như thông tin thị trường, vị trí nhà, vân vân).Một số công thức rất phức tạp và phức tạp cho dù mặc dù thể hiện chúng trên giấy là có thể, làm như vậy là quá khó khăn về mặt thực tế. Một số thuật toán phức tạp khác, chẳng hạn như cây quyết định, không có một công thức toán học rõ ràng, nhưng có khả năng thích ứng để chúng có thể được thiết lập để gần một phạm vi rộng các công thức dễ dàng. Ví dụ, hãy xem xét một công thức đơn giản và dễ giải thích. Sự hồi qui tuyến tính chỉ là một dòng trong một không gian của tọa độ được đưa ra bởi phản ứng và tất cả các dự báo. Trong ví dụ đơn giản nhất, bạn có thể có đáp ứng, y, và một dự đoán duy nhất, x, với công thức
y = β
1
x 1 + β 0 Trong một tình huống đơn giản của một phản ứng dự đoán bởi một tính năng duy nhất, mô hình như vậy là hoàn hảo khi dữ liệu của bạn sắp xếp chính nó như một dòng. Tuy nhiên, những gì xảy ra nếu nó không và thay vào đó hình dạng chính nó như một đường cong? Để đại diện cho tình hình, chỉ cần quan sát các biểu diễn hai chiều sau đây. Ví dụ về một mô hình tuyến tính đang vật lộn để vẽ bản đồ một hàm đường cong.
Khi điểm giống với đường kẻ hoặc đám mây, một số lỗi xảy ra khi bạn tính ra rằng kết quả là một đường thẳng; do đó việc lập bản đồ được cung cấp bởi công thức trước đó bằng cách nào đó không chính xác. Tuy nhiên, lỗi này không xuất hiện một cách có hệ thống nhưng thay vì ngẫu nhiên bởi vì một số điểm nằm trên đường được lập bản đồ và những điểm khác nằm dưới nó. Tình hình với các đám mây có hình dạng cong, các điểm khác nhau, bởi vì thời gian này, đường đôi khi chính xác nhưng vào những thời điểm khác là có hệ thống sai. Đôi khi điểm luôn ở trên đường dây; đôi khi chúng nằm dưới nó.
Với sự đơn giản của bản đồ phản hồi, thuật toán của bạn có xu hướng đánh giá quá cao hoặc đánh giá thấp các quy tắc thực đằng sau dữ liệu, đại diện cho sự thiên vị của nó. Sự thiên vị là đặc trưng của các thuật toán đơn giản mà không thể biểu hiện các công thức toán học phức tạp.