Trang Chủ Tài chính Cá nhân Các giới hạn của dữ liệu đánh giá trong quá trình học máy - núm vú

Các giới hạn của dữ liệu đánh giá trong quá trình học máy - núm vú

Video: Clip học sinh vào nhà nghỉ | Camera giấu kín | ANTV 2025

Video: Clip học sinh vào nhà nghỉ | Camera giấu kín | ANTV 2025
Anonim

Dữ liệu đánh giá có những hạn chế trong học tập máy. và khác với bạn.Nhận được dữ liệu đánh giá cho phép một hệ thống recommender để học hỏi từ những kinh nghiệm của nhiều khách hàng.Đánh giá dữ liệu có thể lấy được từ phán đoán (như đánh giá một sản phẩm bằng cách sử dụng các ngôi sao hoặc số) hoặc một sự thực (một nhị phân 1/0 mà chỉ đơn giản cho biết bạn đã mua sản phẩm, xem một bộ phim, hoặc ngừng duyệt qua một trang web nhất định).

Bất kể nguồn hoặc loại dữ liệu, dữ liệu đánh giá luôn là về các hành vi. Để đánh giá một bộ phim, bạn phải quyết định xem nó, xem nó, và đánh giá nó dựa trên kinh nghiệm của bạn khi xem phim. Các hệ thống recommender thực tế học từ dữ liệu đánh giá theo những cách khác nhau:

  • Lọc hợp tác: Các trận đấu người đánh giá dựa trên sự giống nhau về sản phẩm hoặc phim được sử dụng trong quá khứ.Bạn có thể nhận được đề xuất dựa trên các mục thích bởi những người tương tự như bạn hoặc trên các mục tương tự như những người bạn thích.
  • Lọc nội dung: Không vượt qua thực tế là bạn đã xem một bộ phim. Nó kiểm tra các tính năng liên quan đến bạn và bộ phim để xác định liệu một đối sánh có tồn tại hay không dựa trên các danh mục lớn hơn mà các tính năng này đại diện. Ví dụ: nếu bạn là phụ nữ thích phim hành động, người giới thiệu sẽ tìm kiếm đề xuất bao gồm giao điểm của hai loại này.
  • Kiến nghị dựa trên kiến ​​thức: Dựa trên siêu dữ liệu, chẳng hạn như các sở thích được thể hiện bởi người dùng và mô tả sản phẩm. Nó phụ thuộc vào học máy và có hiệu quả khi bạn không có đủ dữ liệu về hành vi để xác định đặc tính của người dùng hoặc sản phẩm. Đây được gọi là khởi động lạnh và đại diện cho một trong những nhiệm vụ giới thiệu khó nhất vì bạn không có quyền truy cập vào lọc cộng tác hoặc lọc dựa trên nội dung.

Khi sử dụng bộ lọc cộng tác, bạn cần phải tính tương tự. Ngoài Euclidean, Manhattan, và Chebyshev khoảng cách, phần còn lại của thông tin này thảo luận về sự giống nhau cô sin. Sự tương tự cosin đo khoảng cách cosine góc giữa hai vectơ, điều này có vẻ như là một khái niệm khó nắm bắt nhưng chỉ là một cách để đo góc trong không gian dữ liệu.

Hãy tưởng tượng một không gian có các tính năng và có hai điểm. Bạn có thể đo khoảng cách giữa các điểm. Ví dụ, bạn có thể sử dụng khoảng cách Euclide, đây là sự lựa chọn hoàn hảo khi bạn có ít kích thước, nhưng không thành công khi bạn có nhiều kích thước do sự nguyền rủa chiều kích.

Ý tưởng đằng sau khoảng cách cosine là sử dụng góc tạo bởi hai điểm nối với nguồn không gian (điểm mà tất cả các chiều không bằng nhau) thay thế. Nếu các điểm gần, góc hẹp, cho dù có bao nhiêu kích thước. Nếu chúng ở xa, góc là khá lớn.

Sự giống nhau về cosin thực hiện khoảng cách cosin theo tỷ lệ phần trăm và khá hiệu quả trong việc nói liệu một người dùng có giống người khác hay liệu một bộ phim có thể được liên kết với nhau hay không bởi vì những người sử dụng tương tự ủng hộ nó. Ví dụ sau xác định những bộ phim tương tự nhất cho phim 50, Star Wars.

print (colins (MovieLense [50]))

[1] "Chiến tranh giữa các vì sao (1977)"

similar_movies <- tương tự (MovieLense [50],

MovieLense [-50],

method = "cosine",

which = "items")

colnames (similar_movies) [which (similar_movies> 0.70)]

[1] "Toy Story (1995)" < (1981) "

" Sự trở về của Jedi (1983) "

Các giới hạn của dữ liệu đánh giá trong quá trình học máy - núm vú

Lựa chọn của người biên tập

Cách lọc một nguồn dữ liệu kết hợp trong Word 2013 - núm vú

Cách lọc một nguồn dữ liệu kết hợp trong Word 2013 - núm vú

Trong tài liệu Word 2013, lọc một nguồn dữ liệu loại trừ các bản ghi nhất định (hoặc xem một cách khác, nó chỉ bao gồm một số bản ghi) dựa trên một hoặc nhiều tiêu chí mà bạn chỉ định. Ví dụ: bạn có thể muốn chỉ bao gồm các địa chỉ từ một thành phố hoặc tiểu bang nhất định, hoặc chỉ những địa chỉ phù hợp với địa chỉ ...

Cách Tìm Stuff bạn không thể gõ trong Word 2007 - núm vú

Cách Tìm Stuff bạn không thể gõ trong Word 2007 - núm vú

Word 2007 giúp tìm các ký tự đặc biệt, không in được trong tài liệu của bạn. Sử dụng hộp thoại Tìm và Thay thế, bạn có thể tìm kiếm những thứ như tab, dấu phân cách, dấu thập phân, khoảng trống và những thứ khác mà bạn không thể tạo ra từ bàn phím. Gọi hộp thoại Tìm và Thay thế. Nếu cần thiết, hãy nhấp vào nút Thêm để ...

Cách Tìm Định dạng trong Word 2007 - núm vú

Cách Tìm Định dạng trong Word 2007 - núm vú

Bạn có thể sử dụng lệnh Tìm để đánh cắp tài liệu Word 2007 của bạn để định dạng thông tin. Ví dụ, nếu bạn chỉ muốn tìm những trường hợp của từ lie có chữ đậm, bạn có thể làm điều đó. Ví dụ này tìm kiếm trứng ngỗng văn bản với kích thước phông chữ là 24 điểm trong một ...

Lựa chọn của người biên tập

Làm thế nào để Thoả Nhận Hợp Đồng Máy chủ Web - núm vú

Làm thế nào để Thoả Nhận Hợp Đồng Máy chủ Web - núm vú

Trên thực tế, đa số của máy chủ web không hoàn lại tiền nếu bạn để lại trước khi thời hạn hợp đồng của bạn kết thúc. Trong thực tế, nếu bạn có một thỏa thuận giá rẻ trên hosting của bạn, nó có thể có các điều khoản và điều kiện yêu cầu bạn xem ra thời hạn của hợp đồng hoặc trả tiền cho đặc quyền ...

Cách quản lý tập tin với Control Panel của Website - núm vú

Cách quản lý tập tin với Control Panel của Website - núm vú

Bảng điều khiển của bạn cung cấp cho bạn một cách tiện dụng để quản lý các tệp của bạn mà không cần máy chủ FTP được lưu trữ trên web. Đây là một cái gì đó phổ biến cho hầu hết các bảng điều khiển nhưng đôi khi có nhãn khác nhau một chút. Ví dụ, hầu hết các máy chủ gọi nó là File Manager, nhưng DreamHost gọi nó là webFTP. Sử dụng Trình quản lý Tệp là

Cách Quản lý Người dùng với Quản lý Máy chủ Web - núm vú

Cách Quản lý Người dùng với Quản lý Máy chủ Web - núm vú

Cây thư mục riêng trên máy chủ nơi tập tin của nó được giữ. Là chủ sở hữu của máy chủ, bạn có quyền truy cập superuser cho toàn bộ máy chủ, có nghĩa là bạn có thể xem tất cả các tệp tin của chủ tài khoản khác. Tất cả các tập tin tài khoản được lưu giữ trong các thư mục bên trong một thư mục gọi là home, ...

Lựa chọn của người biên tập

Tạo một Cột trang web mới trong SharePoint 2010 - núm vú

Tạo một Cột trang web mới trong SharePoint 2010 - núm vú

SharePoint 2010 có một thực thể cột trang web cho phép bạn để sử dụng lại các cột trên nhiều danh sách. Khi bạn tạo một cột mới trong danh sách của mình, bạn tạo ra một cột danh sách - có nghĩa cột chỉ có thể được sử dụng trong danh sách đó. Các cột của trang web được tạo ở cấp cao nhất của trang web nhóm của bạn và có thể ...

Tạo Tuỳ chỉnh Chủ đề cho SharePoint 2010 Sử dụng PowerPoint - núm vú

Tạo Tuỳ chỉnh Chủ đề cho SharePoint 2010 Sử dụng PowerPoint - núm vú

Cho nhiều nhà thiết kế trang web và chủ sở hữu SharePoint 2010 , ý tưởng để có thể tùy chỉnh chủ đề của họ là rất thú vị. Mặt khác, nhiệm vụ chọn nhiều màu có thể có vẻ khó chịu với những người biết họ thích gì khi họ nhìn thấy nó nhưng gặp sự cố khi lựa chọn. Nếu bạn ở trong ...

Tạo trang web mới trong SharePoint 2010 - núm vú

Tạo trang web mới trong SharePoint 2010 - núm vú

Bạn có thể tạo một bộ sưu tập trang web mới trong SharePoint theo hai cách - bằng cách sử dụng Quản trị Trung tâm hoặc thông qua Tạo trang web Tự phục vụ. Sử dụng Quản trị Trung tâm đòi hỏi các quyền được cấp phép, thường là hạn chế đối với nhân viên CNTT. Tạo trang web tự tạo là một tính năng của SharePoint cho phép CNTT trao quyền cho việc tạo bộ sưu tập trang web mới ...