Mục lục:
Video: (Vietsub) Li Fei Fei on TedTalk: Ứng dụng của Thị giác máy tính 2025
Hệ thống các nhà phân tích tiên đoán dựa trên nội dung chủ yếu phù hợp các tính năng (các từ khóa được gắn thẻ) giữa các mục tương tự và hồ sơ của người dùng để đưa ra các khuyến nghị. Khi người dùng mua một mặt hàng đã gắn thẻ các tính năng, các mục có các tính năng phù hợp với sản phẩm của mục gốc sẽ được đề xuất. Các tính năng phù hợp hơn, cao hơn xác suất người dùng sẽ thích đề nghị. Mức độ xác suất này được gọi là độ chính xác .
Khái niệm cơ bản của thẻ để mô tả các mục
Nói chung, công ty thực hiện việc bán hàng (hoặc nhà sản xuất) thường đánh dấu các mặt hàng của nó bằng từ khoá. Tuy nhiên, trên trang web của Amazon, khá phổ biến không bao giờ nhìn thấy các thẻ cho bất kỳ mục nào được mua hoặc xem - và thậm chí không được yêu cầu gắn thẻ một mặt hàng. Khách hàng có thể xem lại các mặt hàng mà họ đã mua, nhưng không giống như gắn thẻ.
Việc gắn thẻ có thể là một thách thức cho một cửa hàng như Amazon với nhiều mặt hàng. Ngoài ra, một số thuộc tính có thể là chủ quan và có thể được gắn thẻ không chính xác, tùy thuộc vào thẻ nào đó. Một giải pháp giải quyết vấn đề nhân rộng là cho phép khách hàng hoặc công chúng nói đến các mặt hàng đó.
Để giữ các thẻ có thể quản lý được và chính xác, một trang web có thể cung cấp một bộ thẻ chấp nhận được. Chỉ khi một số người dùng thích hợp đồng ý (nghĩa là sử dụng cùng một thẻ để mô tả một mục), thì thẻ được đồng ý sẽ được sử dụng để mô tả mục đó.
Việc gắn thẻ dựa trên người dùng làm tăng các vấn đề khác đối với hệ thống lọc nội dung (và lọc cộng tác):
-
Độ tin cậy: Không phải tất cả khách hàng đều nói sự thật (đặc biệt là trực tuyến) và người dùng có chỉ có một lịch sử xếp hạng nhỏ có thể nghiêng dữ liệu. Ngoài ra, một số nhà cung cấp có thể cung cấp (hoặc khuyến khích người khác cung cấp) xếp hạng tích cực cho các sản phẩm của họ trong khi đưa ra xếp hạng tiêu cực cho sản phẩm của đối thủ cạnh tranh.
-
Thưa thớt: Không phải tất cả các mục sẽ được đánh giá hoặc sẽ có đủ thứ để tạo ra dữ liệu hữu ích.
-
Sự không thống nhất: Không phải tất cả người dùng đều sử dụng cùng một từ khóa để tag một mặt hàng, mặc dù ý nghĩa có thể giống nhau. Ngoài ra, một số thuộc tính có thể chủ quan. Ví dụ: một người xem phim có thể xem xét nó trong khi người khác nói rằng quá dài.
Thuộc tính cần có định nghĩa rõ ràng. Một thuộc tính với quá ít ranh giới rất khó đánh giá; áp đặt quá nhiều quy tắc về thuộc tính có thể yêu cầu người dùng làm quá nhiều công việc, điều này sẽ không khuyến khích họ gắn thẻ.
Gắn thẻ hầu hết các mục trong một danh mục sản phẩm có thể giúp giải quyết vấn đề bắt đầu lạnh gây ra sự hợp tác lọc.Tuy nhiên, trong một thời gian, độ chính xác của các khuyến nghị của hệ thống sẽ thấp cho đến khi nó tạo ra hoặc có được hồ sơ người dùng.
Dưới đây là mẫu ma trận của khách hàng và các mặt hàng đã mua của họ, cho thấy một ví dụ về lọc nội dung.
Tính năng 1 | X | Mục 2 | Tính năng 1 | Tính năng 2 | Tính năng 3 |
---|---|---|---|---|---|
Tính năng 4 | Tính năng 5 | X | |||
X | Mục 3 | X | |||
X | X | Mục 4 | X | ||
X | X | Mục 5 | X > X | ||
X | Ở đây, nếu người dùng thích tính năng 2 - và nó được ghi trong hồ sơ của cô ấy - hệ thống sẽ đề xuất tất cả các mục có Điểm 2 trong đó: Mục 1, Mục 2 và Mục 4. > Phương pháp này hoạt động ngay cả khi người dùng chưa bao giờ mua hoặc xem lại một mặt hàng. Hệ thống sẽ chỉ tìm trong cơ sở dữ liệu sản phẩm cho bất kỳ mục nào đã được gắn nhãn Tính năng 2. Nếu (ví dụ) người dùng đang tìm kiếm phim với Audrey Hepburn - và tùy chọn đó xuất hiện trong hồ sơ của người dùng - hệ thống sẽ đề xuất tất cả các bộ phim có tính năng Audrey Hepburn cho người dùng này. | Ví dụ này, tuy nhiên, nhanh chóng đưa ra một giới hạn của kỹ thuật lọc dựa trên nội dung: Người dùng có thể đã biết về tất cả các bộ phim Audrey Hepburn đã được vào, hoặc có thể dễ dàng tìm ra - vì vậy, từ quan điểm của người dùng, hệ thống đã không đề nghị bất cứ điều gì mới hoặc giá trị. | Làm thế nào để nâng cao độ chính xác với phản hồi liên tục |
Một cách để nâng cao độ chính xác của các khuyến nghị của hệ thống là yêu cầu khách hàng phản hồi bất cứ khi nào có thể. Thu thập phản hồi của khách hàng có thể được thực hiện theo nhiều cách khác nhau, thông qua nhiều kênh. Một số công ty yêu cầu khách hàng đánh giá một mặt hàng hoặc dịch vụ sau khi mua. Các hệ thống khác cung cấp liên kết theo kiểu truyền thông xã hội để khách hàng có thể "thích" hoặc "không thích" một sản phẩm. Sự tương tác giữa
Cách đo lường hiệu quả của các khuyến nghị hệ thống
Sự thành công của các khuyến nghị của hệ thống phụ thuộc vào mức độ đáp ứng hai tiêu chí:
độ chính xác
(nghĩ về nó như là một bộ kết hợp hoàn hảo - thường là một bộ nhỏ) và
nhớ lại
(suy nghĩ về nó như là một tập các kết hợp có thể xảy ra - thường là một bộ lớn hơn). Dưới đây là một cái nhìn gần hơn: Độ chính xác đo lường mức độ chính xác của hệ thống khuyến cáo đã được. Độ chính xác rất khó đo lường bởi vì nó có thể chủ quan và khó định lượng được. Ví dụ: khi người dùng lần đầu truy cập vào trang web của Amazon, Amazon có thể chắc chắn liệu các khuyến nghị của nó có nhắm mục tiêu không? Một số đề xuất có thể kết nối với lợi ích của khách hàng nhưng khách hàng vẫn không thể mua. Sự tự tin cao nhất rằng một khuyến nghị chính xác đến từ bằng chứng rõ ràng: Khách hàng mua mặt hàng. Ngoài ra, hệ thống có thể yêu cầu người dùng đánh giá đề xuất của mình một cách rõ ràng. Nhớ lại
-
đo lường các khuyến nghị tốt có thể có trong hệ thống của bạn. Hãy nghĩ đến việc thu hồi lại như một bản kiểm kê các đề xuất có thể, nhưng không phải tất cả đều là những đề xuất hoàn hảo. Nói chung, có mối quan hệ ngược với độ chính xác và sự thu hồi. Nghĩa là, khi thu hồi lại, độ chính xác đi xuống và ngược lại. Hệ thống lý tưởng sẽ có độ chính xác cao và khả năng thu hồi cao. Nhưng thực tế, kết quả tốt nhất là đạt được một sự cân bằng tinh tế giữa hai người. Nhấn mạnh tính chính xác hoặc thu hồi thực sự phụ thuộc vào vấn đề bạn đang cố gắng để giải quyết.