Video: Chuyên gia 13 tuổi ‘hack’ máy bay không người lái (VOA) 2025
Dữ liệu riêng tư là một vấn đề lớn đối với các thợ mỏ dữ liệu. Báo cáo đưa ra mức độ dữ liệu cá nhân trong tay của Cơ quan An ninh Quốc gia của Hoa Kỳ và việc vi phạm các nguồn dữ liệu thương mại đã nâng cao nhận thức và quan tâm của công chúng.
Một khái niệm trung tâm về bảo mật dữ liệu là thông tin nhận dạng cá nhân (PII) hoặc bất kỳ dữ liệu nào có thể được truy nguồn từ cá nhân mà nó mô tả. PII bao gồm các số nhận dạng rõ ràng như tên, số thẻ tín dụng và số an sinh xã hội, và hầu hết các thợ mỏ dữ liệu đều biết rằng loại dữ liệu này là riêng tư và phải được chăm sóc cẩn thận. Nhưng PII đề cập đến nhiều hơn những chỉ số nhận dạng rõ ràng này.
Bất kỳ dữ liệu nào có thể được sử dụng để xác định một cá nhân, ngay cả khi làm như vậy đòi hỏi phải sử dụng một vài trường kết hợp hoặc thao tác dữ liệu theo cách nào đó cũng là PII. Thật dễ dàng cho những người khai thác dữ liệu để bỏ qua loại dữ liệu này, loại mà không xuất hiện trên bề mặt để được tư nhân, và có thể là đủ để nhận dạng cá nhân nếu nó đã được thao tác cho mục đích đó. Nếu có bất kỳ cách nào mà dữ liệu có thể được thao tác để xác định cá nhân, nó phải được xử lý với các biện pháp phòng ngừa giống như bạn sẽ đưa ra một danh sách các số thẻ tín dụng.
Đó là nơi các thợ mỏ dữ liệu có thể dễ dàng gặp rắc rối. Có nhiều cách để xác định cá nhân nếu bạn thực hiện một ít nỗ lực để làm như vậy. Trong một ví dụ đáng chú ý, AOL Research đã phát hành hồ sơ tìm kiếm người dùng cho việc sử dụng nghiên cứu. Dữ liệu được dự định là vô danh, không có tên trong đó, nhưng The New York Times báo cáo rằng nó đã có thể xác định một cá nhân từ dữ liệu tìm kiếm bằng cách tham khảo chéo với danh sách điện thoại. Sau đó, Netflix đã đưa ra dữ liệu đánh giá phim để sử dụng trong một cuộc thi, và nó đã sớm được tiết lộ rằng dữ liệu này cũng có thể được sử dụng để xác định cá nhân.
Vì vậy, làm thế nào bạn có thể ngăn ngừa thiên tai như thế này? Đừng cố gắng làm điều đó một mình. Khó khăn để đảm bảo tuân thủ tất cả các luật về bảo mật dữ liệu liên quan, không kể đến thực tiễn kinh doanh tốt khác. Jenny Juliany, Phó chủ tịch của Solutions Architecture và đồng sáng lập của Intreis, nhà tích hợp giải pháp chuyên về quản lý dịch vụ và tự động hóa tuân thủ, mô tả vòng đời của dữ liệu với sự tương đồng với bốn mùa:Spring:
-
Inception, dữ liệu được tạo ra. Mùa hè:
-
Primetime, dữ liệu đang được sử dụng. Mùa thu:
-
Hưu trí, dữ liệu không còn phù hợp hoặc sử dụng, nhưng có thể có các lý do pháp lý hoặc các lý do khác để giữ lại. Mùa đông:
-
Loại bỏ, dữ liệu bị hủy. Mỗi mùa có những đặc trưng riêng, với những yêu cầu riêng biệt về quyền riêng tư dữ liệu. Một số được dựa trên luật pháp, một số khác theo nghĩa thông thường và những người khác trong các thỏa thuận cá nhân với khách hàng và thực tiễn kinh doanh của nhà tuyển dụng của bạn. Không thực tế khi bạn tin rằng bạn có thể thực hiện tất cả những chi tiết tuân thủ này ngoài vai trò chính của mình, vì vậy bạn phải cộng tác với các chuyên gia quản lý dữ liệu của tổ chức của bạn.
Bạn không muốn là trung tâm của vụ bê bối riêng tư dữ liệu lớn tiếp theo. Tôn trọng bảo mật dữ liệu và quản lý dữ liệu thích hợp là chìa khóa để giảm thiểu rủi ro đó. Đừng chờ đợi cho đến khi có sự cố xảy ra, hãy liên hệ với chuyên gia bảo mật dữ liệu trong tổ chức của bạn ngay hôm nay và bắt đầu xây dựng mối quan hệ hợp tác làm việc để quản lý đúng các dữ liệu nhạy cảm.
Chi tiết về vòng đời dữ liệu từ Jenny Juliany trong Four Seasons of Data Management có thể được tìm thấy ở đây:
Spring 'Inception
-
' Summer 'Primetime
-
' Fall 'Retirement
-
' Winter 'Loại bỏ