Video: Đánh giá dự án ICO Kelta 2025
Khai thác dữ liệu có những yêu cầu rất nghiêm ngặt về tổ chức dữ liệu. Đây không phải là yêu cầu kỳ lạ, phức tạp, hoặc khó khăn để đáp ứng, nhưng chúng rất nghiêm ngặt. Hình này cho thấy một mẫu dữ liệu được xem dưới dạng một bảng trong phần mềm khai thác dữ liệu.
Mỗi hàng đại diện cho một bưu kiện bất động sản. Thông tin về các thửa bất động sản được tổ chức thành các cột. Cột đầu tiên chứa mã số thuế (TAXKEY), cột thứ hai chứa giá trị được đánh giá của đất đai từ một đánh giá trước (P_A_LAND), v.v …
Mỗi mục trong một hàng liên quan đến một thửa đất cụ thể. Mỗi mục nhập trong bất kỳ cột nào là cùng một loại thông tin. Không có hàng hoặc cột được để trống vì các lý do liên quan đến phong cách và dễ đọc. Dữ liệu này được tổ chức hợp lý để điều tra sự khác biệt giữa các thửa bất động sản.
Nếu thay vì bất động sản, bạn điều tra người, mỗi người sẽ được đại diện bởi một hàng trong dữ liệu, và tất cả các chi tiết về người sẽ được tổ chức thành các cột. Nếu bạn điều tra tia X ngực, mỗi tia X ngực sẽ được đại diện bởi một hàng trong dữ liệu, và tất cả các chi tiết về tia X ngực sẽ được tổ chức thành các cột.
Trong thuật ngữ phân tích số liệu, những thứ mà bạn đang nghiên cứu - những thứ trong các hàng - được gọi là hồ sơ hoặc. Và các chi tiết về chúng, nằm trong các cột, được gọi là các biến . Bạn cũng sẽ nghe các cột được gọi là lĩnh vực, đặc biệt là trong bối cảnh cơ sở dữ liệu. Vì vậy, khai thác dữ liệu yêu cầu dữ liệu được tổ chức với một hàng cho mỗi trường hợp và một cột cho mỗi biến. Nhiều nguồn dữ liệu đã được tổ chức theo cách này. Thống kê tổ chức dữ liệu theo cách này theo thói quen. Các chuyên gia cơ sở dữ liệu có thể không sử dụng cách tiếp cận này cho phần lớn công việc của họ, nhưng họ thường hiểu điều bạn muốn nếu bạn gọi nó là một bảng phẳng .