Video: Sắp xếp dữ liệu trong MongoDB (Bài 6.4) 2025
Tóm tắt dữ liệu, tìm tổng số và tính trung bình và các biện pháp miêu tả khác có lẽ không mới đối với bạn. Khi bạn cần bản tóm tắt dưới dạng dữ liệu mới, chứ không phải báo cáo, quy trình được gọi là tập hợp . Dữ liệu tổng hợp có thể trở thành cơ sở để tính toán bổ sung, kết hợp với các bộ dữ liệu khác, được sử dụng dưới bất kỳ hình thức nào khác mà dữ liệu được sử dụng.
Dưới đây là ví dụ về quá trình tổng hợp dữ liệu. Tập dữ liệu chứa thông tin chung về hơn 160.000 bưu kiện của bất động sản. Dữ liệu này bao gồm nhiều mục đích sử dụng đất. Điều gì sẽ xảy ra nếu bạn muốn thấy giá trị được đánh giá trung bình cho đất trong mỗi loại sử dụng đất? Đây là cách bạn sẽ làm điều đó.
Bạn sẽ tìm thấy công cụ tổng hợp dữ liệu trong ứng dụng khai thác dữ liệu của bạn. Bạn có thể sử dụng tìm kiếm để tìm nó.
Bạn muốn thêm công cụ vào quy trình và kết nối nó với bộ dữ liệu nguồn.
Trong công cụ tổng hợp dữ liệu, bạn sẽ chọn một biến nhóm. Trong trường hợp này, đó là biến Sử dụng Đất đai, C_A_CLASS.
Sau đó bạn sẽ xác định các tóm tắt mà bạn muốn. Để có được giá trị đánh giá trung bình của mảnh đất, bạn sẽ chọn biến với các đánh giá để tóm tắt và chọn chức năng trung bình.
Khi kết hợp được thực hiện, kết quả là một tập dữ liệu mới, với một hàng cho mỗi loại hình sử dụng đất và một biến mới cho các mức trung bình được tính toán.
Sớm hay muộn, bạn sẽ cần tổng hợp một tập dữ liệu toàn bộ. Nhưng khi bạn muốn tổng số hoặc trung bình tất cả dữ liệu trong tập dữ liệu, bạn có thể gặp phải vấn đề: Biến nhóm của bạn là gì? Thủ thuật là sử dụng một biến có giá trị không đổi cho toàn bộ tập dữ liệu. Vì vậy, tạo ra một biến mà mỗi giá trị là như nhau, và sau đó sử dụng nó như là biến nhóm của bạn.