Mục lục:
- Báo cáo bảng tính làm cho các mô hình dữ liệu không hiệu quả
- Các tập tin dữ liệu phẳng cho phép các kiểu dữ liệu dễ dàng hơn
- Bộ dữ liệu dạng bảng là hoàn hảo cho các mô hình dữ liệu trục pivot
Video: Tổng hợp dữ liệu từ nhiều sheet trong Excel có cấu trúc giống nhau 2025
Là khối xây dựng cho các báo cáo của Excel, dữ liệu trong các mô hình dữ liệu của bạn cần được cấu trúc phù hợp. Không phải tất cả các bộ dữ liệu đều được tạo ra bằng nhau. Mặc dù một số bộ dữ liệu hoạt động trong môi trường Excel tiêu chuẩn, nhưng chúng có thể không hoạt động vì các mục đích mô hình hóa dữ liệu. Trước khi xây dựng mô hình dữ liệu của bạn, đảm bảo rằng dữ liệu nguồn của bạn được cấu trúc phù hợp cho các mục đích bảng điều khiển.
Ở mức nguy cơ đơn giản hóa, các bộ dữ liệu thường được sử dụng trong Excel có ba dạng cơ bản:
-
Báo cáo bảng tính
-
Tập tin dữ liệu phẳng
-
Tập dữ liệu dạng bảng
Dây đấm là chỉ các tệp dữ liệu phẳng và các tập dữ liệu dạng bảng làm cho các mô hình dữ liệu có hiệu quả.
Báo cáo bảng tính làm cho các mô hình dữ liệu không hiệu quả
Báo cáo bảng tính hiển thị dữ liệu tóm tắt được định dạng cao và thường được thiết kế như công cụ trình bày cho người dùng quản lý hoặc điều hành. Một báo cáo bảng tính điển hình sử dụng hợp lý không gian trống để định dạng, lặp lại dữ liệu cho các mục đích thẩm mỹ, và chỉ trình bày phân tích cấp cao. Hình dưới đây mô tả báo cáo bảng tính.
Mặc dù báo cáo bảng tính có thể đẹp, nhưng nó không làm cho một mô hình dữ liệu hiệu quả. Tại sao? Lý do chính là các báo cáo này không cung cấp cho bạn sự tách biệt dữ liệu, phân tích và trình bày. Bạn chủ yếu bị khóa vào một phân tích.
Mặc dù bạn có thể tạo biểu đồ từ báo cáo được hiển thị, sẽ không thực tế khi áp dụng bất kỳ phân tích nào bên ngoài những gì đã có. Ví dụ: bạn tính toán và trình bày mức trung bình của tất cả doanh số bán xe đạp bằng cách sử dụng báo cáo cụ thể này như thế nào? Bạn sẽ tính toán danh sách 10 thị trường hoạt động tốt nhất như thế nào?
Với thiết lập này, bạn buộc phải thực hiện các quy trình thủ công rất khó khăn để duy trì hàng tháng. Bất kỳ phân tích nào bên ngoài các báo cáo cấp cao đã có trong báo cáo đều có cơ bản tốt nhất - ngay cả với các công thức ưa thích. Hơn nữa, điều gì xảy ra khi bạn được yêu cầu hiển thị bán xe đạp theo tháng? Khi mô hình dữ liệu của bạn yêu cầu phân tích dữ liệu không có trong báo cáo bảng tính, bạn buộc phải tìm kiếm một tập dữ liệu khác.
Các tập tin dữ liệu phẳng cho phép các kiểu dữ liệu dễ dàng hơn
Một loại định dạng tệp khác là một tệp bằng phẳng. Tệp phẳng là kho dữ liệu được sắp xếp theo hàng và cột. Mỗi hàng tương ứng với một bộ các phần tử dữ liệu, hoặc một bản ghi . Mỗi cột là một trường . Một trường tương ứng với một phần tử dữ liệu duy nhất trong một bản ghi. Hình dưới đây chứa dữ liệu giống như báo cáo trước đó nhưng được thể hiện bằng định dạng tệp dữ liệu phẳng.
Một tệp dữ liệu phẳng.Chú ý rằng mỗi trường dữ liệu có một cột, và mỗi cột tương ứng với một phần tử dữ liệu. Hơn nữa, không có khoảng trống thêm, và mỗi hàng (hoặc bản ghi) tương ứng với một bộ thông tin duy nhất. Nhưng thuộc tính quan trọng làm cho tệp phẳng này không có trường duy nhất nhận dạng bản ghi. Trên thực tế, bạn phải chỉ định 4 lĩnh vực riêng biệt (Khu vực, Thị trường, Phân đoạn kinh doanh và Doanh số bán hàng một tháng) trước khi bạn có thể xác định duy nhất bản ghi.
Các tệp phẳng cho phép dễ dàng mô hình hóa dữ liệu trong Excel vì chúng có thể được chi tiết đủ để chứa dữ liệu bạn cần và vẫn có lợi cho một mảng rộng các phân tích với các công thức đơn giản - SUM, AVERAGE, VLOOKUP và SUMIF, chỉ để một vài tên.
Bộ dữ liệu dạng bảng là hoàn hảo cho các mô hình dữ liệu trục pivot
Nhiều mô hình dữ liệu hiệu quả chủ yếu được định hướng bởi các bảng pivot. Bảng tổng hợp là công cụ phân tích hàng đầu của Excel. Đối với những người đã sử dụng bảng trụ, bạn biết rằng chúng cung cấp một cách tuyệt vời để tóm tắt và định dạng dữ liệu để sử dụng bằng cách báo cáo các thành phần, chẳng hạn như biểu đồ và bảng.
Tập dữ liệu dạng bảng là lý tưởng cho mô hình dữ liệu trục pivot. Hình dưới minh hoạ một tập dữ liệu dạng bảng. Lưu ý rằng sự khác biệt chính giữa một tập dữ liệu dạng bảng và một tệp dữ liệu bằng phẳng là trong các bộ dữ liệu dạng bảng mà các nhãn cột không tăng gấp đôi như dữ liệu thực tế. Ví dụ: cột Bán thời gian chứa số nhận dạng tháng. Sự khác biệt tinh vi về cấu trúc này là điều làm cho các bộ dữ liệu dạng bảng có các nguồn dữ liệu tối ưu cho các bảng dập. Cấu trúc này đảm bảo rằng các chức năng bàn phím chính, chẳng hạn như sắp xếp và nhóm, hoạt động theo cách mà họ nên làm.
Tập dữ liệu dạng bảng.Các thuộc tính của một tập dữ liệu dạng bảng như sau:
-
Hàng đầu tiên của bộ dữ liệu chứa các nhãn trường mô tả thông tin trong từng cột.
-
Nhãn cột không kéo hai nhiệm vụ là các mục dữ liệu có thể được sử dụng làm bộ lọc hoặc các tiêu chí truy vấn (chẳng hạn như tháng, ngày, năm, khu vực hoặc thị trường).
-
Không có hàng hoặc cột trống - mỗi cột có một tiêu đề, và một giá trị nằm trong mỗi hàng.
-
Mỗi cột đại diện cho một loại dữ liệu duy nhất.
-
Mỗi hàng đại diện cho các mục riêng lẻ trong mỗi cột.