Mục lục:
- Xác định các loại phân tích
- Để vượt qua những thách thức này, tổ chức phải tạo ra và nuôi dưỡng một nền văn hoá có giá trị và chấp nhận các sản phẩm phân tích. Các doanh nghiệp phải làm việc để giáo dục tất cả các cấp của tổ chức, để quản lý có một khái niệm cơ bản về phân tích và thành công mà có thể đạt được bằng cách thực hiện chúng.
- dữ liệu xung đột
Video: The Internet of Things by James Whittaker of Microsoft 2025
Chuyển dữ liệu thô của bạn thành những hiểu biết có thể thực hiện được là bước đầu tiên trong tiến trình từ dữ liệu bạn thu thập những thứ thực sự mang lại lợi ích cho bạn. Các nhà khoa học dữ liệu tập trung vào kinh doanh sử dụng phân tích dữ liệu để tạo ra những hiểu biết sâu sắc từ dữ liệu thô.
Xác định các loại phân tích
Dưới đây, theo thứ tự phức tạp ngày càng tăng, là bốn loại phân tích dữ liệu bạn sẽ gặp phải:
-
Phân tích mô tả: Loại phân tích này trả lời cho câu hỏi "Điều gì đã xảy ra? "Phân tích mô tả được dựa trên dữ liệu lịch sử và hiện tại. Một nhà phân tích kinh doanh hoặc một nhà khoa học dữ liệu tập trung kinh doanh dựa trên thông tin kinh doanh hiện đại về phân tích mô tả.
-
Phân tích chẩn đoán: Bạn sử dụng loại phân tích này để tìm câu trả lời cho câu hỏi "tại sao điều gì đó đặc biệt xảy ra? "Hay" những gì đã xảy ra? "Phân tích chẩn đoán rất hữu ích để suy luận và suy diễn thành công hay thất bại của tiểu hợp phần của bất kỳ sáng kiến dựa vào dữ liệu nào.
-
Phân tích tiên đoán liên quan đến việc xây dựng và phân tích mô hình phức tạp để dự đoán sự kiện hoặc xu hướng trong tương lai. Trong bối cảnh kinh doanh, các phân tích này sẽ được thực hiện bởi nhà khoa học dữ liệu tập trung vào kinh doanh. Phân tích theo quy tắc: Loại phân tích này nhằm tối ưu hóa các quy trình, cấu trúc và hệ thống thông qua hoạt động được thông báo dựa trên phân tích tiên đoán - về cơ bản là cho bạn biết bạn nên làm gì dựa trên ước tính thông báo về những gì sẽ xảy ra. Cả hai nhà phân tích nghiệp vụ và các nhà khoa học dữ liệu tập trung vào kinh doanh đều có thể tạo phân tích theo quy định, nhưng các phương pháp và nguồn dữ liệu của họ khác nhau.
-
Analytics thường gây ra ít nhất hai thách thức trong doanh nghiệp. Thứ nhất, các tổ chức thường có một thời gian rất khó tìm kiếm nhân viên mới với bộ kỹ năng cụ thể bao gồm phân tích. Thứ hai, ngay cả các nhà phân tích có tay nghề cũng gặp khó khăn khi truyền đạt những hiểu biết phức tạp theo cách dễ hiểu đối với các nhà hoạch định chính sách.
Để vượt qua những thách thức này, tổ chức phải tạo ra và nuôi dưỡng một nền văn hoá có giá trị và chấp nhận các sản phẩm phân tích. Các doanh nghiệp phải làm việc để giáo dục tất cả các cấp của tổ chức, để quản lý có một khái niệm cơ bản về phân tích và thành công mà có thể đạt được bằng cách thực hiện chúng.
Ngược lại, các nhà khoa học dữ liệu tập trung vào kinh doanh phải có một kiến thức làm việc rất vững chắc về kinh doanh nói chung, và đặc biệt là hiểu biết sâu sắc về kinh doanh đang diễn ra. Kiến thức kinh doanh mạnh mẽ là một trong ba yêu cầu chính của bất kỳ nhà khoa học dữ liệu tập trung vào kinh doanh - hai lĩnh vực kia là sự nhạy bén mã hóa mạnh mẽ và các kỹ năng phân tích định lượng mạnh thông qua mô hình toán học và thống kê.
Xử lý dữ liệu thô thành những hiểu biết có thể thực hiện được
Xử lý dữ liệu là một phần quan trọng trong công việc cần thiết để chuyển đổi dữ liệu thành những hiểu biết sâu sắc. Để xây dựng phân tích từ dữ liệu thô, bạn sẽ cần phải sử dụng
dữ liệu xung đột
- các quy trình và thủ tục mà bạn sử dụng để làm sạch và chuyển đổi dữ liệu từ một định dạng và cấu trúc này sang dạng khác để dữ liệu chính xác và trong các công cụ phân tích định dạng và kịch bản yêu cầu cho tiêu dùng. Khai thác dữ liệu: Nhà khoa học dữ liệu tập trung vào kinh doanh đầu tiên phải xác định những bộ dữ liệu nào có liên quan đến vấn đề đó, và sau đó trích xuất đủ lượng dữ liệu cần thiết để giải quyết vấn đề. (9)> Dữ liệu mung:
Dữ liệu munging liên quan đến việc làm sạch các dữ liệu thô được trích ra thông qua khai thác dữ liệu, sau đó chuyển đổi nó thành một định dạng cho phép tiêu thụ dữ liệu thuận tiện hơn. (Mung bắt đầu cuộc sống như là một quá trình phá hoại, nơi mà bạn sẽ chuyển đổi một cái gì đó có thể nhận biết thành một cái gì đó không thể nhận ra, do đó cụm từ Mash Until No Good, hoặc MUNG.)
-
Quản trị dữ liệu: Tiêu chuẩn quản trị dữ liệu là các tiêu chuẩn được sử dụng như là một biện pháp kiểm soát chất lượng để đảm bảo rằng nguồn dữ liệu thủ công và tự động phù hợp với các tiêu chuẩn dữ liệu của mô hình. Các tiêu chuẩn quản trị dữ liệu phải được áp dụng sao cho dữ liệu ở mức phù hợp khi nó được lưu trữ và sẵn sàng để sử dụng.
-
Độ chi tiết là thước đo mức độ chi tiết của tập dữ liệu. Mức độ chi tiết dữ liệu được xác định bởi kích thước tương đối của các phân nhóm con mà trong đó dữ liệu được chia.
-
Kiến trúc dữ liệu: Kiến trúc CNTT là chìa khóa. Nếu dữ liệu của bạn bị cô lập trong kho riêng biệt, cố định - tất cả mọi người đều phàn nàn về những kho dữ liệu
xí nghiệp dữ liệu đó - chỉ có một vài người trong một ngành cụ thể. Các cấu trúc dữ liệu bị làm mờ tạo ra các kịch bản mà phần lớn dữ liệu của tổ chức chỉ đơn giản không có sẵn để sử dụng bởi tổ chức đó. (Không cần phải nói, cấu trúc dữ liệu bị lãng phí vô cùng lãng phí và không hiệu quả) Nếu mục tiêu của bạn là lấy được nhiều giá trị nhất và thông tin chi tiết từ dữ liệu kinh doanh của tổ chức, thì bạn nên đảm bảo rằng dữ liệu được lưu trữ trong kho dữ liệu trung tâm không ở các xilô riêng biệt.
-