Video: [cấu trúc dữ liệu và giải thuật]Sử dụng QUEUE và đệ quy để thêm một nút vào cây binary|Dễ hiểu 2025
Một phần của dữ liệu lớn cho những cái đầu tiên Cheat Sheet
Dữ liệu phi cấu trúc khác với dữ liệu có cấu trúc trong đó cấu trúc là không thể đoán trước. Ví dụ về dữ liệu phi cấu trúc bao gồm tài liệu, e-mail, blog, hình ảnh kỹ thuật số, video và hình ảnh vệ tinh. Nó cũng bao gồm một số dữ liệu được tạo ra bởi máy móc hoặc cảm biến. Trên thực tế, dữ liệu phi cấu trúc chiếm đa số dữ liệu nằm trong cơ sở của công ty bạn cũng như bên ngoài công ty của bạn trong các nguồn tư nhân và công cộng trực tuyến như Twitter và Facebook.
Trước đây, hầu hết các công ty đều không thể nắm bắt hoặc lưu trữ số lượng lớn dữ liệu này. Nó chỉ đơn giản là quá đắt hoặc quá áp đảo. Ngay cả khi các công ty có thể nắm bắt dữ liệu, họ không có các công cụ để dễ dàng phân tích dữ liệu và sử dụng các kết quả để đưa ra quyết định. Rất ít công cụ có thể hiểu được những lượng dữ liệu khổng lồ này. Các công cụ đã tồn tại rất phức tạp để sử dụng và không tạo ra kết quả trong một khoảng thời gian hợp lý.
Một cách tiếp cận đang ngày càng trở nên có giá trị như một cách để đạt được giá trị kinh doanh từ dữ liệu phi cấu trúc là phân tích văn bản, quá trình phân tích văn bản không có cấu trúc, trích xuất thông tin có liên quan và chuyển nó thành thông tin có cấu trúc được tận dụng bằng nhiều cách khác nhau. Các quy trình phân tích và khai thác tận dụng các kỹ thuật có nguồn gốc từ ngôn ngữ học tính toán, thống kê, và các ngành khoa học máy tính khác.