Video: Dữ liệu lớn - Intel Big Data 101 - How Big Data Makes Big Impacts 2025
Việc xem xét chính khi thực hiện một dự án dữ liệu lớn là số tiền dự kiến trong thời gian thực và không phải là thời gian thực cần thiết để thực hiện sáng kiến của bạn. Dữ liệu lớn thường là về việc làm những việc không thể thực hiện được vì công nghệ không đủ tiên tiến hoặc chi phí bị cấm. Sự thay đổi lớn xảy ra với dữ liệu lớn là khả năng tận dụng số lượng lớn dữ liệu mà không cần phải lập trình phức tạp trong quá khứ.
Nhiều tổ chức đang ở đỉnh điểm về quản lý số lượng lớn các dữ liệu phức tạp. Phương pháp tiếp cận dữ liệu lớn sẽ giúp giữ mọi thứ cân bằng để các doanh nghiệp không vượt qua rìa vì khối lượng, sự đa dạng, và tốc độ thay đổi dữ liệu. Các công ty đã gặp khó khăn trong việc quản lý số lượng dữ liệu cần được quản lý ở tốc độ cao.
Các tổ chức phải giải quyết để phân tích các tập con nhỏ dữ liệu thường thiếu thông tin quan trọng để có được một bức tranh đầy đủ mà dữ liệu có thể tiết lộ. Khi các công nghệ dữ liệu lớn phát triển và triển khai, các công ty sẽ có thể dễ dàng phân tích dữ liệu và sử dụng nó để đưa ra quyết định hoặc hành động.
Các khía cạnh thời gian thực của dữ liệu lớn có thể mang tính cách mạng khi các công ty cần giải quyết các vấn đề đáng kể. Tác động khi tổ chức có thể xử lý dữ liệu được truyền theo thời gian thực? Nói chung, phương pháp tiếp cận thời gian thực này có liên quan nhất khi câu trả lời cho vấn đề là nhạy cảm về thời gian và kinh doanh quan trọng. Điều này có thể liên quan đến một mối đe dọa đối với một cái gì đó quan trọng như phát hiện hoạt động của thiết bị bệnh viện hoặc dự đoán nguy cơ xâm nhập tiềm ẩn.
Theo dõi ngoại lệ với một thông tin mới, như gian lận / thông minh-
Theo dõi nguồn tin tức và phương tiện truyền thông xã hội để xác định các sự kiện có thể ảnh hưởng đến thị trường tài chính, chẳng hạn như phản ứng của khách hàng đối với thông báo sản phẩm mới
-
Thay đổi vị trí đặt quảng cáo của bạn trong một sự kiện thể thao lớn dựa trên luồng Twitter trong thời gian thực
-
Cung cấp phiếu giảm giá cho khách hàng dựa trên số tiền mà họ mua tại thời điểm bán hàng
-
Đôi khi dữ liệu phát trực tuyến thực sự nhanh và không bao gồm nhiều nguồn, đôi khi có nhiều sự tồn tại, và đôi khi là sự kết hợp của cả hai.
Câu hỏi mà bạn cần tự hỏi mình có chuyển sang thời gian thực là: Có thể giải quyết được vấn đề này bằng các khả năng quản lý thông tin truyền thống hay bạn cần những khả năng mới hơn không?Liệu khối lượng hoặc vận tốc tuyệt đối sẽ áp đảo hệ thống của chúng tôi? Thường thì đó là sự kết hợp của cả hai.
Vì vậy, nếu bạn cần khả năng thời gian thực, các yêu cầu của cơ sở hạ tầng để hỗ trợ này là gì? Danh sách dưới đây làm nổi bật một vài điều bạn cần phải xem xét về khả năng nhập dữ liệu của hệ thống, xử lý và phân tích dữ liệu theo thời gian thực:
Độ trễ thấp:
-
Độ trễ là lượng thời gian trễ cho phép dịch vụ thực hiện trong một môi trường. Một số ứng dụng đòi hỏi độ trễ ít hơn, có nghĩa là họ cần phải đáp ứng trong thời gian thực. Một luồng thời gian thực sẽ yêu cầu độ trễ thấp. Vì vậy, bạn cần phải suy nghĩ về sức mạnh tính toán cũng như các ràng buộc mạng. Khả năng mở rộng:
-
Khả năng mở rộng là khả năng duy trì một mức độ hiệu năng nhất định ngay cả khi tải tăng. Tính linh hoạt:
-
Hệ thống phải hỗ trợ cả luồng dữ liệu có cấu trúc và không có cấu trúc. Định dạng gốc:
-
Sử dụng dữ liệu ở dạng bản địa của nó. Quá trình chuyển đổi mất thời gian và tiền bạc. Khả năng sử dụng ý tưởng xử lý các tương tác phức tạp trong dữ liệu kích hoạt sự kiện có thể được chuyển đổi. Nhu cầu xử lý liên tục tăng số lượng dữ liệu khác nhau là một trong những yếu tố chính thúc đẩy việc áp dụng các dịch vụ đám mây. Mô hình đám mây có quy mô lớn và phân phối.