Video: Dữ liệu lớn - Chương 1 Google tracks flu trends 2025
Dữ liệu lớn đã giúp cho việc phát triển các công cụ tìm kiếm trực tuyến có khả năng cao. Một công cụ tìm kiếm tìm các trang web dựa trên cụm từ tìm kiếm yêu cầu các thuật toán phức tạp và khả năng xử lý một số yêu cầu đáng kinh ngạc. Dưới đây là bốn công cụ tìm kiếm được sử dụng rộng rãi nhất:
-
Google
-
Microsoft Bing
-
Yahoo!
-
Hỏi
Việc sử dụng của Google làm cho các đối thủ cạnh tranh của nó lùn hơn. Tính đến tháng 2 năm 2015, Google ước tính sẽ nhận được 1,1 tỷ khách truy cập mỗi tháng. Bing là một khoảng cách xa với 350 triệu; Yahoo! được 300 triệu, và Ask, 245 triệu. Mặc dù Google không phải là công cụ tìm kiếm lâu đời nhất, nhưng nó đã trở thành phổ biến nhất. Số lượng dữ liệu mà Google xử lý mỗi ngày ước tính khoảng 20 petabyte (2. 0 x 10 16 byte). Tất cả lưu lượng truy cập này là có lợi cho Google - phần lớn doanh thu của nó đến từ quảng cáo.
Google cũng cung cấp dịch vụ máy tính cho các tổ chức không có khả năng xử lý dữ liệu lớn. Google gần đây đã giới thiệu Google Cloud Dataflow, cho phép các tổ chức lưu trữ, phân tích và xử lý dữ liệu khổng lồ.