Mục lục:
- Cloud tính toán Elastic Computing của Amazon cho dữ liệu lớn
- Google, nhà tìm kiếm khổng lồ trên Internet, cũng cung cấp một số dịch vụ đám mây được nhắm mục tiêu cho dữ liệu lớn. Các tính năng này bao gồm:
- Microsoft đã đưa ra một loạt các công cụ phát triển, hỗ trợ máy ảo, quản lý và các dịch vụ truyền thông, và các dịch vụ thiết bị di động trong một sản phẩm PaaS. Đối với khách hàng có chuyên môn sâu về .Net, SQLServer và Windows, việc áp dụng PaaS dựa trên Azure là đơn giản.
- Khởi động bởi Rackspace và NASA, OpenStack đang triển khai một nền tảng đám mây mở nhằm vào các đám mây công cộng hoặc tư nhân. Trong khi tổ chức được quản lý chặt chẽ bởi Rackspace, nó chuyển sang một nền tảng OpenStack riêng biệt. Mặc dù các công ty có thể sử dụng OpenStack để tạo ra các triển khai độc quyền, nhưng tên gọi OpenStack yêu cầu sự phù hợp với việc thực hiện các dịch vụ tiêu chuẩn.
Video: Đâu là yếu tố khiến công nghệ điện toán đám mây bùng nổ tại VN? - Tin Tức VTV24 2025
Các nhà cung cấp Cloud cung cấp tất cả các hình dạng và kích cỡ và cung cấp nhiều sản phẩm khác nhau cho dữ liệu lớn. Một số là tên hộ gia đình, trong khi một số khác đang nổi lên. Một số nhà cung cấp đám mây cung cấp dịch vụ IaaS có thể được sử dụng cho dữ liệu lớn bao gồm Amazon. com, AT & T, GoGrid, Joyent, Rackspace, IBM và Verizon / Terremark.
Cloud tính toán Elastic Computing của Amazon cho dữ liệu lớn
Hiện tại, một trong những nhà cung cấp dịch vụ IaaS cao cấp nhất là Amazon Web Services với Elastic Compute Cloud (Amazon EC2). Amazon đã không bắt đầu với một tầm nhìn để xây dựng một cơ sở kinh doanh dịch vụ cơ sở hạ tầng lớn.
Amazon EC2 cung cấp khả năng mở rộng dưới sự kiểm soát của người dùng, với người dùng trả tiền cho các nguồn lực theo giờ. Việc sử dụng thuật ngữđàn hồi trong việc đặt tên EC2 của Amazon là đáng kể. Ở đây, tính đàn hồi đề cập đến khả năng người dùng EC2 phải tăng hoặc giảm tài nguyên cơ sở hạ tầng được phân bổ để đáp ứng nhu cầu của họ.
Bản đồ Elastic Mapastic của Amazon:
-
Được nhắm mục tiêu để xử lý số lượng dữ liệu khổng lồ. Elastic MapReduce sử dụng một nền tảng Hadoop được lưu trữ chạy trên EC2 và Amazon Simple Storage Service (Amazon S3). Bây giờ người dùng có thể chạy HBase. Amazon DynamoDB:
-
Dịch vụ cơ sở dữ liệu SQL (NoSQL) không chỉ được quản lý đầy đủ. DynamoDB là một dịch vụ lưu trữ dữ liệu có khả năng chịu lỗi cao, có sẵn và khả năng mở rộng trong suốt và quản lý đơn giản. Nó được thực hiện trên SSD (đĩa trạng thái rắn) cho độ tin cậy cao hơn và hiệu suất cao. Dịch vụ lưu trữ dữ liệu dạng web (S3):
-
Dịch vụ được thiết kế để lưu trữ bất kỳ lượng dữ liệu nào. Sức mạnh của trung tâm thiết kế của nó là hiệu suất và khả năng mở rộng, vì vậy nó không phải là tính năng được tải như các kho dữ liệu khác. Dữ liệu được lưu trữ trong "thùng" và bạn có thể chọn một hoặc nhiều vùng toàn cầu để lưu trữ vật lý để giải quyết các nhu cầu về độ trễ hoặc điều tiết. Máy tính Hiệu suất Cao của Amazon:
-
Được điều chỉnh cho các nhiệm vụ chuyên biệt, dịch vụ này cung cấp các nhóm tính toán hiệu năng cao có độ trễ thấp. Hầu hết các nhà khoa học và các nhà khoa học thường sử dụng, HPC đang bước vào dòng chính vì cung cấp Amazon và các nhà cung cấp HPC khác.Các cụm HPC của Amazon được xây dựng cho các khối lượng công việc cụ thể và có thể được cấu hình lại dễ dàng cho các nhiệm vụ mới. Amazon RedShift:
-
Có sẵn trong giới hạn xem trước, RedShift là một petabyte quy mô kho dữ liệu dịch vụ được xây dựng trên một kiến trúc MPP mở rộng. Quản lý bởi Amazon, nó cung cấp một sự thay thế an toàn và đáng tin cậy cho các kho dữ liệu trong nhà và tương thích với một số công cụ thông minh kinh doanh phổ biến. Google lớn hơn các dịch vụ dữ liệu
Google, nhà tìm kiếm khổng lồ trên Internet, cũng cung cấp một số dịch vụ đám mây được nhắm mục tiêu cho dữ liệu lớn. Các tính năng này bao gồm:
Google Compute Engine:
-
Tính năng dựa trên đám mây cho máy tính ảo, Google Compute Engine cung cấp môi trường máy tính an toàn và linh hoạt từ các trung tâm dữ liệu tiết kiệm năng lượng. Google cũng cung cấp các giải pháp quản lý khối lượng tải từ một số đối tác công nghệ đã tối ưu hóa các sản phẩm của họ cho Google Compute Engine. Google Big Query:
-
Cho phép bạn chạy truy vấn SQL giống với tốc độ cao so với các bộ dữ liệu lớn có khả năng hàng tỷ hàng. Mặc dù nó là tốt cho truy vấn dữ liệu, dữ liệu không thể được sửa đổi sau khi nó được trong nó. Hãy xem xét Google Big Query một loại hệ thống xử lý phân tích trực tuyến (OLAP) cho dữ liệu lớn. Tốt cho báo cáo đột xuất hoặc phân tích thăm dò. API Dự đoán của Google:
-
Công cụ học tập dựa trên đám mây với số lượng lớn dữ liệu, Dự đoán có khả năng xác định các mẫu trong dữ liệu và sau đó ghi nhớ chúng. Nó có thể tìm hiểu thêm về một mẫu mỗi khi nó được sử dụng. Các mẫu có thể được phân tích cho nhiều mục đích, bao gồm phát hiện gian lận, phân tích churn, và tình cảm của khách hàng. Microsoft Azure cho dữ liệu lớn
Microsoft đã đưa ra một loạt các công cụ phát triển, hỗ trợ máy ảo, quản lý và các dịch vụ truyền thông, và các dịch vụ thiết bị di động trong một sản phẩm PaaS. Đối với khách hàng có chuyên môn sâu về.Net, SQLServer và Windows, việc áp dụng PaaS dựa trên Azure là đơn giản.
Để đáp ứng các yêu cầu đang nổi lên để tích hợp dữ liệu lớn vào các giải pháp Windows Azure, Microsoft cũng đã thêm vào Windows Azure HDInsight. Được xây dựng trên Hortonworks Data Platform (HDP), theo Microsoft, cung cấp khả năng tương thích 100% với Apache Hadoop, HDInsight hỗ trợ kết nối với Microsoft Excel và các công cụ BI khác. Ngoài Azure HDInsight cũng có thể được triển khai trên Windows Server.
OpenStack cho dữ liệu lớn
Khởi động bởi Rackspace và NASA, OpenStack đang triển khai một nền tảng đám mây mở nhằm vào các đám mây công cộng hoặc tư nhân. Trong khi tổ chức được quản lý chặt chẽ bởi Rackspace, nó chuyển sang một nền tảng OpenStack riêng biệt. Mặc dù các công ty có thể sử dụng OpenStack để tạo ra các triển khai độc quyền, nhưng tên gọi OpenStack yêu cầu sự phù hợp với việc thực hiện các dịch vụ tiêu chuẩn.
Mục tiêu của OpenStack là cung cấp một đặc tả đám mây đa đám tử rộng, có thể chạy trên bất kỳ phần cứng nào. OpenStack đang xây dựng một hệ sinh thái lớn của các đối tác quan tâm đến việc sử dụng nền tảng điện toán đám mây, bao gồm Dell, HP, Intel, Cisco, Red Hat và IBM cùng với ít nhất 100 người khác đang sử dụng OpenStack làm nền tảng cho các dịch vụ đám mây của họ.
Về bản chất, OpenStack là một sáng kiến nguồn mở IaaS được xây dựng trên Ubuntu, một hệ điều hành dựa trên phân phối Debian Linux. Nó cũng có thể chạy trên phiên bản Linux của Red Hat.
OpenStack cung cấp một loạt các dịch vụ, bao gồm tính toán, lưu trữ đối tượng, danh mục và kho lưu trữ, bảng điều khiển, nhận dạng và mạng. Về phần dữ liệu lớn, Rackspace và Hortonworks (nhà cung cấp nền tảng quản lý dữ liệu mã nguồn mở dựa trên Apache Hadoop) thông báo rằng Rackspace sẽ phát hành dịch vụ Hadoop dựa trên đám mây công khai OpenStack, sẽ được Hortonworks xác nhận và hỗ trợ và cho phép khách hàng để nhanh chóng tạo ra một môi trường dữ liệu lớn.