10 Hadoop Tài nguyên Đạt được một Bookmark - núm vú

Video: Kenneth Cukier: Big data is better data 2025

Dưới đây là mười nguồn tài nguyên Hadoop tuyệt vời xứng đáng với việc tạo một trang đánh dấu trong trình duyệt của bạn. Những tài nguyên này giúp bạn tạo ra một kế hoạch học tập suốt đời cho Hadoop.

Hệ thần kinh trung ương: Apache. org

Tổ chức Phần mềm Apache (ASF) là cộng đồng trung tâm cho các dự án phần mềm mã nguồn mở. Không chỉ bất kỳ dự án nào có thể là một dự án của Apache - nhiều quá trình đồng thuận chuyển đổi một phần của phần mềm từ các thiết kế ban đầu và mã beta của nó (trạng thái lồng ấp) sang phần mềm có sẵn đầy đủ.

ASF không chỉ là nơi mà các dự án như Hadoop được quản lý - đó là nơi họ "sống và hít thở. "Ngày nay, có hàng trăm dự án Apache. Với điều này trong tâm trí, bạn nên đánh dấu các trang Apache Hadoop như là một trong những tài nguyên học tập chính của bạn. Trang web này rất quan trọng vì bạn có thể truy cập vào mã nguồn ở đó.

Tweet này

Twitter không phải là nơi để học Hadoop mỗi khi - tất cả, bạn không thể dễ dàng lập trình MapReduce trong các bài học chỉ khoảng 140 ký tự. Hãy làm như vậy, khá nhiều chuyên gia dữ liệu lớn trên Twitter, và họ bày tỏ ý kiến và chỉ ra các nguồn có thể làm cho bạn trở thành một người dùng thông minh hơn Hadoop.

Một số danh sách những người có ảnh hưởng nhất trong bộ sưu tập Hadoop và dữ liệu lớn của Twitter, và đó là cách tốt nhất để tìm những nhân vật Hadoop này và thêm chúng vào danh sách Twitter của bạn.

Đại học HortonWorks

Đại học Hortonworks cung cấp đào tạo và chứng nhận Hadoop. Trang web cung cấp các khóa học Hadoop được xây dựng cho cả quản trị viên hoặc chuyên gia phát triển với tùy chọn của một chương trình chứng nhận nghiêm ngặt. Hortonworks tuyển dụng một số chuyên gia về Hadoop sâu nhất và nổi bật nhất trên thế giới, vì vậy bạn được đảm bảo về chuyên môn về chất lượng đằng sau các bài học.

BigDataUniversity. com

BigDataUniversity. com (trường hợp không quan trọng khi bạn nhập URL vào trình duyệt của bạn) là một tài nguyên tuyệt vời để học hỏi về - bạn đoán nó - dữ liệu lớn. Tất nhiên, dữ liệu lớn không chỉ là Hadoop, vì vậy bạn sẽ tìm thấy nhiều tài nguyên của Hadoop tại trang này.Trường đại học này có hơn 100.000 sinh viên theo học và học về Hadoop và dữ liệu lớn mỗi ngày.

Hành tinh Big Data Blog Aggregator

Thật tuyệt vời khi tên của một trang web cho bạn biết chính xác nó là gì - như hành tinh Big Data Blog Aggregator: Đây là tập hợp các blog về dữ liệu lớn, Hadoop và các chủ đề liên quan khác trên hành tinh (tốt, trên Planet anyway).

Cả hai tên tuổi lớn và không tên đều xuất hiện trên trang web, nhưng điều đó rất hữu ích: Mặc dù Cloudera, Hortonworks, IBM và các đối tác khác đã cam kết với Hadoop, nhưng thường là làm mới và có giá trị để tiếp xúc với những suy nghĩ và ý kiến của rễ cỏ, các nhà thực hành không liên kết bởi các cộng đồng không gắn liền với một nhà cung cấp cụ thể trong lộ trình học tập của bạn.

Diễn đàn Apache Hadoop của Quora

Diễn đàn Quora Apache Hadoop là nền tảng cho bất cứ ai tìm kiếm để tìm hiểu thêm về Hadoop, hoặc về các dữ liệu lớn nói chung, cho vấn đề đó.

Như trong bất kỳ diễn đàn nào, hàng loạt câu hỏi và câu trả lời bạn có thể tìm thấy tại trang này đang bị chóng mặt, nhưng tất cả đều dẫn bạn đến những gì bạn đang tìm kiếm: kiến thức. Trang web có liên kết với Hadoop và các thành phần riêng lẻ của nó - ví dụ: có các diễn đàn cụ thể cho MapReduce, HDFS, Pig, HBase và hơn thế nữa.

Trang web cũng có các diễn đàn Hadoop; ví dụ, Cloudera và Hortonworks có các nhóm thảo luận cụ thể cho bản phân phối của họ - một minh chứng cho sự phổ biến của diễn đàn này.

Trung tâm Dữ liệu Big Big IBM

Trung tâm dữ liệu lớn của IBM là nơi tuyệt vời để tìm hiểu về Hadoop và hệ sinh thái của nó. Mặc dù IBM sở hữu và vận hành, nhưng nội dung của trang này không phải lúc nào cũng liên quan đến các sản phẩm của IBM.

IBM Big Data Hub cung cấp cho bất kỳ khách truy cập nào có đủ kiến thức để làm dịu cơn khát của bất kỳ ai về dữ liệu lớn. Bạn sẽ tìm thấy tất cả các loại blog, video, bài báo của các nhà phân tích, các trường hợp sử dụng, bảng thống kê, bản trình bày và hơn thế nữa. Đây thực sự là kho báu của các tài nguyên dữ liệu lớn.

Hội nghị không thể bỏ lỡ

Có rất nhiều hội nghị Hadoop, và thậm chí còn nhiều hội nghị dữ liệu lớn hơn - Hadoop Summit và Strata Hadoop World là những hội nghị tinh hoa không thể bỏ qua. Thông thường, một nhà phân phối đồng tài trợ cho các hội nghị này. Ví dụ: Yahoo! và Hortonworks tài trợ cho Hội nghị thượng đỉnh Hadoop, và Cloudera là đồng tài trợ của Strata Hadoop World.

Cả Strata Hadoop World và Hadoop Summit đều là

địa điểm tập trung của các nhà Hadoop sáng nhất trong kinh doanh; các hội thảo này thu hút được nhiều chuyên gia quan tâm đến Hadoop, bao gồm các nhà ra quyết định, kiến trúc sư, nhà phát triển, các nhà phân tích và hơn thế nữa.

Các giấy tờ của Google đã bắt đầu tất cả Cái mà bây giờ được gọi là Hadoop có nguồn gốc của nó trong một số giấy tờ được viết bởi nhân viên của Google, những người tập trung vào vấn đề lập chỉ mục Web. Trong khi dự án Apache Nutch (một công nghệ mã nguồn mở để thu thập thông tin web) đang tập trung vào việc mở rộng ra bên ngoài nhằm mục đích lập chỉ mục dữ liệu web cao hơn, Google đã công bố một bài báo "The Google File System" (October 2003), ảnh hưởng lớn đến Doug Cutting và đồng sáng lập Nutch, Mike Cafarella.Ngay sau đó, Google đã công bố bài báo "MapReduce: Simplified Data Processing on Large Clusters" (Tháng 12 năm 2004).