Mục lục:
- Dữ liệu. gov được bắt đầu bởi chính quyền Obama để cung cấp quyền truy cập mở vào dữ liệu của chính phủ Hoa Kỳ không được phân loại. Dữ liệu. dữ liệu gov đang được sản xuất bởi tất cả các phòng ban trong ngành hành pháp - Tòa Bạch Ốc và tất cả các cục nội vụ - cũng như các bộ dữ liệu từ các cấp khác của chính phủ. Vào giữa năm 2014, bạn có thể tìm kiếm hơn 100.000 bộ dữ liệu bằng cách sử dụng Dữ liệu. tìm kiếm gov. Trang web này là tài nguyên vô song nếu bạn đang tìm kiếm dữ liệu có nguồn gốc từ chính phủ Hoa Kỳ về các chỉ số sau:
- Nếu bạn xem trang web về Dữ liệu Mở của Canada, cam kết mạnh mẽ của quốc gia về dữ liệu là hiển nhiên. Tại trang web Dữ liệu Mở của Canada, bạn có thể tìm thấy hơn 200, 000 bộ dữ liệu. Trong số 25 dịch vụ phổ biến nhất trên trang Dữ liệu Mở của Canada là các bộ dữ liệu bao gồm các chỉ số sau:
- Vương quốc Anh bắt đầu khởi đầu muộn trong phong trào mở cửa của chính phủ. Dữ liệu. gov. Vương quốc Anh đã được bắt đầu vào năm 2010, và đến giữa năm 2014, chỉ có khoảng 20 000 dữ liệu đã có sẵn. Giống như Dữ liệu. gov, dữ liệu. gov. uk cũng được cung cấp bởi danh mục dữ liệu CKAN.
- Cuộc Điều tra Dân số Hoa Kỳ được tổ chức 10 năm một lần, và từ năm 2010, dữ liệu đã được thực hiện tự do. Số liệu thống kê có sẵn xuống mức khối lượng điều tra dân số - tổng cộng khoảng 30 người, trung bình. Dữ liệu nhân khẩu học do Cục Điều tra Dân số Hoa Kỳ cung cấp có thể rất hữu ích nếu bạn đang nghiên cứu tiếp thị và quảng cáo và cần nhắm mục tiêu đối tượng của bạn theo các phân loại sau:
- Cổng dữ liệu mở của NASA được gọi là dữ liệu. Cổng thông tin này là nguồn của tất cả các loại dữ liệu tuyệt vời, bao gồm dữ liệu về thiên văn học và không gian
- Nếu bạn đang tìm kiếm dữ liệu để củng cố lập luận của bạn trong một bài viết báo chí thực sự thú vị được hỗ trợ bởi số liệu thống kê toàn cầu, Ngân hàng Thế giới nên là nguồn tiếp cận của bạn. Bất kể phạm vi dự án của bạn, nếu bạn cần dữ liệu về những gì đang xảy ra ở các quốc gia đang phát triển, Ngân hàng Thế giới là nơi để đi. Bạn có thể sử dụng trang web để tải xuống toàn bộ bộ dữ liệu hoặc đơn giản chỉ xem trực quan dữ liệu trực tuyến. Bạn cũng có thể sử dụng API Dữ liệu Mở của Ngân hàng Thế giới để truy cập vào những gì bạn cần.
- - 150 triệu bộ sưu tập dữ liệu về các giá trị thuộc tính theo thời gian, nói cách khác. Knoema bao gồm, nhưng không giới hạn, tất cả các nguồn dữ liệu này:
- Bởi vì hầu hết các dữ liệu tài chính ở định dạng số, Quandl là một công cụ tuyệt vời để cập nhật thông tin về doanh nghiệp mới nhất. Như bạn thấy, tìm kiếm
- Dữ liệu được lưu trữ trên nền Exversion được cung cấp bởi người dùng hoặc được tạo ra bởi một trình thu thập thông tin và lập chỉ mục dữ liệu mở để làm cho nó có thể tìm kiếm từ một giao diện lập trình ứng dụng duy nhất (API).Giống như GitHub, với tài khoản người dùng miễn phí, tất cả dữ liệu bạn tải lên Exversion là công khai. Nếu bạn sẵn sàng trả tiền cho một tài khoản, bạn có thể tạo các kho dữ liệu riêng của riêng bạn. Ngoài ra, với tài khoản trả phí, bạn sẽ có tùy chọn chia sẻ dữ liệu của mình với những người dùng đã chọn cho các dự án hợp tác.
Video: Cách tắt cảnh báo sử dụng dữ liệu điện thoại Samsung 2025
Mở dữ liệu là một phần của một xu hướng lớn hơn hướng tới một sự hiểu biết cởi mở, cởi mở hơn về ý tưởng sở hữu trí tuệ, một xu hướng đang nổi lên rất lớn trong thập kỷ qua. Dữ liệu mở là dữ liệu đã được công bố rộng rãi và được phép sử dụng, sử dụng lại, xây dựng và chia sẻ với người khác. Mở dữ liệu là một phần của phong trào mở.
Ngoài các dữ liệu mở, vận động mở này cũng bao gồm phần mềm mã nguồn mở, phần cứng mở, công việc sáng tạo nội dung mở, truy cập mở vào các tạp chí khoa học, và khoa học mở - tất cả đều cam kết với quan điểm cho rằng nội dung (bao gồm dữ liệu thô từ các thí nghiệm) nên được chia sẻ tự do.
copyleft, hạn chế duy nhất là nguồn của tác phẩm phải được xác định, đôi khi với những cảnh báo rằng các tác phẩm phái sinh không thể có bản quyền với một giấy phép hạn chế hơn so với bản gốc. Nếu điều kiện thứ hai có hiệu lực, thương mại hóa thành công bản thân công việc trở nên khó khăn, mặc dù mọi người thường tìm thấy nhiều con đường gián tiếp, sáng tạo về thương mại hóa.
Mọi người thường nhầm lẫn giấy phép
mở với giấy phép Creative Commons. Creative Commons là một tổ chức phi lợi nhuận nhằm khuyến khích và quảng bá các tác phẩm sáng tạo bằng cách đưa ra một khung pháp lý thông qua đó cho phép và thu thập các giấy phép sử dụng để chia sẻ các bên có nguy cơ hợp pháp khi xây dựng về và sử dụng công việc và kiến thức đã được chia sẻ công khai. Một số giấy phép Creative Commons được mở, và một số tác phẩm phái sinh cấm và / hoặc thương mại hoá rõ ràng.
tin tặc dân sự - các lập trình viên hợp tác làm việc để xây dựng các giải pháp nguồn mở sử dụng dữ liệu mở để giải quyết các vấn đề xã hội - lớn. Năm 2013, các nước G8 (Pháp, Hoa Kỳ, Anh, Nga, Đức, Nhật, Ý và Canada) đã ký một điều lệ cam kết mở dữ liệu, ưu tiên các khu vực thống kê quốc gia, kết quả bầu cử, ngân sách của chính phủ, và bản đồ quốc gia. Phong trào mở cửa của chính phủ thúc đẩy sự minh bạch và trách nhiệm giải trình của chính phủ, nuôi dưỡng một cử tri có nhiều thông tin và khuyến khích sự tham gia của cộng đồng. Để đưa nó vào thuật ngữ máy tính, chính phủ mở ra tạo điều kiện cho một mối quan hệ đọc / viết giữa chính phủ và công dân của mình.
Đào tạo thông qua dữ liệu. gov
Dữ liệu. gov được bắt đầu bởi chính quyền Obama để cung cấp quyền truy cập mở vào dữ liệu của chính phủ Hoa Kỳ không được phân loại. Dữ liệu. dữ liệu gov đang được sản xuất bởi tất cả các phòng ban trong ngành hành pháp - Tòa Bạch Ốc và tất cả các cục nội vụ - cũng như các bộ dữ liệu từ các cấp khác của chính phủ. Vào giữa năm 2014, bạn có thể tìm kiếm hơn 100.000 bộ dữ liệu bằng cách sử dụng Dữ liệu. tìm kiếm gov. Trang web này là tài nguyên vô song nếu bạn đang tìm kiếm dữ liệu có nguồn gốc từ chính phủ Hoa Kỳ về các chỉ số sau:
Kinh tế
- Môi trường
- Ngành công nghiệp STEM
- Chất lượng cuộc sống
- Pháp lý
- Kiểm tra Dữ liệu Mở của Canada
Nếu bạn xem trang web về Dữ liệu Mở của Canada, cam kết mạnh mẽ của quốc gia về dữ liệu là hiển nhiên. Tại trang web Dữ liệu Mở của Canada, bạn có thể tìm thấy hơn 200, 000 bộ dữ liệu. Trong số 25 dịch vụ phổ biến nhất trên trang Dữ liệu Mở của Canada là các bộ dữ liệu bao gồm các chỉ số sau:
Môi trường
- Quốc tịch
- Chất lượng cuộc sống
- Lặn vào dữ liệu. gov. uk
Vương quốc Anh bắt đầu khởi đầu muộn trong phong trào mở cửa của chính phủ. Dữ liệu. gov. Vương quốc Anh đã được bắt đầu vào năm 2010, và đến giữa năm 2014, chỉ có khoảng 20 000 dữ liệu đã có sẵn. Giống như Dữ liệu. gov, dữ liệu. gov. uk cũng được cung cấp bởi danh mục dữ liệu CKAN.
Mặc dù dữ liệu. gov. uk vẫn đang được bắt kịp, nó có một bộ sưu tập đầy ấn tượng của Ordnance Survey bản đồ đủ tuổi - 50 năm hoặc hơn - để được ra khỏi bản quyền. Nếu bạn đang tìm kiếm bản đồ khảo sát miễn phí, nổi tiếng thế giới, dữ liệu. gov. uk là một nơi tuyệt vời để bạn khám phá. Ngoài các bản đồ khảo sát sao, dữ liệu. gov. uk là một nguồn dữ liệu hữu ích cho các chỉ số sau:
Môi trường
- (dữ liệu chủ đề đa dạng nhất của chính phủ) Chi tiêu của chính phủ
- Xã hội
- Y tế
- Giáo dục
- Doanh nghiệp và kinh tế
- Kiểm tra dữ liệu Cục Điều tra Dân số Hoa Kỳ
Cuộc Điều tra Dân số Hoa Kỳ được tổ chức 10 năm một lần, và từ năm 2010, dữ liệu đã được thực hiện tự do. Số liệu thống kê có sẵn xuống mức khối lượng điều tra dân số - tổng cộng khoảng 30 người, trung bình. Dữ liệu nhân khẩu học do Cục Điều tra Dân số Hoa Kỳ cung cấp có thể rất hữu ích nếu bạn đang nghiên cứu tiếp thị và quảng cáo và cần nhắm mục tiêu đối tượng của bạn theo các phân loại sau:
Tuổi
- Thu nhập trung bình hàng năm
- Quy mô hộ gia đình < Giới tính hoặc chủng tộc
- Trình độ học vấn
- Biết Dữ liệu của NASA
- Kể từ khi thành lập vào năm 1958, NASA đã công bố tất cả các dữ liệu dự án không được phân loại. Nó đã được trong các trò chơi dữ liệu mở vì vậy lâu rằng NASA đã tấn dữ liệu! Bộ dữ liệu của NASA đã phát triển nhanh hơn với những cải tiến gần đây về công nghệ vệ tinh và truyền thông. Trên thực tế, NASA tạo ra 4 terabyte dữ liệu khoa học trái đất mới mỗi ngày - tương đương với hơn một triệu tệp MP3.Nhiều dự án của NASA đã tích lũy dữ liệu vào phạm vi petabyte.
Cổng dữ liệu mở của NASA được gọi là dữ liệu. Cổng thông tin này là nguồn của tất cả các loại dữ liệu tuyệt vời, bao gồm dữ liệu về thiên văn học và không gian
(tất nhiên!)
Khí hậu
- Khoa học Đời sống
- Địa chất
- Kỹ thuật
- Wrangling Dữ liệu Ngân hàng Thế giới
- Ngân hàng Thế giới là một tổ chức tài chính quốc tế do Liên hợp quốc điều hành. Nó cung cấp các khoản vay cho các nước đang phát triển để thanh toán cho đầu tư vốn sẽ dẫn đến giảm nghèo và một số khoản thặng dư để các nước tiếp nhận có thể trả nợ khoản vay theo thời gian. Bởi vì các nhân viên của Ngân hàng Thế giới cần đưa ra những quyết định sáng suốt về những quốc gia nào có khả năng trả nợ tốt hơn, họ đã thu thập được rất nhiều dữ liệu về các quốc gia thành viên. Họ đã làm cho dữ liệu này có sẵn cho công chúng ở trang Dữ liệu Mở của Ngân hàng Thế giới.
Nếu bạn đang tìm kiếm dữ liệu để củng cố lập luận của bạn trong một bài viết báo chí thực sự thú vị được hỗ trợ bởi số liệu thống kê toàn cầu, Ngân hàng Thế giới nên là nguồn tiếp cận của bạn. Bất kể phạm vi dự án của bạn, nếu bạn cần dữ liệu về những gì đang xảy ra ở các quốc gia đang phát triển, Ngân hàng Thế giới là nơi để đi. Bạn có thể sử dụng trang web để tải xuống toàn bộ bộ dữ liệu hoặc đơn giản chỉ xem trực quan dữ liệu trực tuyến. Bạn cũng có thể sử dụng API Dữ liệu Mở của Ngân hàng Thế giới để truy cập vào những gì bạn cần.
Dữ liệu Mở của Ngân hàng Thế giới cung cấp dữ liệu về các chỉ số sau (và nhiều, nhiều hơn nữa):
Nông nghiệp và phát triển nông thôn
Kinh tế và Tăng trưởng
- Môi trường
- Khoa học và Công nghệ
- Thu nhập từ nghèo đói
- Số liệu của Ngân hàng Thế giới cũng bao gồm
- microdata
- - khảo sát mẫu hộ gia đình và doanh nghiệp ở các nước đang phát triển. Bạn có thể sử dụng microdata để khám phá các biến thể trong tập dữ liệu của mình.
Tìm hiểu Knoema Dữ liệu Knoema (phát âm là "no-mah") nhằm mục đích là kho lưu trữ dữ liệu công khai lớn nhất trên web. Nền tảng Knoema có 500+ cơ sở dữ liệu đáng kinh ngạc, ngoài 150 triệu loạt thời gian
- 150 triệu bộ sưu tập dữ liệu về các giá trị thuộc tính theo thời gian, nói cách khác. Knoema bao gồm, nhưng không giới hạn, tất cả các nguồn dữ liệu này:
Dữ liệu của chính phủ từ các quốc gia công nghiệp Dữ liệu công cộng quốc gia từ các quốc gia đang phát triển Dữ liệu của Liên Hợp Quốc
- Dữ liệu tổ chức quốc tế
- Knoema là một nguồn tài nguyên nổi bật nếu bạn đang tìm kiếm dữ liệu quốc tế về nông nghiệp, thống kê tội phạm, nhân khẩu học, kinh tế, giáo dục, năng lượng, môi trường, an ninh lương thực, thương mại nước ngoài, y tế, sử dụng đất, quốc phòng, đói nghèo, nghiên cứu và phát triển, viễn thông, du lịch, vận tải, hoặc nước.
- Ngoài việc là nguồn dữ liệu đáng kinh ngạc, Knoema là một nền tảng đa nhiệm. Bạn có thể sử dụng nền tảng Knoema để tạo bảng điều khiển tự động theo dõi tất cả các bộ dữ liệu yêu thích của bạn. Bạn có thể sử dụng các công cụ trực quan hoá dữ liệu của nền tảng để nhanh chóng và dễ dàng nhìn thấy dữ liệu của bạn dưới dạng bảng hoặc bản đồ.Bạn có thể sử dụng Atlas dữ liệu Knoema để khảo sát các loại và / hoặc khu vực địa lý và nhanh chóng truy cập vào các bộ dữ liệu cụ thể mà bạn cần. Là một cá nhân, bạn có thể tải lên dữ liệu của riêng mình và sử dụng Knoema như một dịch vụ lưu trữ miễn phí. Hơn thế nữa, Knoema thậm chí còn cung cấp Thị trường Knoema - nơi bạn có thể đến để được trả tiền chỉ vì tham gia vào các dự án dựa vào dữ liệu.
- Mặc dù rất nhiều dữ liệu của Knoema khá phổ biến, bạn vẫn có thể tìm thấy một số dữ liệu đáng ngạc nhiên cụ thể. Nếu bạn đang gặp khó khăn trong việc định vị dữ liệu về một chủ đề cụ thể, bạn sẽ có thể tìm thấy nó trên nền tảng Knoema. Hình minh hoạ cho thấy dữ liệu cụ thể của Knoema.
- Chỉ mục các bản ghi côn trùng trong tìm kiếm của Knoema.
Queuing Up with Quandl Data
Quandl là một trang web có trụ sở tại Toronto với mục đích là công cụ tìm kiếm dữ liệu số. Không giống hầu hết các công cụ tìm kiếm, tuy nhiên, cơ sở dữ liệu của nó không phải là tự động tạo ra bởi nhện thu thập dữ liệu web. Thay vào đó, nó tập trung vào các dữ liệu được liên kết được cập nhật qua
crowdsourcing
- cập nhật bằng tay qua người giám sát của con người, nói cách khác.Bởi vì hầu hết các dữ liệu tài chính ở định dạng số, Quandl là một công cụ tuyệt vời để cập nhật thông tin về doanh nghiệp mới nhất. Như bạn thấy, tìm kiếm
Apple trả về hơn 4, 700 bộ dữ liệu từ 11 nguồn khác nhau với chuỗi thời gian ở mức hàng ngày, hàng tuần, hàng tháng, hàng quý hoặc hàng năm. Nhiều kết quả này liên quan đến số liệu nông nghiệp của Liên hợp quốc. Nếu bạn đang tìm kiếm dữ liệu trên Máy tính Apple, bạn có thể thu hẹp phạm vi tìm kiếm của mình bằng cách thay thế cụm từ tìm kiếm Apple
bằng viết tắt của công ty, AAPL. Chỉ mục các bản ghi của Apple trong tìm kiếm Quandl. Cơ sở dữ liệu Quandl bao gồm các liên kết tới hơn 10 triệu bộ dữ liệu (mặc dù nó sử dụng một số liệu rộng lượng trong việc khai báo những gì phân biệt một tập dữ liệu từ một bộ dữ liệu khác). Quandl liên kết đến 2. 1 triệu bộ dữ liệu của Liên hợp quốc và nhiều nguồn khác, bao gồm các bộ dữ liệu trong Dự án dữ liệu Mở Tài chính, các ngân hàng trung ương, các tổ chức bất động sản và các tổ chức tư vấn nổi tiếng. Khám phá Dữ liệu Giải phóng Được mô phỏng theo GitHub - nền tảng được lưu trữ trên đám mây, qua đó các lập trình viên có thể cộng tác chia sẻ và xem xét mã - Exversion nhằm cung cấp cùng chức năng chung quanh dữ liệu mà GitHub cung cấp xung quanh mã. Nền tảng Exversion cung cấp tính năng kiểm soát phiên bản và dịch vụ lưu trữ mà bạn có thể tải lên và chia sẻ dữ liệu của mình. Để minh họa cách Exversion hoạt động, hãy tưởng tượng một nền tảng cho phép bạn
ngã ba đầu tiên(hoặc sao chép) một tập dữ liệu và sau đó thực hiện những thay đổi mà bạn muốn. Exversion sẽ ở đó để theo dõi những gì đã thay đổi từ tập gốc và mọi thay đổi mà bạn thực hiện với nó. Exversion cũng cho phép người dùng đánh giá, đánh giá và nhận xét về bộ dữ liệu.
Dữ liệu được lưu trữ trên nền Exversion được cung cấp bởi người dùng hoặc được tạo ra bởi một trình thu thập thông tin và lập chỉ mục dữ liệu mở để làm cho nó có thể tìm kiếm từ một giao diện lập trình ứng dụng duy nhất (API).Giống như GitHub, với tài khoản người dùng miễn phí, tất cả dữ liệu bạn tải lên Exversion là công khai. Nếu bạn sẵn sàng trả tiền cho một tài khoản, bạn có thể tạo các kho dữ liệu riêng của riêng bạn. Ngoài ra, với tài khoản trả phí, bạn sẽ có tùy chọn chia sẻ dữ liệu của mình với những người dùng đã chọn cho các dự án hợp tác.
Lập bản đồ OpenStreetMap Dữ liệu Không gian OpenStreetMap (OSM) là một giải pháp thay thế từ các sản phẩm lập bản đồ thương mại mở, có từ đám đông như Google Maps và ESRI ArcGIS Online. Trong OSM, người dùng tạo, tải lên hoặc số hóa dữ liệu địa lý vào kho trung tâm. Nền tảng OSM khá mạnh. Các chính phủ và các công ty tư nhân đã bắt đầu đóng góp và rút khỏi các bộ dữ liệu được chia sẻ. Ngay cả các tập đoàn lớn như Apple đều dựa vào dữ liệu OSM. OSM hiện có hơn 1 triệu người đăng ký. Để minh họa cách một người có thể tạo ra dữ liệu trong OSM, hãy tưởng tượng rằng ai đó liên kết các hệ thống GPS trên điện thoại di động với ứng dụng OSM. Do ủy quyền này, OSM có thể tự động theo dõi các tuyến đường trong khi người đó đi. Sau đó, người này (hoặc người dùng OSM khác) có thể vào nền tảng trực tuyến OSM để xác minh và gắn nhãn các tuyến đường.
Dữ liệu trong OSM không được lưu giữ dưới dạng bản đồ, nhưng dưới dạng các biểu tượng hình học và hình học - điểm, đường kẻ, đa giác và chú thích bản đồ - vì vậy tất cả dữ liệu của OSM có thể được tải xuống nhanh chóng từ trang web và dễ dàng lắp ráp thành một bản đồ biểu diễn thông qua một ứng dụng máy tính để bàn.