Video: Ben Wellington: How we found the worst place to park in New York City — using big data 2025
Mô hình nguy cơ là một trường hợp sử dụng chủ yếu khác, được kích hoạt bởi Hadoop. Bạn sẽ thấy rằng nó phù hợp với trường hợp sử dụng của phát hiện gian lận trong đó nó là một kỷ luật dựa trên mô hình. Bạn càng có nhiều dữ liệu và bạn càng "kết nối các dấu chấm" thì kết quả của bạn càng thường xuyên sẽ cho ra những mô hình dự báo rủi ro tốt hơn.
Từ rủi ro bao gồm tất cả bao gồm có thể có nhiều ý nghĩa. Ví dụ, khách hàng dự đoán churn là rủi ro của một khách hàng chuyển đến một đối thủ cạnh tranh; rủi ro của một khoản vay liên quan đến nguy cơ vỡ nợ; nguy cơ trong chăm sóc sức khoẻ kéo dài khoảng cách từ ngăn chặn dịch bệnh đến an toàn thực phẩm đến khả năng tái nhiễm và nhiều hơn nữa.
Ngành dịch vụ tài chính (FSS) hiện đang đầu tư rất nhiều vào mô hình hóa rủi ro dựa trên mô hình Hadoop. Ngành này tìm cách tăng độ tự động và độ chính xác của việc đánh giá rủi ro và mô hình hóa phơi nhiễm.
Hadoop cung cấp cho người tham gia cơ hội để mở rộng bộ dữ liệu được sử dụng trong các mô hình rủi ro của họ để bao gồm các nguồn không được sử dụng hết (chẳng hạn như e-mail, tin nhắn tức thời, phương tiện truyền thông xã hội và tương tác với dịch vụ khách hàng) đại diện, trong số các nguồn dữ liệu khác.
Các mô hình rủi ro trong FSS xuất hiện ở khắp mọi nơi. Chúng được sử dụng để ngăn chặn khách hàng ngăn chặn, mô hình thao tác thương mại, phân tích rủi ro doanh nghiệp và tiếp xúc, và nhiều hơn nữa.
Khi một công ty đưa ra một chính sách bảo hiểm chống lại thiên tai ở nhà, một thách thức rõ ràng là có bao nhiêu tiền đang có nguy cơ bị rủi ro. Nếu hãng bảo hiểm không dự trữ tiền cho các khoản thanh toán có thể có, các nhà quản lý sẽ can thiệp (hãng bảo hiểm không muốn điều đó); nếu công ty bảo hiểm bỏ quá nhiều tiền vào dự trữ để trả các yêu cầu chính sách trong tương lai, họ không thể đầu tư tiền bảo hiểm của bạn và kiếm được lợi nhuận (hãng bảo hiểm cũng không muốn).
Một số công ty "mù quáng" đối mặt với rủi ro mà họ phải đối mặt bởi vì họ không thể chạy được một số mô phỏng thảm khốc liên quan đến sự thay đổi tốc độ gió hoặc tỷ lệ lượng mưa (giữa các biến khác) để tiếp xúc của họ.
Rất đơn giản, các công ty này gặp khó khăn trong việc kiểm tra các mô hình rủi ro. Khả năng gấp nhiều dữ liệu hơn - ví dụ như thời tiết hoặc sự phân bố kinh tế xã hội không ngừng của khách hàng - mang lại cho họ cái nhìn sâu hơn và khả năng hơn khi xây dựng các mô hình rủi ro tốt hơn.
Xây dựng và kiểm tra căng thẳng các mô hình rủi ro như mô tả chỉ là một nhiệm vụ lý tưởng cho Hadoop. Các hoạt động này thường tốn kém về mặt tính toán, và khi xây dựng một mô hình rủi ro, có thể không khả thi để chạy với một kho dữ liệu, vì những lý do sau:
-
Kho hàng có thể không được tối ưu hóa cho các loại truy vấn do mô hình rủi ro.(Hadoop không bị ràng buộc bởi các mô hình dữ liệu được sử dụng trong các kho dữ liệu).
-
Một công việc hàng loạt, đặc biệt, chẳng hạn như mô hình rủi ro đang phát triển sẽ làm tăng tải cho nhà kho, ảnh hưởng đến các ứng dụng phân tích hiện có. (Hadoop có thể đảm nhận khối lượng công việc này, giải phóng nhà kho để báo cáo kinh doanh thường xuyên)
-
Các mô hình rủi ro nâng cao hơn có thể cần phải tính đến dữ liệu phi cấu trúc, chẳng hạn như văn bản thô. (Hadoop có thể xử lý công việc đó hiệu quả.)