Trang Chủ Tài chính Cá nhân Gian lận Phát hiện với Hadoop - núm vú

Gian lận Phát hiện với Hadoop - núm vú

Video: BIG DATA for Management - Dữ liệu lớn trong quản trị doanh nghiệp - Đào tạo Tập Đoàn Trí Việt 2025

Video: BIG DATA for Management - Dữ liệu lớn trong quản trị doanh nghiệp - Đào tạo Tập Đoàn Trí Việt 2025
Anonim

Khối lượng giao dịch thật lớn khiến khó phát hiện gian lận vì khối lượng dữ liệu, trớ trêu thay, cùng một thách thức này có thể giúp tạo ra các mô hình dự đoán gian lận tốt hơn - một khu vực mà Hadoop tỏa sáng.

Trong thế giới kết nối ngày nay, khối lượng tuyệt đối và sự phức tạp của giao dịch làm cho việc tìm kiếm gian lận trở nên khó khăn hơn bao giờ hết. Cái được gọi là "tìm kim ở đống cỏ khô" đã trở thành nhiệm vụ "tìm kim đặc biệt trong đống kim. "

Cách tiếp cận truyền thống để phòng ngừa gian lận không hiệu quả lắm. Ví dụ, việc quản lý các khoản thanh toán không phù hợp thường được quản lý bởi các nhà phân tích kiểm tra số tiền yêu cầu bồi thường rất nhỏ kết hợp với yêu cầu tài liệu y tế từ các người gửi đích. Thuật ngữ ngành của mô hình này là trả tiền và đuổi theo: Các yêu cầu bồi thường được chấp nhận và thanh toán và các quá trình tìm kiếm các khoản thanh toán quá mức cố ý hoặc không chủ ý bằng cách xem xét lại sau khi thanh toán cho những khiếu nại đó.

Vì vậy, làm thế nào là gian lận phát hiện được thực hiện ngay bây giờ? Do những hạn chế của công nghệ truyền thống, mô hình gian lận được xây dựng bằng cách lấy mẫu dữ liệu và sử dụng mẫu để xây dựng một bộ mô hình dự báo gian lận và kiểm tra. Khi bạn đối chiếu mô hình này với bộ phận gian lận dựa trên Hadoop, sử dụng bộ dữ liệu đầy đủ - không lấy mẫu - để xây dựng mô hình, bạn có thể thấy sự khác biệt.

Chủ đề thường xuyên phổ biến nhất mà bạn thấy trong hầu hết các trường hợp sử dụng Hadoop là nó hỗ trợ doanh nghiệp vượt qua mức trần thủy tinh về khối lượng và nhiều dữ liệu có thể được đưa vào phân tích quyết định. Bạn càng có nhiều dữ liệu (và bạn lưu trữ nhiều lịch sử hơn nữa) thì mô hình của bạn càng tốt.

Việc trộn các hình thức dữ liệu phi truyền thống với tập hợp các giao dịch lịch sử có thể làm cho mô hình gian lận của bạn trở nên mạnh mẽ hơn. Ví dụ, nếu một công nhân bồi thường thiệt hại cho người lao động về hậu quả xấu do sự cố trượt và ngã, có hàng triệu trường hợp kết cục bệnh nhân điều trị chi tiết và thời gian hồi phục giúp tạo ra một mẫu phát hiện gian lận.

Là một ví dụ về làm thế nào mà mô hình này có thể hoạt động được, hãy thử tưởng tượng xem liệu những bệnh nhân ở nông thôn có phục hồi chậm hơn so với những người ở khu vực thành thị hay không. Bạn có thể bắt đầu bằng cách kiểm tra sự gần gũi với các dịch vụ vật lý trị liệu. Có sự tương quan giữa thời gian phục hồi và vị trí địa lý không?

Nếu cơ quan gian lận của bạn xác định rằng một thương tích nào đó sẽ mất ba tuần hồi phục nhưng người nông dân có cùng chẩn đoán sống cách bác sĩ vật lý trị liệu một giờ đồng hồ và nhân viên văn phòng có một người thực hành trong văn phòng của cô, đó là một biến khác để thêm vào gian lận mẫu khám phá.

Khi bạn thu thập dữ liệu về mạng xã hội cho người yêu cầu bồi thường và tìm một bệnh nhân có khiếu nại về chứng sổ xích tự hào về việc hoàn thành một loạt các sự kiện về sức chịu đựng được gọi là Tough Mudder, đây là một ví dụ về việc trộn các loại dữ liệu mới với các mẫu dữ liệu truyền thống để phát hiện gian lận.

Nếu bạn muốn kích hoạt nỗ lực phát hiện gian lận của mình thành thiết bị cao hơn, tổ chức của bạn có thể làm việc để tách khỏi mô hình phân khúc thị trường và chuyển sang mô hình giao dịch ở mức giao dịch hoặc theo người.

Rất đơn giản, việc đưa ra dự báo dựa trên một phân đoạn là hữu ích, nhưng việc đưa ra quyết định dựa trên thông tin cụ thể về một giao dịch cá nhân rõ ràng là tốt hơn. Để làm điều này, bạn phải làm việc với một bộ dữ liệu lớn hơn so với thông thường là có thể trong cách tiếp cận truyền thống. Chỉ có thể sử dụng (tối đa) 30 phần trăm thông tin hiện có có thể hữu ích cho mô hình gian lận.

Để tạo các mô hình phát hiện gian lận, Hadoop rất phù hợp với

  • Khối lượng xử lý: Điều đó có nghĩa là xử lý bộ dữ liệu đầy đủ - không lấy mẫu dữ liệu.

  • Quản lý các kiểu dữ liệu mới: Ví dụ bao gồm các dịch vụ chăm sóc gần nhau để chăm sóc và các vòng kết nối xã hội để trang trí cho mô hình gian lận.

  • Duy trì môi trường nhanh: Cho phép phân tích và thay đổi các mô hình hiện có.

Người lập mô hình gian lận có thể thêm và kiểm tra các biến mới cho mô hình mà không cần đưa ra đề xuất cho nhóm quản trị cơ sở dữ liệu của bạn và sau đó đợi vài tuần để phê duyệt một thay đổi giản đồ và đặt nó vào môi trường của họ.

Quy trình này rất quan trọng đối với việc phát hiện gian lận vì các môi trường năng động thường có các mẫu gian lận theo chu kỳ đến và đi theo giờ, ngày hoặc tuần. Nếu dữ liệu được sử dụng để xác định hoặc tăng cường mô hình phát hiện gian lận mới là không có sẵn tại một thời điểm thông báo, do thời gian bạn khám phá những mô hình mới, có thể là quá muộn để ngăn ngừa thiệt hại.

Đánh giá lợi ích cho doanh nghiệp của bạn không chỉ bằng cách xây dựng các mô hình toàn diện hơn với nhiều loại dữ liệu hơn mà còn có thể làm mới và nâng cao những mô hình đó nhanh hơn bao giờ hết. Công ty có thể làm mới và nâng cao các mô hình hàng ngày sẽ tốt hơn giá trị hàng tháng.

Bạn có thể tin rằng vấn đề này có một câu trả lời đơn giản - chỉ cần yêu cầu CIO cho chi phí hoạt động (OPEX) và phê duyệt chi tiêu vốn (CAPEX) để chứa nhiều dữ liệu hơn để làm mô hình tốt hơn và tải 70 phần trăm khác của dữ liệu vào mô hình quyết định.

Bạn thậm chí có thể tin rằng đầu tư này sẽ trả tiền cho chính nó với sự phát hiện gian lận tốt hơn; tuy nhiên, vấn đề với cách tiếp cận này là chi phí cao phía trước cần được chìm vào dữ liệu chưa biết , nơi bạn không biết liệu nó có bất kỳ cái nhìn sâu sắc thực sự có giá trị nào.

Chắc chắn, gấp ba lần kích thước kho dữ liệu của bạn, sẽ cho phép bạn truy cập nhiều hơn vào dữ liệu lịch sử có cấu trúc để tinh chỉnh mô hình của bạn nhưng họ không thể chấp nhận các vụ xáo trộn trên phương tiện truyền thông xã hội. Các công nghệ truyền thống cũng không nhanh bằng. Hadoop giúp bạn dễ dàng đưa ra các biến số mới vào mô hình và nếu họ không thực hiện cải tiến mô hình, bạn chỉ cần hủy dữ liệu và tiếp tục.

Gian lận Phát hiện với Hadoop - núm vú

Lựa chọn của người biên tập

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Web Marketing: Loại bỏ đăng ký và đăng nhập để đảm bảo khả năng hiển thị - núm vú

Tiếp thị web, một cách để đảm bảo khả năng hiển thị là để loại bỏ đăng ký và các hình thức đăng nhập. Khách truy cập thường phải hoàn thành các biểu mẫu này trước khi họ có thể tải xuống một số loại nội dung cao cấp, chẳng hạn như giấy trắng hoặc trước khi họ có thể đọc một số bài viết trên trang web. Các công ty đã đưa chúng vào vị trí vì họ muốn dẫn ...

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Web Marketing: Làm thế nào để Tránh Duplicate Content - núm vú

Duplicate nội dung cần tránh trong web tiếp thị và Google cung cấp công cụ để phát hiện thông tin lặp lại. Không có gì gây tổn hại cho việc tìm kiếm nội dung có liên quan của công cụ tìm kiếm cũng như tìm ra chính xác những từ giống nhau trên hai trang khác nhau. Sao chép là xấu vì những lý do này: Sao chép được sử dụng để được một chiến thuật được sử dụng để đánh lừa ...

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Web Marketing: Làm thế nào để Deal với Broken Links - núm vú

Trong bài hát của họ. Là một nhà tiếp thị web, việc xử lý các liên kết hỏng này có thể giúp đảm bảo sự thành công của trang web của bạn. Nếu một công cụ tìm kiếm đạt đến một liên kết bị hỏng, nó không thể tìm thấy trang bạn dự định (rõ ràng) - nhưng nó cũng có thể bỏ trên trang web của bạn hoặc giảm sự liên quan ...

Lựa chọn của người biên tập

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Các kiểu dữ liệu điểm nổi trong Java - núm vú

Số dấu phẩy động là số có các phần phân đoạn (thường được thể hiện bằng dấu thập phân). Bạn nên sử dụng một kiểu điểm nổi trong các chương trình Java bất cứ khi nào bạn cần một số có số thập phân, như là 19. 95 hoặc 3. 1415. Java có hai kiểu nguyên thủy cho các số dấu phẩy: float: Sử dụng 4 byte gấp đôi: Sử dụng 8 bytes Trong hầu hết tất cả ...

Tải phiên bản mới nhất của Java - núm vú

Tải phiên bản mới nhất của Java - núm vú

Trước khi bạn có thể viết các chương trình Java cho các thiết bị Android, bạn cần một số phần mềm công cụ, bao gồm cả phiên bản mới nhất của Java. Bạn có thể có được phiên bản Java mới nhất và lớn nhất bằng cách truy cập vào trang web Java. Trang web cung cấp một số lựa chọn thay thế. (Được giới thiệu) Nhấp chuột vào nút Free Java Download trên trang chính của trang web. Đối với hầu hết các máy tính, ...

Thử nghiệm với JShell - núm vú

Thử nghiệm với JShell - núm vú

JShell là một công cụ Java 9 cho phép bạn khám phá về lập trình. JShell làm cho nó dễ dàng để chơi xung quanh mà không sợ hậu quả thảm khốc. Các chương trình Java thường sử dụng cùng kiểu cũ, lúng túng: public class SomethingOrOther {public static void main (String args []) {Một chương trình Java đòi hỏi sự giới thiệu này bởi vì trong Java ...

Lựa chọn của người biên tập

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Hẹn hò Sau 50: Tâm linh và Tôn giáo - những con voi

Bản quyền © 2014 AARP Tất cả các quyền được bảo lưu. Tâm linh và tôn giáo, tình dục, những trò vui nhộn nhịp, sự tham gia của gia đình, lối sống và tiền bạc - tất cả những điều này thường quan trọng đối với những người trên 50 tuổi, nhưng bạn có thể đặt một số cao hơn những người khác. Trong bất kỳ trường hợp nào, điều quan trọng là phải suy nghĩ về họ trước để bạn có thể thảo luận ...

Hẹn hò Sau 50: Nói về Monogami - vú

Hẹn hò Sau 50: Nói về Monogami - vú

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Một vợ một chồng là một vấn đề lớn cho dù bạn là người chưa sẵn sàng cho vợ chồng một vợ chồng và muốn hẹn hò xung quanh hay người chỉ có thể quan hệ tình dục với một người một lần. Đảm bảo đối tác hẹn hò của bạn biết bạn đang đứng ở đâu (hoặc nằm xuống) đối với vợ chồng một vợ chồng ...

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Hẹn hò Sau 50: Thảo luận về sức khoẻ cá nhân của bạn - những con voi

Bản quyền © 2014 AARP. Đã đăng ký Bản quyền. Nếu bạn bị bệnh mãn tính hoặc đe dọa đến mạng sống khi bạn còn nhỏ, bạn đã có kinh nghiệm về sức khoẻ của mình. Có thể bạn phải liên tục kể câu chuyện về vết sẹo ngực hoặc nẹp chân hoặc giải thích số ít các viên thuốc mà bạn phải dùng mỗi ngày. Nó không phải ...