Trang Chủ Tài chính Cá nhân Những gì Người khai thác dữ liệu làm - núm vú

Những gì Người khai thác dữ liệu làm - núm vú

Mục lục:

Video: Khoa học dữ liệu (Data Science) ứng dụng thực tế ra sao? 2025

Video: Khoa học dữ liệu (Data Science) ứng dụng thực tế ra sao? 2025
Anonim

Nếu bạn nghĩ dữ liệu là nguyên vật liệu và thông tin bạn có thể nhận được từ dữ liệu như là một thứ có giá trị và tương đối tinh vi thì quá trình trích xuất thông tin có thể là so với việc chiết xuất kim loại từ quặng hoặc đá quý từ bụi bẩn. Đó là cách khai thác dữ liệu có nguồn gốc.

Tập trung vào kinh doanh khai thác dữ liệu

Các thợ mỏ dữ liệu không chỉ suy nghĩ dữ liệu một cách vô ích, hy vọng tìm thấy một cái gì đó thú vị. Mỗi dự án khai thác dữ liệu bắt đầu với một vấn đề kinh doanh cụ thể và mục tiêu để kết hợp.

Là một người khai thác dữ liệu, có thể bạn sẽ không có quyền đưa ra các quyết định kinh doanh cuối cùng, vì vậy điều quan trọng là bạn sắp xếp công việc của bạn với nhu cầu của người ra quyết định. Bạn phải hiểu những vấn đề, nhu cầu và sở thích của họ và tập trung nỗ lực của bạn vào việc cung cấp thông tin hỗ trợ các quyết định kinh doanh tốt.

Kiến thức kinh doanh của bạn rất quan trọng. Các nhà quản lý sẽ không ngồi cạnh bạn trong khi bạn làm việc, cung cấp phản hồi về sự liên quan của những khám phá của bạn với mối quan tâm của họ. Bạn phải sử dụng kinh nghiệm và sự nhạy bén của mình để đánh giá chính mình khi bạn làm việc.

Làm quen với quá trình khai thác dữ liệu

Quy trình làm việc tốt giúp bạn tận dụng tối đa thời gian, dữ liệu và tất cả các tài nguyên khác của bạn. Trong cuốn sách này, bạn sẽ khám phá ra quá trình khai thác dữ liệu phổ biến nhất, CRISP-DM. Đó là một chu kỳ sáu giai đoạn của khám phá và hành động được tạo ra bởi một tập đoàn các thợ mỏ dữ liệu từ nhiều ngành công nghiệp và một tiêu chuẩn mở mà bất cứ ai cũng có thể sử dụng.

Các bước của quá trình CRISP-DM là

Hiểu Doanh nghiệp

Hiểu Dữ liệu

  1. Chuẩn bị Dữ liệu

  2. Lập mô hình

  3. Đánh giá

  4. Triển khai (sử dụng mô hình trong kinh doanh hàng ngày)

  5. Mỗi giai đoạn mang trọng lượng bình đẳng trong tầm quan trọng đến chất lượng của kết quả và giá trị cho doanh nghiệp. Nhưng xét về thời gian cần thiết, việc chuẩn bị dữ liệu thống trị. Chuẩn bị dữ liệu thường mất nhiều thời gian hơn tất cả các giai đoạn khác của quá trình khai thác dữ liệu kết hợp.

  6. Làm mô hình

Khi mục tiêu được hiểu, dữ liệu được làm sạch và sẵn sàng sử dụng, bạn có thể chuyển sự chú ý của bạn để xây dựng các mô hình tiên đoán.Mô hình làm những gì báo cáo có thể không; họ cung cấp cho bạn thông tin hỗ trợ hành động.

Một báo cáo có thể cho bạn biết rằng doanh số bán hàng giảm. Nó có thể phá vỡ doanh thu theo khu vực, sản phẩm và kênh để bạn biết doanh số bán hàng bị từ chối và liệu những sự suy giảm này có phổ biến hoặc chỉ ảnh hưởng đến một số khu vực nhất định. Nhưng họ không cung cấp cho bạn bất kỳ manh mối về

tại sao

doanh số bán hàng bị từ chối hoặc hành động nào có thể giúp khôi phục lại doanh nghiệp. Các mô hình giúp bạn hiểu được các yếu tố ảnh hưởng đến doanh số bán hàng, các hoạt động có xu hướng tăng hoặc giảm doanh số bán hàng và các chiến lược và chiến thuật giúp doanh nghiệp của bạn hoạt động trơn tru. Đó là thú vị, phải không? Có lẽ đó là lý do tại sao hầu hết các thợ mỏ dữ liệu coi mô hình là phần thú vị của công việc. Hiểu các mô hình toán học

Các mô hình toán học là trung tâm khai thác dữ liệu, nhưng chúng là gì? Họ làm gì, làm việc như thế nào, và chúng được tạo ra như thế nào?

Một mô hình toán học là, đồng bằng và đơn giản, một phương trình, hoặc một tập hợp các phương trình, mô tả một mối quan hệ giữa hai hay nhiều thứ. Các phương trình như vậy là viết tắt cho các lý thuyết về hoạt động của tự nhiên và xã hội. Lý thuyết có thể được hỗ trợ bởi một cơ thể đáng kể bằng chứng hoặc nó có thể chỉ là một đoán hoang dã. Ngôn ngữ của toán học là như nhau trong cả hai trường hợp.

Các thuật ngữ như

mô hình tiên đoán, mô hình thống kê, hoặc mô hình tuyến tính đề cập đến các loại mô hình toán học cụ thể, tên phản ánh mục đích sử dụng, mẫu hoặc phương pháp phát sinh một mô hình cụ thể. Ba ví dụ này chỉ là một vài trong số nhiều thuật ngữ như vậy. Khi mô hình được đề cập trong cài đặt doanh nghiệp, rất có thể mô hình được sử dụng để đưa ra dự đoán. Các mô hình được sử dụng để dự đoán giá cổ phiếu, doanh số bán hàng, và tỷ lệ thất nghiệp, trong số nhiều thứ khác. Các dự đoán này có thể hoặc không chính xác, nhưng đối với bất kỳ tập hợp các giá trị nhất định (các yếu tố được biết đến như thế được gọi là

biến độc lập

hoặc đầu vào ) được bao gồm trong mô hình, bạn sẽ tìm một dự đoán được xác định rõ ràng (còn được gọi là phụ thuộc biến, đầu ra, hoặc kết quả ). Các mô hình toán học cũng được sử dụng cho các mục đích khác trong kinh doanh, chẳng hạn như mô tả các cơ chế làm việc hướng một quá trình cụ thể. Trong khai thác dữ liệu, bạn tạo các mô hình bằng cách tìm các mẫu trong dữ liệu sử dụng máy học hoặc các phương pháp thống kê. Người khai thác dữ liệu không theo cùng một cách tiếp cận chặt chẽ mà các nhà thống kê cổ điển làm, nhưng tất cả các mô hình đều bắt nguồn từ dữ liệu thực tế và các kỹ thuật mô hình toán học nhất quán. Tất cả các mô hình khai thác dữ liệu được hỗ trợ bởi một cơ thể bằng chứng. Tại sao phải sử dụng các mô hình toán học? Không thể mô tả các mối quan hệ như nhau bằng cách sử dụng các từ? Đó là có thể, nhưng bạn thấy lợi thế nhất định để sử dụng các phương trình. Bao gồm

Thuận tiện:

So với các mô tả tương đương được viết ra trong câu, các phương trình ngắn gọn. Biểu tượng toán học đã phát triển đặc biệt cho mục đích đại diện cho các mối quan hệ toán học; các ngôn ngữ như tiếng Anh thì không.

  • Độ tinh khiết: Các phương trình truyền tải những ý tưởng ngắn gọn và không mơ hồ.Chúng không phụ thuộc vào sự diễn giải khác nhau dựa trên văn hoá, và biểu tượng của toán học là một loại ngôn ngữ thông dụng được sử dụng rộng rãi trên toàn cầu.

  • Tính nhất quán: Bởi vì các biểu diễn toán học không rõ ràng, các hàm ý của bất kỳ tình huống cụ thể nào được xác định rõ ràng bởi một mô hình toán học.

  • Đưa thông tin vào hành động Một mô hình chỉ mang lại giá trị khi bạn sử dụng nó trong kinh doanh. Các dự đoán của mô hình có thể hỗ trợ quá trình ra quyết định bằng nhiều cách khác nhau. Bạn có thể

Kết hợp các dự đoán vào một báo cáo hoặc bài thuyết trình được sử dụng để đưa ra quyết định cụ thể.

Tích hợp mô hình vào một hệ thống hoạt động (như một hệ thống dịch vụ khách hàng) để cung cấp dự đoán thời gian thực cho việc sử dụng hàng ngày. (Ví dụ: bạn có thể đặt cược yêu cầu bồi thường bảo hiểm cho thanh toán ngay lập tức, từ chối ngay lập tức hoặc điều tra thêm)

  • Sử dụng mô hình dự đoán lô. (Ví dụ: bạn có thể ghi lại danh sách khách hàng trong nhà để quyết định khách hàng nào sẽ nhận được một đề nghị cụ thể.)

Những gì Người khai thác dữ liệu làm - núm vú

Lựa chọn của người biên tập

Cách chuyển đổi điện áp Hiện tại Bật và Tắt - núm vú

Cách chuyển đổi điện áp Hiện tại Bật và Tắt - núm vú

Chuyển mạch là chức năng quan trọng nhất trong thiết bị điện tử. Hãy nghĩ đến bộ TV của bạn: Bạn bật và tắt nguồn, chọn nguồn tín hiệu từ các lựa chọn đầu vào khác nhau (như đầu DVD, hộp cáp hoặc hệ thống chơi game) và thay đổi kênh truyền hình. Màn hình TV của bạn bao gồm hàng triệu điểm ảnh nhỏ (hình ảnh ...

Làm thế nào để Solder một Solid Joint trong Dự án Điện tử của bạn - núm vú

Làm thế nào để Solder một Solid Joint trong Dự án Điện tử của bạn - núm vú

Làm thế nào để Solder một Solid Joint trong dự án Điện tử của bạn < hình thức hàn phổ biến nhất khi tạo ra các dự án điện tử là thành phần hàn dẫn đến miếng đồng ở mặt sau của một bảng mạch in. Nếu bạn có thể làm điều đó, bạn sẽ không có vấn đề với các loại hàn khác, chẳng hạn như hàn hai dây với nhau hoặc hàn một dây vào một thiết bị đầu cuối chuyển đổi. Sau đây ...

ÁNh sáng-O-Rama Sequences được sử dụng trong chiếu sáng - đầu

ÁNh sáng-O-Rama Sequences được sử dụng trong chiếu sáng - đầu

Ở Light-O-Rama , một dãy được biểu diễn dưới dạng một lưới tương tự như lưới trong một chương trình bảng tính. Ví dụ, hình ảnh cho thấy một phần của một chuỗi rất đơn giản, trong đó đèn trên các kênh 1, 3 và 5 luân phiên bật và tắt mỗi nửa giây. Mỗi hàng trong lưới đại diện cho một ...

Lựa chọn của người biên tập

Làm thế nào để Tạo một trang Blog trong SharePoint - núm vú

Làm thế nào để Tạo một trang Blog trong SharePoint - núm vú

Để Tạo một blog trong SharePoint, bạn tạo ra một trang web mới hoặc địa điểm phụ. Dành thời gian để xem xét nơi blog này sẽ nằm trong thứ bậc trang web của bạn. Mặc dù bạn có thể thay đổi quyền ở bất kỳ mức nào, bạn vẫn có thể có blog tổng thống của bạn trên trang chính của SharePoint Intranet của bạn (và ...

Làm thế nào để tạo một ứng dụng tùy chỉnh trong SharePoint 2013 - núm vú

Làm thế nào để tạo một ứng dụng tùy chỉnh trong SharePoint 2013 - núm vú

Bạn tạo một ứng dụng tùy chỉnh sử dụng Custom Liệt kê ứng dụng. Ứng dụng Danh sách tùy chỉnh tạo ra một ứng dụng danh sách rất cơ bản mà sau đó bạn có thể tuỳ chỉnh cho kịch bản cụ thể của mình. Thực hiện theo các bước sau để tạo một ứng dụng tùy chỉnh: Nhấp vào biểu tượng bánh răng Cài đặt và chọn Thêm một ứng dụng. Trang Ứng dụng của bạn được hiển thị. Nhấp vào ...

Làm thế nào để Tạo một Thảo luận Ban App trong SharePoint - núm vú

Làm thế nào để Tạo một Thảo luận Ban App trong SharePoint - núm vú

Thêm một ứng dụng thảo luận trên SharePoint một quá trình rất đơn giản. Bạn chỉ cần chọn ứng dụng Thảo luận từ trang Apps You Can Add. Bạn có thể thêm nhiều bảng thảo luận vào trang web của mình như bạn muốn. Bạn có thể thấy nó mang lại lợi ích cho việc tạo ra một bảng thảo luận cho mỗi khu chức năng để giữ ...

Lựa chọn của người biên tập

Máy tính giả mạo dành cho Android hoặc Điều gì đặc biệt về Số 5554? - núm vú

Máy tính giả mạo dành cho Android hoặc Điều gì đặc biệt về Số 5554? - núm vú

Khi bạn khởi động trình mô phỏng thiết bị Android, tên của trình mô phỏng mới là cái gì đó giống như trình mô phỏng-5554 hoặc trình mô phỏng-5556. Tên bắt nguồn từ thực tế là mỗi lần chạy của trình mô phỏng Android sử dụng hai số cổng (hai kênh để giao tiếp với máy tính phát triển). Như bạn đã biết, trình duyệt web của bạn thường sử dụng số cổng 80 ...

Kích hoạt Chế độ xem trên Ứng dụng iOS của bạn - núm vú

Kích hoạt Chế độ xem trên Ứng dụng iOS của bạn - núm vú

Bất cứ khi nào bạn chỉ định một giá trị mới cho chế độ xem nhất định tài sản (như khung và thuộc tính của trung tâm), chế độ xem sẽ được vẽ lại ngay lập tức và thay đổi hiển thị ngay lập tức trên màn hình. Ngoài ra, thay đổi đối với một số thuộc tính xem (chẳng hạn như các thuộc tính được đề cập) có thể được hoạt hình. Điều này có nghĩa là việc thay đổi thuộc tính sẽ tạo ra hình ảnh động ...

Android: Sử dụng IDE Eclipse cho Phát triển Java - núm vú

Android: Sử dụng IDE Eclipse cho Phát triển Java - núm vú

Ngày nay, sử dụng một môi trường phát triển tích hợp (IDE) để phát triển Java dễ dàng hơn. IDE được chấp nhận rộng rãi nhất trong số các nhà phát triển Java là Eclipse. Bảng này cung cấp cho bạn các mẹo nhanh để sử dụng IDE Eclipse để phát triển các ứng dụng Android. Nhiệm vụ Làm thế nào để hoàn thành Bắt đầu một dự án mới của Android Từ màn hình Dự án mới, dưới Android ...