Trang Chủ Tài chính Cá nhân ÁP dụng Phân tích Hợp phần Chính cho Các Phân tích Tiên đoán- nồng độ

ÁP dụng Phân tích Hợp phần Chính cho Các Phân tích Tiên đoán- nồng độ

Video: Phân tích 8 câu đầu bài thơ Việt Bắc - thầy Nhật dạy văn 2025

Video: Phân tích 8 câu đầu bài thơ Việt Bắc - thầy Nhật dạy văn 2025
Anonim

Phân tích thành phần chính (PCA) là một kỹ thuật có giá trị được sử dụng rộng rãi trong phân tích tiên đoán và khoa học dữ liệu. Nó nghiên cứu một tập dữ liệu để tìm hiểu các biến có liên quan nhất chịu trách nhiệm cho biến thể cao nhất trong tập dữ liệu đó. PCA hầu hết được sử dụng như một kỹ thuật giảm dữ liệu.

Trong khi xây dựng mô hình dự đoán, bạn có thể cần giảm số lượng các tính năng mô tả tập dữ liệu của mình. Rất hữu ích để giảm chiều cao của dữ liệu thông qua kỹ thuật xấp xỉ, tại đó PCA trội hơn. Dữ liệu xấp xỉ tóm tắt tất cả các biến thể quan trọng của dữ liệu ban đầu.

Việc tìm ra những biến số tiên đoán quan trọng nhất là cốt lõi của việc xây dựng mô hình tiên đoán. Cách nhiều người đã làm là sử dụng một phương pháp tiếp cận vũ lực. Ý tưởng là bắt đầu bằng nhiều biến liên quan nhất có thể và sau đó sử dụng phương pháp tiếp cận kênh để loại bỏ các tính năng không ảnh hưởng hoặc không có giá trị tiên đoán.

Để giúp quá trình này, các nhà khoa học dữ liệu sử dụng nhiều công cụ phân tích tiên đoán giúp cho việc chạy nhiều hoán vị và phân tích trên một tập dữ liệu dễ dàng hơn và nhanh hơn để đo lường tác động của mỗi biến trên tập dữ liệu đó.

Biết rằng có nhiều dữ liệu để làm việc, bạn có thể sử dụng PCA để được giúp đỡ.

Giảm số lượng các biến bạn xem là lý do đủ để sử dụng PCA. Ngoài ra, bằng cách sử dụng PCA, bạn sẽ tự động bảo vệ bản thân khỏi việc sử dụng mô hình.

Chắc chắn, bạn có thể tìm thấy mối tương quan giữa dữ liệu thời tiết ở một quốc gia và hiệu suất của thị trường chứng khoán. Hoặc với màu sắc của đôi giày của một người và tuyến đường mà cô ấy hoặc cô ấy mang đến văn phòng và việc thực hiện danh mục đầu tư cho ngày đó. Tuy nhiên, bao gồm cả những biến số trong một mô hình dự báo không chỉ là quá mức, điều này gây hiểu nhầm và dẫn đến các dự đoán sai.

PCA sử dụng cách tiếp cận có tính toán học để xác định tập hợp con của tập dữ liệu của bạn bao gồm các tính năng quan trọng nhất; trong việc xây dựng mô hình của bạn trên số liệu nhỏ hơn đó, bạn sẽ có một mô hình có giá trị tiên đoán cho tổng thể, tập dữ liệu lớn hơn mà bạn đang làm việc. Nói tóm lại, PCA sẽ giúp bạn hiểu được các biến của bạn bằng cách xác định tập con của các biến chịu trách nhiệm về biến thể nhiều nhất với tập dữ liệu ban đầu của bạn. Nó giúp bạn phát hiện sự dư thừa. Nó giúp bạn tìm ra rằng hai (hoặc nhiều biến hơn) đang nói cho bạn cùng một điều.

Hơn nữa, các phân tích thành phần chính lấy tập dữ liệu đa chiều của bạn và tạo ra một tập dữ liệu mới có các biến đại diện cho tính tuyến tính của các biến trong tập dữ liệu ban đầu. Ngoài ra, tập dữ liệu đầu ra có các biến không tương quan cá nhân, và phương sai của chúng được sắp xếp theo các thành phần chính của chúng trong đó phần đầu tiên là lớn nhất, v.v. Về vấn đề này, PCA cũng có thể được coi là một kỹ thuật để xây dựng các tính năng.

Trong khi sử dụng PCA hoặc các kỹ thuật tương tự khác giúp giảm chiều kích của bộ dữ liệu mà bạn đang xử lý, bạn phải luôn thận trọng để không làm ảnh hưởng tiêu cực đến hiệu suất của mô hình. Việc giảm kích thước của dữ liệu không nên gây ảnh hưởng tiêu cực đến hiệu suất (độ chính xác của mô hình tiên đoán). Giữ an toàn và quản lý tập dữ liệu một cách an toàn.

Sự phức tạp tăng lên của một mô hình không chuyển thành chất lượng cao hơn trong kết quả.

Để bảo vệ hiệu suất của mô hình, bạn có thể cần phải đánh giá cẩn thận hiệu quả của mỗi biến, đo tính hữu ích của nó trong việc định hình mô hình cuối cùng.

Biết rằng PCA có thể đặc biệt hữu ích khi các biến có độ tương quan cao trong một bộ dữ liệu nhất định, sau đó có một bộ dữ liệu với các biến số dự báo không tương quan chỉ có thể làm phức tạp nhiệm vụ giảm dimensionality của dữ liệu đa biến. Nhiều kỹ thuật khác có thể được sử dụng ở đây ngoài PCA, chẳng hạn như lựa chọn tính năng chuyển tiếp và loại bỏ tính năng lạc hậu.

PCA không phải là viên đạn ma thuật sẽ giải quyết tất cả các vấn đề với dữ liệu đa chiều. Thành công của nó là rất phụ thuộc vào dữ liệu bạn đang làm việc với. Sự sai số thống kê có thể không phù hợp với các biến với các giá trị tiên đoán nhất, mặc dù nó an toàn để làm việc với các phép xấp xỉ như vậy.

ÁP dụng Phân tích Hợp phần Chính cho Các Phân tích Tiên đoán- nồng độ

Lựa chọn của người biên tập

Quản trị mạng Không dây: Rogue Access Points - những con vú

Quản trị mạng Không dây: Rogue Access Points - những con vú

Một trong những vấn đề lớn nhất mà các quản trị viên mạng phải giải quyết là vấn đề của rogue điểm truy cập. Một điểm truy cập rogue là một điểm truy cập mà đột nhiên xuất hiện trên mạng của bạn. Điều thường xảy ra là một nhân viên quyết định kết nối máy tính xách tay với mạng thông qua mạng không dây ...

Quản trị Mạng Không dây: Thiết lập Hotspot - núm vú

Quản trị Mạng Không dây: Thiết lập Hotspot - núm vú

Do đó bạn sở hữu một quán cà phê nhỏ và bạn nghĩ nó sẽ được mát mẻ để thiết lập một điểm nóng cho khách hàng của bạn để sử dụng, eh? Nếu bạn muốn thiết lập một hotspot miễn phí, đây là tất cả những gì bạn cần: Một kết nối Internet băng rộng đáng tin cậy. DSL, cáp, hoặc T-1 sẽ hoạt động độc đáo. Điểm truy cập không dây. Đối với một ...

Quản trị Mạng Không dây: Hiểu Phạm vi Dummies

Quản trị Mạng Không dây: Hiểu Phạm vi Dummies

Khoảng tối đa của thiết bị không dây chuẩn 802. 11 trong nhà khoảng 300 đôi chân. Điều này có thể có một hiệu ứng thú vị khi bạn có được một loạt các máy tính không dây với nhau - như vậy mà một số trong số họ nằm trong phạm vi của nhau, nhưng những người khác thì không. Ví dụ, giả sử Wally, Ward, và Beaver đều có ...

Lựa chọn của người biên tập

Outlook là gì? com? - núm vú giả

Outlook là gì? com? - núm vú giả

Triển vọng. com là một dịch vụ e-mail dựa trên web miễn phí do Microsoft cung cấp. Nó giống như dịch vụ Gmail của Google nhưng có một sự xoắn - một liên kết tới dữ liệu Outlook trên máy tính để bàn của bạn. Microsoft đã kết hợp Hotmail và Windows Live vào một dịch vụ e-mail, đồng thời hỗ trợ các địa chỉ liên lạc (bao gồm Facebook, Twitter và LinkedIn) và lịch của bạn. Bạn có thể ...

Mười Phụ kiện cho Outlook 2013 - núm vú

Mười Phụ kiện cho Outlook 2013 - núm vú

Triển vọng 2013 có thể làm được nhiều cho bạn mà không cần bất kỳ trợ giúp bên ngoài, các phụ kiện được xem như có thể làm cho cuộc sống của bạn dễ dàng hơn. Một số phụ kiện yêu thích tạo nên khả năng mà Outlook nên có nhưng không. Một số phụ kiện giúp bạn sử dụng dữ liệu Outlook của mình ở mọi nơi, mọi lúc. Điện thoại thông minh Điện thoại thông minh hiện có ở khắp mọi nơi, và có lẽ là ...

Chuyến tham quan giao diện Microsoft Outlook - núm vú

Chuyến tham quan giao diện Microsoft Outlook - núm vú

Triển vọng 2013 giống như các ứng dụng Office 2013 khác bằng nhiều cách. Ví dụ: nó có Ribbon, một tab File mở ra khung nhìn Backstage và một thanh trạng thái hiển thị thông điệp trạng thái và cung cấp một thanh trượt Zoom để thay đổi độ phóng đại của nội dung của ứng dụng. Điều duy nhất về Outlook là nó có nhiều ...

Lựa chọn của người biên tập

Cách sử dụng bản sao của Tài Khoản của Tập tin Dữ liệu QuickBooks năm 2014- núm vú

Cách sử dụng bản sao của Tài Khoản của Tập tin Dữ liệu QuickBooks năm 2014- núm vú

Cho dù khách hàng có chuyển bản sao của một kế toán của tập tin dữ liệu QuickBooks, gửi e-mail bản sao của kế toán, hoặc gửi bản sao của kế toán qua dịch vụ chuyển file Intuit, bạn sử dụng bản sao của kế toán bằng cách chọn File → Accountant Copy → Open & Convert Transfer Lệnh tập tin. Khi bạn chọn lệnh này, QuickBooks sẽ hiển thị một loạt các

Làm thế nào để Turn Job ước tính vào một Hoá đơn trong QuickBooks 2015 - núm vú

Làm thế nào để Turn Job ước tính vào một Hoá đơn trong QuickBooks 2015 - núm vú

QuickBooks nghĩa vụ phải làm cho cuộc sống dễ dàng hơn, phải không? Tại sao phải tạo một hóa đơn hoàn toàn mới cho một công việc mà bạn đã tạo ước tính công việc? Bạn có thể dễ dàng biến ước tính thành một hóa đơn bằng cách làm theo các bước đơn giản sau:

Cách sử dụng Ước tính việc làm trong QuickBooks 2012 - núm vú

Cách sử dụng Ước tính việc làm trong QuickBooks 2012 - núm vú

Nếu bạn đã nói với QuickBooks 2012 mà bạn muốn để tạo ước tính - bạn thực hiện việc này trong quá trình thiết lập QuickBooks - bạn có thể tạo dự toán công việc về số tiền mà bạn lập hoá đơn sau. Để tạo ước tính công việc, hãy chọn lệnh Khách hàng → Tạo Ước tính. QuickBooks hiển thị cửa sổ Tạo Ước tính. Tóm lại, bạn điền vào Ước tính Tạo ...