Variance Inflation Factor Là Gì

khắc chế nhiều cùng tuyến đường bởi Ridge, Ridge là một trong cách thức hồi quy phi tuyến đường tính; Trong ví dụ này họ không bàn về khái niệm của các định nghĩa, trường hợp những bạn có nhu cầu quan tâm mang đến các quan niệm vui tươi truy vấn vào link trên; Chúng ta chỉ triệu tập vào hạn chế và khắc phục đa cộng đường bởi phương thức hồi quy ridge trên ứng dụng thống kê lại R.

Bạn đang xem: Variance inflation factor là gì

Trong thực tiễn khi phân tích họ thường phát hiện hiện tượng nhiều cùng con đường, đặc biệt là trong những phân tích về kinh tế. đó là một không đúng phạm cực kỳ nghiêm trọng là cho ước chừng hồi quy của bọn họ bị chệch với không còn đúng chuẩn nữa ! Để phân biệt hiện tượng lạ đa cùng tuyến trong mô hình phân tích, chúng ta cần sử dụng chỉ số VIF là đúng mực tuyệt nhất, không sử dụng hệ số tương quan tốt R2.


Mục lục bài viết


VIF là gì ?Bài thực hànhKhắc phục đa cộng con đường bằng hồi quy Ridge

VIF là gì ?

Trong thống kê , hệ số lạm phát kinh tế pmùi hương không nên (Variance inflation factor – VIF ) là thương số của phương thơm không đúng vào một mô hình có không ít số hạng bằng phương không đúng của một mô hình chỉ bao gồm một thuật ngữ. Nó định lượng mức độ nghiêm trọng của đa cùng tuyến đường vào phân tích hồi quy bình pmùi hương nhỏ dại duy nhất thông thường . Nó cung ứng một chỉ số tính toán cường độ chênh lệch (bình phương độ lệch chuẩn của ước tính) của một thông số hồi quy dự trù được tạo thêm bởi vì cùng tuyến đường.

Ta bao gồm cách làm tính VIF như sau:

VIF = 1/ (1-R2)

Mối tương quan thân VIF với R2

Mối tình dục này được bao hàm vào bảng sau:


HOT:


*

Hướng dẫn phân team tài liệu Cluster Analysis SPSS


*

Thuật tân oán hỗ trợ trang bị vec-tơ Support vector machines


*

Nghiên cứu vớt định tính 2022 Nghiên cứu vãn định lượng


*

Phân biệt biến số cùng với tham mê số


R2VIF
0.11.010101
0.21.041667
0.31.098901
0.41.190476
0.51.333333
0.61.5625
0.71.960784
0.82.777778
0.95.263158
0.915.817336
0.926.510417
0.937.401925
0.948.591065
0.9510.25641
0.9612.7551
0.9716.92047
0.9825.25253
0.9950.25126

Khi họ bao gồm thông số khẳng định R2 >90, thì đấy là một cách để nhận ra trong mô hình nghiên cứu và phân tích của chúng ta đang sẵn có hiện tượng kỳ lạ đa cùng tuyến, giả dụ bọn họ không tồn tại biện pháp nào không giống prúc thì công dụng hồi quy vẫn không hề đúng chuẩn nữa.

Tùy vào những phân tích và tất cả cường độ xét nhiều tuyến đường tính dễ tuyệt tương khắc khe, nó sẽ nằm trong 2 mức:

VIF VIF

Trong ví dụ tiếp theo sau, bọn họ sử dụng mức xét collinearity dễ dàng tức VIF Mối tương quan giữa cor cùng với VIF

Có một vài tài liệu của nước ta họ bảo rằng hệ số tương quan cor>0.6 là có hiện tượng kỳ lạ đa cộng con đường, vụ việc này mình xác định với các bạn là không đủ địa thế căn cứ nhằm xác minh sai phạm vào mô hình; vào bài viết này công ty chúng tôi chỉ tập trung cùng với mối quan hệ của VIF với R2 còn quan hệ giữa COR với R2 chúng tôi hứa hẹn vào nội dung bài viết không giống.

Đa cộng đường là gì ?

Trong thống kê lại , multicollinearity (cũng là collinearity ) là 1 trong hiện tượng trong các số ấy một vươn lên là dự đoán trong mô hình hồi quy bội rất có thể được dự đoán tuyến đường tính tự các biến chuyển không giống với độ đúng chuẩn đáng kể. Trong trường hợp này, những dự trù hệ số của hồi quy bội hoàn toàn có thể thay đổi thất thường để đáp ứng cùng với số đông biến hóa nhỏ dại trong quy mô hoặc dữ liệu. Multicollinearity ko có tác dụng bớt sức khỏe dự đoán hoặc độ tin tưởng của tổng thể quy mô, tối thiểu là vào tập dữ liệu mẫu; nó chỉ ảnh hưởng mang lại các tính toán thù liên quan mang lại những nhân tố dự đoán đơn nhất. Đó là, một mô hình hồi quy nhiều trở nên cùng với các yếu tố dự đoán cộng con đường hoàn toàn có thể cho biết thêm cục bộ gói dự đân oán biến dự đân oán tác dụng xuất sắc ra làm sao , tuy vậy nó hoàn toàn có thể ko giới thiệu tác dụng hợp lệ về bất kỳ dự đân oán trơ tráo làm sao, hoặc về dự đoán thù làm sao là dự trữ so với tín đồ khác.


Lưu ý rằng trong số tuim bố về những mang định cơ bản so sánh hồi quhệt như bình phương về tối thiểu thông thường , các trường đoản cú “không có đa cùng tuyến” thường đề cập đến sự vắng phương diện của nhiều hình hoàn hảo , sẽ là quan hệ tuyến tính đúng chuẩn (ko ngẫu nhiên) giữa những nguyên tố dự đân oán. Trong ngôi trường đúng theo đó, ma trận dữ liệu X bao gồm thấp hơn loại rất đầy đủ , với vì thế ma trận thời khắc X T X bắt buộc hòn đảo ngược . Trong đa số ngôi trường hòa hợp này, cho 1 quy mô tuyến tính nói phổ biến y = Xβ +ε, chế độ ước lượng bình phương thơm bé dại nhất βols = (X T X)-1 XTy không mãi sau.

Xem thêm: Cách Làm Tua Rua Cho Quần Jean S Tua Rua, Cách Làm Quần Jean Tua Rua

Trong gần như trường đúng theo, tính nhiều phía là 1 công năng của ma trận dữ liệu, chưa phải là mô hình những thống kê cơ bản . Vì nó thường xuyên nghiêm trọng hơn trong các mẫu nhỏ dại, Arthur Goldberger sẽ đi xa tới cả điện thoại tư vấn nó là “vi mô”.

Bài thực hành

Thực hành search và khắc chế hiện tượng lạ đa cùng tuyến đường bên trên R

Tìm hiện tượng kỳ lạ đa cùng tuyến đường trong dữ liệu

Chúng ta có quy mô phân tích nhỏng sau:

ROE = LnSIZE + LnEQAS + LnCPhường + INF

Chúng ta ước tính hồi quy ols với thu được công dụng nhỏng sau:

*

Ta chiếm được hiệu quả R2 = 0.5019, tra vào bảng đối sánh trên thì bọn họ đang dễ dãi bị lầm lẫn, Tóm lại cuống quýt là trong quy mô phân tích của bọn họ không có hiện tượng multicollinearity; Bây tiếng họ tìm kiếm hàm VIF coi hiệu quả ra sao.

vif(ols)LnSIZE LnEQAS LnCP INF 13.179941 11.992100 12.628649 1.027252

Ta ta tiện lợi nhận ra rằng có 3 biến tất cả VIF > 10 kia là: LnSIZE LnEQAS LnCP; Đối phản vào công dụng trên là chúng ta nhận biết rằng kết quả sẽ có sự chủng loại thuẫn. Vấn đề này chúng tỏ cần sử dụng R2 để đánh giá VIF là hoàn toàn sai lầm.


Khắc phục đa cộng con đường bởi hồi quy Ridge

Tìm Lambda theo điều kiện

Nlỗi bọn họ vẫn biết quy mô Ridge sử dụng thông số lambdomain authority để kiểm soát và điều chỉnh thông số hồi quy, nếu λ = 0 thì hồi quy ridge thành hồi quy ols. Ta ước chừng hồi quy Ridge và được bảng lambda sau:

*

Ta bao gồm Tóm lại rằng Khi lambdomain authority >= 0.008 thì mô hình không còn hiện tượng lạ nhiều cùng con đường, Vì tất cả thông số VIF điều nhỏ tuổi rộng 10.

Tìm λ buổi tối ưu mang lại tế bào hình

Để đến mô hình buổi tối ưu thì có tương đối nhiều chỉ tiêu nhứ: AIC, BIC, R2, MSE, RMSE …

Trong ví dụ này Shop chúng tôi thực hiện mô hình MSE để tìm lambdomain authority về tối ưu

*

Tra trong bảng bên trên ta gồm MSE nhỏ dại tuyệt nhất là 502.852 tại lambda = 0.033

Đồng thời lambdomain authority > 0.008, ta gật đầu cực hiếm lambdomain authority này.

*

Hồi quy Ridge cùng với công dụng λ buổi tối ưu

*

Đây là tác dụng của chúng sau khoản thời gian đã hạn chế và khắc phục hiện tượng lạ nhiều cộng tuyến; Để mang lại vững chắc ăn kiểm soát lại hệ số VIF từng phần một đợt nữa xem sao.

Xem thêm: Xem Phim Secret Garden Có Hay Không ? 3 Lý Do Không Thể Không Xem

Chúng ta thấy rằng hệ số VIF của chúng điều Hồi quy Ridge hạn chế sai phạm nhiều cùng tuyến

Sai phạm về đa cùng tuyến đường là 1 trong những sai phạm không hề nhỏ vào quá trình nghiên cứu định lượng, trước đây cũng có nhiều phương thức đề ra để hạn chế và khắc phục hiện tượng này, tuy vậy tính tmáu phụ không cao, chúng ta hay được sử dụng phương thức đồng ý đa cộng tuyến đường, hơn mở rộng thêm tài liệu, nhằm mục tiêu tiêu giảm đa cùng tuyến vào tế bào hình; Với sự việc áp dụng pmùi hương bí quyết hồi quy phi đường tuyệt ví dụ thực tiễn là hồi quy ridge đang khắc phục hiện tượng kỳ lạ đa cộng đường tiện lợi.

Leave a Reply

Your email address will not be published. Required fields are marked *

  • Bán hàng online tiếng anh là gì

  • Người tham gia giao thông tiếng anh là gì

  • Phòng vật tư tiếng anh là gì

  • Cung bảo bình là con gì

  • x

    Welcome Back!

    Login to your account below

    Retrieve your password

    Please enter your username or email address to reset your password.