CORRELATION LÀ GÌ

Giới thiệu

Covariance (Hiệp phương thơm sai) và Correlation (Hệ số tương quan) là nhị khái niệm trong nghành nghề Xác Suất thống kê lại. Cả nhì khái niệm này gần như nói về quan hệ thân hai đổi mới cùng nhau, tốt có thể nói rằng hai chỉ số này dùng để diễn tả sự dựa vào giữa hai đổi mới.

Bạn đang xem: Correlation là gì

Covariance là gì?

Covariance mô tả mối quan hệ giữa nhì đổi mới cùng nhau, rất có thể là đồng trở nên (positive sầu covariance) hoặc nghịch phát triển thành (negative sầu covariance).

Định nghĩa : Cho 2 biến hốt nhiên X, Y cùng với kì vọng mu_X cùng mu_Y covariance của X, Y được tính bằng cách làm :

Cov(X,Y) = E((X - mu_X )(Y - mu_Y))

Các tính chất của Covariance :

Cov(aX + b, cY + d) = acCov(X,Y) với a, b, c, d cho trướcCov(X_1 + X_2, Y) = Cov(X_1, Y) + Cov(X_2, Y)Cov(X, X) = Var(X)Cov(X, Y) = E(XY) - mu_Xmu_YVar(X, Y) = Var(X) + Var(Y) + 2Cov(X, Y)Nếu X, Y chủ quyền thì Cov(X, Y) = 0.

Xem thêm: Tìm Hiểu Bí Mật Ngành Hr Dept Là Gì ? Bộ Phận Hr Trong Ngành Nhà Hàng

Lưu ý :

Từ 3 và 4 ta gồm Var(X) = E(X^2) - mu^2_x. Nếu X, Y tự do tự 5 rất có thể suy ra được Var(X, Y) = Var(X) + Var(Y).Với 6, điều ngược lại không đúng, tức là Cov(X, Y) = 0 ko Tức là X, Y tự do với nhau. lấy ví dụ như X = <-2 , -1 , 1 , 2> với Y = X^2 = <4 , 1, 1 , 4> khi đó Cov(X, Y) = 0

Correlation là gì?

Để diễn đạt quan hệ giữa 2 trở thành là “mạnh” giỏi “yếu”, chúng ta sử dụng correlation vậy cho covariance.

Định nghĩa : Correlation coefficient của hai vươn lên là X với Y được tính theo công thức

Cor(X, Y) = ho = fracCov(X, Y)sigma_Xsigma_Y

Các đặc điểm của Corelation :

Correlation là Covariance được chuẩn chỉnh hóa của nhị phát triển thành X, YCorrelation bộc lộ một tỉ lệ thành phần, cho nên nó không có đơn vị đo-1 leq ho leq 1 ho = -1 lúc và chỉ còn Khi Y = aX + b cùng a cùng ho = 1 Lúc và chỉ Khi Y = aX + b với a > 0

Chứng minc đặc thù 3 :

0 leq Var(fracXsigma_X - fracYsigma_Y) = Var(fracXsigma_X) + Var(fracYsigma_Y) - 2Cov(fracXsigma_X, fracYsigma_Y) = 2 - 2 ho Rightarrow ho leq 1.

Tương từ bỏ 0 leq Var(fracXsigma_X + fracYsigma_Y) Rightarrow ho geqslant -1

Biểu diễn quan hệ X, cùng Y với cái giá trị rho (correlation)


*

So sánh thân covariance và correlation

Cả covariance và correlation phần đông thể hiện mối quan hệ thân nhì thay đổi.Covariance gồm range trường đoản cú -infty đến +infty . Correlation nằm trong sấp xỉ từ - 1 đến 1.Covariance thể hiện mối quan tiền hệ giữa nhì biến, correlation thể hiện được mối quan tiền hệ giữa hai hoặc nhiều biến.

Ví dụ

Tập dữ liệu view của 2 kênh truyền hình tại 1 thời điểm (20h - 21h thứ năm mỗi tuần) trong 1 tháng là

X = (50772, 73756, 74251, 77601)Y = (102492, 100406, 97762, 98191)

Ta triển khai tính các thông số kỹ thuật cơ bản

Mean_X = (50772 + 73756 + 74251 + 77601)/ 4 = 69095.00Mean Y = 99712.75std_X^2 = ((50772 - Mean_X)^2 +(73756 - Mean_X)^2 +… ) / 4 = 114098405.5 => std_X = 10681.69std_Y = 1892.48

Từ kia ta tính covariance và correlation

Cov(X, Y) = ((50772 - 69095.00) * (102492 - 99712.75) + (73756 - 69095.00) * (100406 - 99712.75) + …) / 4 = -17673758.0Corr (X,Y ) = Cov(X, Y) / (std_X * std_Y) = -17673758.0 / ( 10681.69 * 1892.48) = -0.87