Ковариационная матрица

Ковариационная матрица (или матрица ковариаций) в теории вероятностей — это матрица, составленная из попарных ковариаций элементов одного или двух случайных векторов.
Ковариационная матрица случайного вектора — квадратная симметрическая неотрицательно определенная матрица, на диагонали которой располагаются дисперсии компонент вектора, а внедиагональные элементы — ковариации между компонентами.
Ковариационная матрица случайного вектора является многомерным аналогом дисперсии случайной величины для случайных векторов. Матрица ковариаций двух случайных векторов- многомерный аналог ковариации между двумя случайными величинами.
В случае нормально распределенного случайного вектора, ковариационная матрица вместе с математическим ожиданием этого вектора полностью определяют его распределение (по аналогии с тем, что математическое ожидание и дисперсия нормально распределенной случайной величины полностью определяют её распределение)
Определения
- Пусть X : Ω → R n {displaystyle mathbf {X} :Omega o mathbb {R} ^{n}} , Y : Ω → R m {displaystyle mathbf {Y} :Omega o mathbb {R} ^{m}} — два случайных вектора размерности n {displaystyle n} и m {displaystyle m} соответственно. Пусть также случайные величины X i , Y j , i = 1 , … , n , j = 1 , … , m {displaystyle X_{i},Y_{j},;i=1,ldots ,n,;j=1,ldots ,m} имеют конечный второй момент (дисперсию), то есть X i , Y j ∈ L 2 {displaystyle X_{i},Y_{j}in L^{2}} . Тогда матрицей ковариации векторов X , Y {displaystyle mathbf {X} ,mathbf {Y} } называется
то есть
Σ = ( σ i j ) {displaystyle Sigma =(sigma _{ij})} ,где
σ i j = c o v ( X i , Y j ) ≡ E [ ( X i − E X i ) ( Y j − E Y j ) ] , i = 1 , … , n , j = 1 , … , m {displaystyle sigma _{ij}=mathrm {cov} (X_{i},Y_{j})equiv mathbb {E} left[(X_{i}-mathbb {E} X_{i})(Y_{j}-mathbb {E} Y_{j}) ight],;i=1,ldots ,n,;j=1,ldots ,m} , E {displaystyle mathbb {E} } — математическое ожидание.- Если X ≡ Y {displaystyle mathbf {X} equiv mathbf {Y} } , то Σ {displaystyle Sigma } называется матрицей ковариации вектора X {displaystyle mathbf {X} } и обозначается c o v ( X ) {displaystyle mathrm {cov} (mathbf {X} )} . Такая матрица ковариации является обобщением дисперсии для многомерной случайной величины, а её след — скалярным выражением дисперсии многомерной случайной величины. В связи с этим используется также обозначение V ( X ) {displaystyle V(X)} - вариация (дисперсия) случайного вектора. Собственные векторы и собственные числа этой матрицы позволяют оценить размеры и форму облака распределения такой случайной величины, аппроксимировав его эллипсоидом (или эллипсом в двумерном случае).
Свойства матриц ковариации
- Сокращённая формула для вычисления матрицы ковариации:
- Матрица ковариации случайного вектора неотрицательно определена:
- Смена масштаба:
- Если случайные векторы X {displaystyle mathbf {X} } и Y {displaystyle mathbf {Y} } нескоррелированы ( c o v ( X , Y ) = 0 {displaystyle mathrm {cov} (mathbf {X} ,mathbf {Y} )=mathbf {0} } ), то
- Матрица ковариации аффинного преобразования:
где A {displaystyle mathbf {A} } — произвольная матрица размера n × n {displaystyle n imes n} , а b ∈ R n {displaystyle mathbf {b} in mathbb {R} ^{n}} .
- Перестановка аргументов:
- Матрица ковариации аддитивна по каждому аргументу:
- Если X {displaystyle mathbf {X} } и Y {displaystyle mathbf {Y} } независимы, то
Условная ковариационная матрица
Ковариационная матрица случайного вектора является характеристикой его распределения. В случае (многомерного) нормального распределения математическое ожидание вектора и его ковариационная матрица полностью определяют его распределение. Характеристиками условного распределения одного случайного вектора при условии заданного значения другого случайного вектора являются соответственно условное математическое ожидание (функция регрессии) и условная ковариационная матрица.
Пусть случайные векторы X {displaystyle X} и Y {displaystyle Y} имеют совместное нормальное распределение с математическими ожиданиями μ X , μ Y {displaystyle mu _{X},mu _{Y}} , ковариационными матрицами V X , V Y {displaystyle V_{X},V_{Y}} и матрицей ковариаций C X Y {displaystyle C_{XY}} . Это означает, что объединенный случайный вектор Z = [ X Y ] {displaystyle {oldsymbol {Z}}={egin{bmatrix}{oldsymbol {X}}{oldsymbol {Y}}end{bmatrix}}} подчиняется многомерному нормальному распределению с вектором математического ожидания μ Z = [ μ X μ Y ] , {displaystyle {oldsymbol {mu }}_{Z}={egin{bmatrix}{oldsymbol {mu }}_{X}{oldsymbol {mu }}_{Y}end{bmatrix}},} и ковариационной матрицей которую можно представить в виде следующей блочной матрицы
V Z = [ V X C X Y C Y X V Y ] {displaystyle {oldsymbol {V}}_{Z}={egin{bmatrix}{oldsymbol {V}}_{X}&{oldsymbol {C}}_{XY}{oldsymbol {C}}_{YX}&{oldsymbol {V}}_{Y}end{bmatrix}}} где C Y X = C X Y T {displaystyle C_{YX}=C_{XY}^{T}}
Тогда случайный вектор Y {displaystyle Y} при заданном значении случайного вектора X {displaystyle X} имеет нормальное распределение (условное) со следующим условным математическим ожиданием и условной ковариационной матрицей
E ( Y | X = x ) = μ Y + C Y X V X − 1 ( x − μ X ) , V ( Y | X = x ) = V Y − C Y X V X − 1 C X Y {displaystyle E(Y|X=x)=mu _{Y}+C_{YX}V_{X}^{-1}(x-mu _{X}),qquad V(Y|X=x)=V_{Y}-C_{YX}V_{X}^{-1}C_{XY}}
Первое равенство определяет функцию линейной регрессии (зависимости условного математического ожидания вектора Y {displaystyle Y} от заданного значения x случайного вектора X {displaystyle X} ), причем матрица C X Y V − 1 {displaystyle C_{XY}V^{-1}} - матрица коэффициентов регрессии.
Условная ковариационная матрица представляет собой матрицу ковариаций случайных ошибок линейных регрессий компонентов вектора Y {displaystyle Y} на вектор X {displaystyle X} .
В случае если Y {displaystyle Y} - обычная случайная величина (однокомпонентный вектор), условная ковариационная матрица - это условная дисперсия (по существу - случайной ошибки регрессии Y {displaystyle Y} на вектор X {displaystyle X} )