The Definition of Eigenvalues and Eigenvectors
- Definition:
A x = λ x Ax=\lambda x Ax=λx
解释:Matrix A A A 乘以 vector x x x 得到 λ x \lambda x λx 意味着,A作用于x并没有改变x的方向,只对其做了大小的改变。 x x x 是 A A A的特征向量(Eigenvector), λ \lambda λ是 A A A的特征值(Eigenvalue)
- How to get Eigenvalues and Eigenvectors
- 首先 A x = λ x Ax=\lambda x Ax=λx ,那么, A x − λ x = 0 Ax-\lambda x=0 Ax−λx=0 , ( A − λ I ) x = 0 (A-\lambda I)x=0 (A−λI)x=0 , 如果 x x x非0向量,则 ( A − λ I ) (A-\lambda I) (A−λI)是singular的。所以det ( A − λ I ) = 0 (A-\lambda I)=0 (A−λI)=0
- 然后,根据 ∣ A − λ I ∣ |A-\lambda I| ∣A−λI∣=0 , 求出Eigenvalues λ \lambda λ ,然后再根据 ( A − λ I ) x = 0 (A-\lambda I)x=0 (A−λI)x=0求出Eigenvectors x x x
- 例子:求A的特征值和特征向量 A = [ . 8 . 3 . 2 . 7 ] A= \left[ \begin{matrix} .8 & .3 \\ .2 &.7 \end{matrix} \right] A=[.8.2.3.7]
解:
特征值: ∣ A − λ I ∣ = ∣ . 8 − λ . 3 . 2 . 7 − λ ∣ = 0 |A-\lambda I|= \left| \begin{matrix} .8-\lambda & .3 \\ .2 &.7 -\lambda \end{matrix} \right|=0 ∣A−λI∣=∣∣∣∣.8−λ.2.3.7−λ∣∣∣∣=0
λ 2 − 3 2 λ + 1 2 = ( λ − 1 ) ( λ − 1 2 ) = 0 λ 1 = 1 λ 2 = 1 2 \lambda ^{2}-\frac{3}{2}\lambda+\frac{1}{2}=(\lambda-1)(\lambda-\frac{1}{2})=0\space \space\space\space\space\space \space\space\space\space \space \space\space\space\space \lambda _1=1 \space\space \space\space\lambda _2=\frac{1}{2} λ2−23λ+21=(λ−1)(λ−21)=0 λ1=1 λ2=21
特征向量:
[ . 8 − 1 . 3 . 2 . 7 − 1 ] x = 0 [ . 8 − 1 2 . 3 . 2 . 7 − 1 2 ] x = 0 \left[ \begin{matrix} .8-1 & .3 \\ .2 &.7-1 \end{matrix} \right]x=0\space \space\space\space\space\space \space\space\space\space \space \space\space\space\space \left[ \begin{matrix} .8-\frac{1}{2} & .3 \\ .2 &.7-\frac{1}{2} \end{matrix} \right]x=0 [.8−1.2.3.7−1]x=0 [.8−21.2.3.7−21]x=0
x 1 = ( 0.6 , 0.4 ) x 2 = ( 1 , − 1 ) x_1=(0.6,0.4)\space\space\space\space\space \space\space x_2=(1,-1) x1=(0.6,0.4) x2=(1,−1)
特征向量有很多,取最容易计算,典型值,其他的都是它的大小缩放。 A 2 A^2 A2的特征向量和A一样,特征值是 λ 1 2 λ 2 2 \lambda_1 ^2 \space\space \space\space\lambda_2 ^2 λ12 λ22,即 A 2 x = λ 2 x A^2x=\lambda^2x A2x=λ2x
- Characteristics And Trick:
Characteristics :
- 矩阵的对角元素之和(叫做Trace,中文叫做迹) 等于 Eigenvalues的和。
- 矩阵的Determinant (行列式)等于 Eigenvalues 的积。
- ( 2 A − I ) x = ( 2 λ − 1 ) x (2A-I)x=(2\lambda-1)x (2A−I)x=(2λ−1)x 意味着: 2 A − I 2A-I 2A−I的Eigenvectors 都是 x x x,Eigenvalues 变成 2 λ − 1 2\lambda -1 2λ−1。但是将单位阵 I I I换成其他矩阵就不一定成立,因为此时的 A A A和另一个矩阵的Eigenvectors 不一定都是x
- 上/下三角、对角矩阵的特征值就是对角线上的元素。
- A 2 A^2 A2 和 A − 1 A^{-1} A−1 和 A A A 的特征向量一样,特征值是 λ 2 \lambda^2 λ2和 1 λ \frac{1}{\lambda} λ1。数学语言:如果 A x = λ x Ax=\lambda x Ax=λx,那么: A 2 x = λ 2 x 和 A − 1 x = 1 λ x A^2x=\lambda ^2x 和A^{-1}x=\frac{1}{\lambda}x A2x=λ2x和A−1x=λ1x
- 对矩阵做Elimination ,特征值会变化。
Tricks:
- ∣ A − λ I ∣ = 0 |A-\lambda I|=0 ∣A−λI∣=0可以直接得到: λ 2 − T r a c e ⋅ λ + d e t e r m i n a n t \lambda^2-Trace\cdot\lambda+determinant λ2−Trace⋅λ+determinant去计算 λ \lambda λ的值
- 如果A是Singular ,那么 0 是其中一个Eigenvalue。
- 如果A的每column 相加是1,那么 1 是其中一个Eigenvalue。
- 正交矩阵(orthogonal matrix : A T A = I A^TA=I ATA=I)的每个 λ \lambda λ的绝对值是 1
- 反对称矩阵(skew-symmetric matrix: A T = − A A^T=-A AT=−A)的每个 λ \lambda λ是纯虚数
- 对称矩阵(symmetric matrix: A T = A A^T=A AT=A)的Eigenvectors 是相互Perpendicular的。
Diagonalizing Matrix
- 对角化:
如果n by n的matrix A A A 有n个线性无关的(linear independent)Eigenvectors:x1…xn , 那么将所有的x放在一起形成eigenvector matrix S S S,则对角化之后的矩阵 Λ = S − 1 A S = [ λ 1 ⋱ λ n ] 即 A = S Λ S − 1 \Lambda=S^{-1}AS=\left[ \begin{matrix} \lambda_1 & & \\ & \ddots &\\ & & \lambda_n \end{matrix} \right] \space\space\space\space\space \space\space\space\space \space \space\space\space\space 即A=S\Lambda S^{-1} Λ=S−1AS=⎣⎡λ1⋱λn⎦⎤ 即A=SΛS−1
证明:
说明: S S S必须可逆,意味着,A必须有n个 independent Eigenvectors,否则 A 不能对角化。还有一点:A不可逆不代表A不能对角化,A的不可逆只意味A是singular,有一个0特征值,如果还有其他不为0的特征值,则A可以被对角化。
- 例子:
A = [ 1 5 0 6 ] λ ′ s a r e o n d i a g o n a l : λ 1 = 1 λ 2 = 6 。 E i g e n v e c t o r s : [ 1 0 ] [ 1 1 ] A= \left[ \begin{matrix} 1 & 5\\ 0 & 6 \\ \end{matrix} \right] \space\space\space\space\space \space\space\space\space \lambda's\space are \space on \space diagonal : \lambda_1=1\space\space\space\space \lambda_2=6。Eigenvectors :\left[ \begin{matrix} 1 \\ 0 \end{matrix} \right] \left[ \begin{matrix} 1 \\ 1 \end{matrix} \right] A=[1056] λ′s are on diagonal:λ1=1 λ2=6。Eigenvectors:[10][11]
那么: Λ = S − 1 A S = [ 1 − 1 0 1 ] [ 1 5 0 6 ] [ 1 1 0 1 ] = [ 1 0 0 6 ] \Lambda=S^{-1}AS= \left[ \begin{matrix} 1 & -1\\ 0 & 1 \\ \end{matrix} \right] \left[ \begin{matrix} 1 & 5\\ 0 & 6 \\ \end{matrix} \right] \left[ \begin{matrix} 1 & 1\\ 0 & 1 \\ \end{matrix} \right]= \left[ \begin{matrix} 1 & 0\\ 0 & 6 \\ \end{matrix} \right] Λ=S−1AS=[10−11][1056][1011]=[1006]
- 性质:
- 如果A有n个不同的Eigenvalues,那么一定有n个不同的Eigenvectors。
- 在Eigenvector matrix S S S中,column(Eigenvectors)的顺序和Eigenvalues 的顺序是对应的。
比如上面例子将 S 中 的 x 1 和 x 2 S中的x_1和x_2 S中的x1和x2交换: Λ n e w = S − 1 A S \Lambda_{new}=S^{-1}AS Λnew=S−1AS
Λ n e w = [ 0 1 1 − 1 ] [ 1 5 0 6 ] [ 1 1 1 0 ] = [ 6 0 0 1 ] \Lambda_{new}= \left[ \begin{matrix} 0 & 1\\ 1 & -1 \\ \end{matrix} \right] \left[ \begin{matrix} 1 & 5\\ 0 & 6 \\ \end{matrix} \right] \left[ \begin{matrix} 1 & 1\\ 1 & 0 \\ \end{matrix} \right]= \left[ \begin{matrix} 6 & 0\\ 0 & 1 \\ \end{matrix} \right] Λnew=[011−1][1056][1110]=[6001]
- 对角化的应用:
-
A 2 = S Λ S − 1 S Λ S − 1 = S Λ 2 S − 1 A^2=S\Lambda S^{-1}S\Lambda S^{-1}=S\Lambda ^{2}S^{-1} A2=SΛS−1SΛS−1=SΛ2S−1 这个也能意味着: A 和 A 2 A和A^2 A和A2有相同的 S S S(即Eigenvectors),但是Eigenvectors变了,由原来的 Λ \Lambda Λ变成 Λ 2 \Lambda ^2 Λ2 ,也就是每个特征值都变成平方。
-
当A的所有特征值都小于1(| λ \lambda λ|<1),则 A k = S Λ k S − 1 A^k=S\Lambda^kS^{-1} Ak=SΛkS−1,如果k足够大,则 Λ k \Lambda^k Λk->0 ,那么 A k A^k Ak=0
-
求解 Matrix Powers : A k A^k Ak
举例:斐波那契数列 (Fibonacci number) ,又称黄金分割序列。
序列: 0 , 1 , 1 , 2 , 3 , 5 ,8, 13 。。。 F k + 2 = F k + 1 + F k F_{k+2}=F_{k+1}+F_{k} Fk+2=Fk+1+Fk
Problem : Find the Fibonacci number F 100 F_{100} F100
解:
假 如 : u k = [ F k + 1 F k ] 那 么 : 规 则 就 是 : 假如:u_k=\left[ \begin{matrix} F_{k+1}\\ F_k \end{matrix} \right] 那么:规则就是: 假如:uk=[Fk+1Fk]那么:规则就是:
F k + 2 = F k + 1 + F k F k + 1 = F k + 1 F_{k+2}=F_{k+1}+F_k\\F_{k+1}=F_{k+1}\space\space\space\space\space\space\space\space\space Fk+2=Fk+1+FkFk+1=Fk+1
[ F k + 2 F k + 1 ] [ 1 1 1 0 ] [ F k + 1 F k ] ⟶ u k + 1 = [ 1 1 1 0 ] u k \left[ \begin{matrix} F_{k+2}\\ F_{k+1} \end{matrix} \right] \left[ \begin{matrix} 1 & 1\\ 1& 0 \end{matrix} \right]\left[ \begin{matrix} F_{k+1}\\ F_{k} \end{matrix} \right] \space \space\space\space\longrightarrow\space\space\space u_{k+1}= \left[ \begin{matrix} 1 & 1\\ 1& 0 \end{matrix} \right]u_k [Fk+2Fk+1][1110][Fk+1Fk] ⟶ uk+1=[1110]uk
u 0 = [ 1 0 ] u 1 = [ 1 1 ] u 2 = [ 2 1 ] u 3 = [ 3 2 ] 。 。 。 u 100 = [ F 101 F 100 ] u_0=\left[ \begin{matrix} 1\\ 0 \end{matrix} \right]\space\space u_1=\left[ \begin{matrix} 1\\ 1 \end{matrix} \right]\space\space u_2=\left[ \begin{matrix} 2\\ 1 \end{matrix} \right]\space\space u_3=\left[ \begin{matrix} 3\\ 2 \end{matrix} \right]\space\space 。。。u_{100}=\left[ \begin{matrix} F_{101}\\ F_{100} \end{matrix} \right]\space\space u0=[10] u1=[11] u2=[21] u3=[32] 。。。u100=[F101F100]
[ 1 1 1 0 ] ∗ u 0 = u 1 [ 1 1 1 0 ] ∗ u 1 = u 2 ⟶ u 100 = A 100 u 0 = [ F 101 F 100 ] \left[ \begin{matrix} 1 & 1\\ 1& 0 \end{matrix} \right]*u_{0}=u_{1}\space\space \space\space \space\space \left[ \begin{matrix} 1 & 1\\ 1& 0 \end{matrix} \right]*u_{1}=u_{2} \space\space \space\space \space\space\longrightarrow\space\space u_{100}=A^{100}u_0= \left[ \begin{matrix} F_{101} \\ F_{100} \end{matrix} \right] [1110]∗u0=u1 [1110]∗u1=u2 ⟶ u100=A100u0=[F101F100]
(1) A k u 0 = S Λ k S − 1 u 0 A^ku_0=S\Lambda^k S^{-1}u_0\tag{1} Aku0=SΛkS−1u0(1)
以下3部分是对(1)式的常规解法:
(1) 任何一个向量都是Eigenvectors 的 linear combination。 所以: u 0 = c 1 x 1 + c 2 x 2 + . . . + c n x n u_0=c_1x_1+c_2x_2+...+c_nx_n u0=c1x1+c2x2+...+cnxn即:
u 0 = [ x 1 ⋯ x n ] [ c 1 ⋮ c n ] u 0 = S c ⟶ c = S − 1 u 0 u_0= \left[ \begin{matrix} & & \\ x_1 & \cdots& x_n \\ & & \end{matrix} \right] \left[ \begin{matrix} c_1 & \\ \vdots \\ c_n \end{matrix} \right] \space\space \space\space u_0=Sc\longrightarrow \space\space c=S^{-1}u_0 u0=⎣⎡x1⋯xn⎦⎤⎣⎢⎡c1⋮cn⎦⎥⎤ u0=Sc⟶ c=S−1u0
(2) S − 1 u 0 S^{-1}u_0 S−1u0 就变成 c c c ,得到下面结果:
A k u 0 = S Λ k S − 1 u 0 = [ x 1 ⋯ x n ] [ ( λ 1 ) k ⋱ λ n ) k ] [ c 1 ⋮ c n ] A^ku_0=S\Lambda^k S^{-1}u_0=\left[ \begin{matrix} & & \\ x_1 & \cdots& x_n \\ & & \end{matrix} \right]\left[ \begin{matrix} ( \lambda_{1})^k& & \\ & \ddots& \\ & & \lambda_{n})^k \end{matrix} \right]\left[ \begin{matrix} c_1 & \\ \vdots \\ c_n \end{matrix} \right] Aku0=SΛkS−1u0=⎣⎡x1⋯xn⎦⎤⎣⎡(λ1)k⋱λn)k⎦⎤⎣⎢⎡c1⋮cn⎦⎥⎤
(3) 结果: u k = c 1 ( λ 1 ) k x 1 + c 2 ( λ 2 ) k x 2 + . . . + c n ( λ n ) k x n u_k=c_1(\lambda_1)^kx_1+c_2(\lambda_2)^kx_2+...+c_n(\lambda_n)^kx_n uk=c1(λ1)kx1+c2(λ2)kx2+...+cn(λn)kxn
对于(1)式首先就是求 A A A的Eigenvectors 和 Eigenvalues的问题, ∣ A − λ I ∣ = 0 ⟶ λ 2 − λ − 1 = 0 |A-\lambda I|=0\longrightarrow \lambda^2-\lambda-1=0 ∣A−λI∣=0⟶λ2−λ−1=0
λ 1 = 1 + 5 2 λ 2 = 1 − 5 2 对 应 的 x 1 = ( λ 1 , 1 ) x 2 = ( λ 2 , 2 ) \lambda_1=\frac{1+\sqrt{5}}{2} \space\space \space\space \space\space \lambda_2=\frac{1-\sqrt{5}}{2} \space\space对应的\space\space x_1=(\lambda_1,1) \space\space \space\space \space\space x_2=(\lambda_2,2) λ1=21+5 λ2=21−5 对应的 x1=(λ1,1) x2=(λ2,2)
u 0 = [ 1 0 ] = 1 λ 1 − λ 2 ( x 1 − x 2 ) ⟶ c = [ 1 λ 1 − λ 2 − 1 λ 1 − λ 2 ] u_0=\left[ \begin{matrix} 1\\ 0 \end{matrix} \right]=\frac{1}{\lambda_1-\lambda_2}(x1-x2) \space\space \space\space \space\space \longrightarrow c=\left[ \begin{matrix} \frac{1}{\lambda_1-\lambda_2}\\ -\frac{1}{\lambda_1-\lambda_2} \end{matrix} \right] u0=[10]=λ1−λ21(x1−x2) ⟶c=[λ1−λ21−λ1−λ21]
u 100 = ( λ 1 ) 100 x 1 λ 1 − λ 2 + ( − 1 ) ( λ 2 ) 100 x 2 λ 1 − λ 2 u_{100}=\frac{(\lambda_1)^{100}x_1}{\lambda_1-\lambda_2}+(-1)\frac{(\lambda_2)^{100}x_2}{\lambda_1-\lambda_2} u100=λ1−λ2(λ1)100x1+(−1)λ1−λ2(λ2)100x2
我们需要 F 100 F_{100} F100 ,它是 u 100 u_{100} u100的第二个元素,则只需要 x 1 , x 2 x_1,x_2 x1,x2的第二个元素:都是1,所以 F 100 = ( λ 1 ) 100 λ 1 − λ 2 − ( λ 2 ) 100 λ 1 − λ 2 = 1 5 [ ( 1 + 5 2 ) 100 − ( 1 − 5 2 ) 100 ] F_{100}=\frac{(\lambda_1)^{100}}{\lambda_1-\lambda_2}-\frac{(\lambda_2)^{100}}{\lambda_1-\lambda_2}=\frac{1}{\sqrt{5}}\left[\left(\frac{1+\sqrt{5}}{2}\right)^{100}-\left(\frac{1-\sqrt{5}}{2}\right)^{100}\right] F100=λ1−λ2(λ1)100−λ1−λ2(λ2)100=51⎣⎡(21+5)100−(21−5)100⎦⎤
尽管 λ 1 和 λ 2 \lambda_1和\lambda_2 λ1和λ2都是带根号,但是最终的结果一定是整数,因为Fibonacci number的规则:前面两个数相加得到后一个数,一定是整数。
黄金比例序列的由来:
( 1 − 5 2 ) \left(\frac{1-\sqrt{5}}{2}\right) (21−5)<1, 当k越大, F k F_k Fk 只有前面的一项。 F k F k − 1 = λ 1 = 1 + 5 2 \frac{F_k}{F_{k-1}}=\lambda_1=\frac{1+\sqrt{5}}{2} Fk−1Fk=λ1=21+5