线性代数-相似矩阵与二次型

Contents

线性代数-相似矩阵与二次型

本章主要讨论方阵的特征值与特征向量、方阵的相似对角化和二次型的化简等问题。

其中涉及向量的内积、长度及正交等知识,下面先介绍这些知识。

向量的内积、长度及正交性

向量的内积

向量内积的引入

在(平面/空间)解析几何中,我们曾引进向量的数量积/内积:\(x \\cdot y=|x||y| \\cos \\theta\), 然后定义了向量间的夹角余弦与夹角(包括垂直的定义), 且以互相垂直向量为轴,建立直角坐标系,有(直角坐标系中的)数量积的坐标表示:\(\\left(x\_{1}, x\_{2}, x\_{3}\\right) \\cdot\\left(y\_{1}, y\_{2}, y\_{3}\\right)=x\_{1} y\_{1}+x\_{2} y\_{2}+x\_{3} y\_{3}\)

n维向量的内积是数量积的一种推广。但n维向量没有3维向量那样直观的长度和夹角的概念,因此只能按数量积的直角坐标计算公式来推广。并且反过来,利用内积来定义n维向量的长度和夹角。

向量x与y内积的定义

设有n维向量: \(\\boldsymbol{x}=\\left(\\begin{array}{c}x\_{1} \\ x\_{2} \\ \\vdots \\ x\_{n}\\end{array}\\right), \\boldsymbol{y}=\\left(\\begin{array}{c}y\_{1} \\ y\_{2} \\ \\vdots \\ y\_{n}\\end{array}\\right)\)\(\[x, y\]=x\_{1} y\_{1}+x\_{2} y\_{2}+\\cdots+x\_{n} y\_{n}\) 称[ x, y]为向量x与y的内积

当x与y都是列向量时, 有\(\[x, y\]=x^{T} y\)

向量的内积,结果是个实数。

向量内积的基本性质

(其中 x, y, z 为 n 维向量, \(\\lambda\) 为实数)

\(\[x, y\]=\[y, x\]\)

\(\[\\lambda x, y\]=\\lambda\[x, y\]\)

\(\[x+y, z\]=\[x, z\]+\[y, z\]\)

\(\\boldsymbol x=\\boldsymbol 0\)\(,\[\\boldsymbol x, \\boldsymbol x\]=0 ;\)\(\\boldsymbol x \\neq 0\)\(,\[\\boldsymbol x, \\boldsymbol x\]\>0\)

施瓦茨不等式\(\[x, y\]^{2} \\leqslant\[x, x\]\[y, y\]\)

\(\[x, y\]^{2} \\leqslant\[x, x\]\[y, y\]\)

(证明见百度百科:柯西—施瓦茨不等式:实内积空间的情形

向量的长度与夹角

向量长度(范数)的定义

\(|x|=\\sqrt{\[x, x\]}=\\sqrt{x\_{1}^{2}+x\_{2}^{2}+\\cdots+x\_{n}^{2}}\)\(| x |\) 称为 n 维向量 \(x\) 的长度(或范数).

可见n维向量的长度是通过内积定义的。\(| x |=1\)时,称x为单位向量。

向量长度的性质
非负性

\(x \\neq 0\)\(,|x|\>0 ;\)\(x=0\)\(,|x|=0\)

齐次性

\(|\\lambda x|=|\\lambda||x|\)

三角不等式

\(|x+y| \\leqslant|x|+|y|\)

证明: \(|x+y|^{2}=\[x+y, x+y\]=\[x, x\]+2\[x, y\]+\[y, y\]\) 根据施瓦茨不等式\(\[x, y\] \\leqslant \\sqrt{\[x, x\]\[y, y\]}\)\(|x+y|^{2} \\leqslant\[x, x\]+2 \\sqrt{\[x, x\]\[y, y\]}+\[y, y\]\)\(=|x|^{2}+2|x||y|+|y|^{2}=(|x|+|y|)^{2}\)\(|x+y| \\leqslant|x|+|y|\)

向量x与y夹角的定义

根据施瓦茨不等式\(|\[x, y\]| \\leqslant|x||y|\)\(\\left|\\frac{\[x, y\]}{x|| y |}\\right| \\leqslant 1 \\quad(\)\(|x||y| \\neq 0\)\()\)\(x \\neq 0, y \\neq 0\) 时,\(\\theta=\\arccos\\frac{\[x, y\]}{|x||y|}\)称为 n 维向量 x 与 y 的夹角

可见n维向量之间的夹角也是通过内积定义的。

向量的正交与正交矩阵

向量正交与向量组正交

向量x与向量y正交

\(\[ x, y\]=0\) 时, 称向量 x 与 y 正交. 显然,若 \(x=0\), 则 \(x\) 与任何向量都正交。若\(x\\neq 0, y\\neq 0\),两向量正交也可认为是向量的夹角为\(\\frac{\\pi}{2}\)

向量组正交

一组两两都正交的非零向量,称为正交向量组

向量组非零且正交\(\\Rightarrow\)向量组线性无关

定理:若n维向量\(\\boldsymbol{a}_{1}, \\boldsymbol{a}_{2}, \\cdots, \\boldsymbol{a}_{r}\)都非零且两两正交\(\\Rightarrow\)\(\\boldsymbol{a}_{1}, \\boldsymbol{a}_{2}, \\cdots, \\boldsymbol{a}_{r}\)线性无关

证明

设有\(\\lambda\_{1}, \\lambda\_{2}, \\cdots, \\lambda\_{r}\)使\(\\lambda\_{1} a\_{1}+\\lambda\_{2} a\_{2}+\\cdots+\\lambda\_{r} a\_{r}=0\)\(\\boldsymbol{a}_{\\mathbf{1}}^{\\mathrm{T}}\)左乘上式,因当 \(i \\geqslant 2\) 时, \(\\boldsymbol{a}_{1}^{\\mathrm{T}} \\boldsymbol{a}_{i}=0\),故\(\\lambda_{1} a\_{1}^{T} a\_{1}=0\)\(a\_{1} \\neq 0,\)\(a\_{1}^{\\mathrm{T}} a\_{1}=\\left|a\_{1}\\right|^{2} \\neq 0\)。从而必有 \(\\lambda\_{1}=0 .\) 类似可证 \(\\lambda\_{2}=0, \\cdots, \\lambda\_{r}=0\) 于是向量组 \(a\_{1}, a\_{2}, \\cdots, a\_{r}\) 线性无关.

向量空间的规范正交基

向量组正交的性质:向量组非零且正交\(\\Rightarrow\)向量组线性无关, 那么考虑相反的情况,如何根据一个线性无关的向量组,如何得到一个等价的正交向量组呢?

规范正交基的定义

设n维向量\(e\_{1}, e\_{2}, \\cdots, e\_{r}\)是向量空间\(V\\left(V \\subset \\mathbb{R}^{n}\\right)\)的一个基[^1](向量组章节我们介绍过,向量空间的基就是向量空间的极大线性无关组,向量空间中的任意向量都可以用基表示), 如果\(e\_{1}, e\_{2}, \\cdots, e\_{r}\)两两正交,且都是单位向量, 则称\(e\_{1}, e\_{2}, \\cdots, e\_{r}\)是一个规范正交基。 那么V中的任意向量都可以由 \(e\_{1}, \\cdots, e\_{r}\)表示,表示式为\(a=\\lambda\_{1} e\_{1}+\\lambda\_{2} e\_{2}+\\cdots+\\lambda\_{r} e\_{r}\)

向量在规范正交基中的坐标的计算

为求\(a=\\lambda\_{1} e\_{1}+\\lambda\_{2} e\_{2}+\\cdots+\\lambda\_{r} e\_{r}\)的系数 \(\\lambda\_{i}(i=1, \\cdots, r),\) 可用 \(e\_{i}^{\\mathrm{T}}\) 左乘上式,有\(e\_{i}^{\\mathrm{T}} a=\\lambda\_{i} e\_{i}^{\\mathrm{T}} e\_{i}=\\lambda\_{i}\),即\(\\lambda\_{i}=e\_{i}^{T} a=\\left\[a, e\_{i}\\right\]\)

基(线性无关向量组)的规范正交化

\(a\_{1}, \\cdots, a\_{r}\)是向量空间ⅴ的一个基(最大线性无关组),要求ⅴ的一个规范正交基。这也就是要找一组两两正交的单位向量\(e\_{1}, \\cdots, e\_{r}\),使\(e\_{1}, \\cdots, e\_{r}\)\(a\_{1}, \\cdots, a\_{r}\)等价。这样的问题,称为把\(a\_{1}, \\cdots, a\_{r}\)规范正交化。

施密特正交化方法

(按以下流程,得一组相互正交的向量组): \(b\_{1}=a\_{1}\) \(b\_{2}=a\_{2}-\\frac{\\left\[b\_{1}, a\_{2}\\right\]}{\\left\[b\_{1}, b\_{1}\\right\]} b\_{1}\)
(实际上是设\(\\beta\_{2}=\\alpha\_{2}-k \\beta\_{1}\),并满足 \(\\beta\_{1} \\perp\\beta\_{2}\) ,即\(\\left\\langle\\beta\_{2}, \\beta\_{1}\\right\\rangle=\\left\\langle\\alpha\_{2}, \\beta\_{1}\\right\\rangle-k\\left\\langle\\beta\_{1}, \\beta\_{1}\\right\\rangle=0\),解得k) ……… \(b\_{r}=a\_{r}-\\frac{\\left\[b\_{1}, a\_{r}\\right\]}{\\left\[b\_{1}, b\_{1}\\right\]} b\_{1}-\\frac{\\left\[b\_{2}, a\_{r}\\right\]}{\\left\[b\_{2}, b\_{2}\\right\]} b\_{2}-\\cdots-\\frac{\\left\[b\_{r-1}, a\_{r}\\right\]}{\\left\[b\_{r-1}, b\_{r-1}\\right\]} b\_{r-1}\) 容易验证\(b\_{1}, \\cdots, b\_{r}\)两两相互正交,且\(b\_{1}, \\cdots, b\_{r}\)\(a\_{1}, \\cdots, a\_{r}\)等价。

单位化

将上面得到的正交向量组,都化为单位向量,就求得了一个规范正交基

正交矩阵

正交矩阵定义\(\\boldsymbol{A}^{\\mathrm{T}} \\boldsymbol{A}=\\boldsymbol{E}\)

如果 n 阶矩阵 A 满足\(\\boldsymbol{A}^{\\mathrm{T}} \\boldsymbol{A}=\\boldsymbol{E}\) \(\\left(\\right.\)\(\\left.\\boldsymbol{A}^{-1}=\\boldsymbol{A}^{\\mathrm{T}}\\right)\) 那么称 A 为正交矩阵,简称正交阵。

也就是说矩阵的行(或列)向量之间点积等于0(向量正交),行(或列)向量与自身的点积等于1(单位向量),所以正交矩阵又有另一种定义:由行之间两两正交、列之间两两正交的单位向量组成的方阵。

方阵A是正交矩阵\(\\Leftrightarrow\)\(A^T =A^{-1}\)
方阵A是正交矩阵\(\\Leftrightarrow\)A的列向量组(或行向量组)是规范正交基

方阵A是正交矩阵\(\\Leftrightarrow\)A的列向量(或行向量)都是单位向量,且两两正交\(\\Leftrightarrow\)A的列向量组(或行向量组)是规范正交基

方阵A是正交矩阵 \(\\Leftrightarrow\)方阵A用列向量组表示,根据正交矩阵定义有: \(\\left(\\begin{array}{c}a\_{1}^{\\mathrm{T}} \\ a\_{2}^{\\mathrm{T}} \\ \\vdots \\ a\_{n}^{\\mathrm{T}}\\end{array}\\right)\\left(a\_{1}, a\_{2}, \\cdots, a\_{n}\\right)=E\) \(\\Leftrightarrow\)\(\\left(a\_{i}^{T} a\_{j}\\right)=\\left(\\delta\_{i j}\\right)\) \(\\Leftrightarrow\)\(\\boldsymbol{a}_{i}^{\\mathrm{T}} a_{j}=\\delta\_{i j}=\\left{\\begin{array}{ll}1, \\text { 当 } i=j, \& (i, j=1,2, \\cdots, n) \\ 0, \\text { 当 } i \\neq j\\end{array}\\right.\) \(\\Leftrightarrow\)A的列向量都是单位向量,且两两正交 \(\\Leftrightarrow\)列向量组构成向量空间\(\\mathbb{R}^{n}\)规范正交基

\(\\mathbf{A}^{\\mathrm{T}} \\mathbf{A}=\\mathbf{E}\)\(\\mathbf{A} \\mathbf{A}^{\\mathrm{T}}=\\mathbf{E}\)等价,所以,上述结论对于A的行向量也成立

若A是正交阵\(\\Rightarrow\)\(A^{-1}=A^{\\mathrm{T}}\)也是正交阵,且 \(|A|=1\) 或(-1)
若A和B都是正交阵\(\\Rightarrow\)AB也是正交阵

证明: A、B是正交矩阵,根据定义知道AA’=A’A=E, BB’=B’B=E, 那么(AB)(AB)‘=(AB)(B’A’)=ABB’A’=A(BB’)A=AEA’=AA’=E

若A是正交阵\(\\Rightarrow\)\(|Ax|=|x|\)

证明 若A是正交阵,则\(A^T A = E\) \(|Ax|= (Ax)^T (Ax) = x^T A^T A x = x^T x = |x|\)

正交变换\(y=P x\)

若 P 为正交矩阵,则线性变换 \(y=P x\) 称为正交变换.

设y = Px 为正交变换,则\(|y|=|x|\)

证明:\(|\\boldsymbol{y}|=\\sqrt{\\boldsymbol{y}^{\\mathrm{T}} \\boldsymbol{y}}=\\sqrt{\\boldsymbol{x}^{\\mathrm{T}} \\boldsymbol{P}^{\\mathrm{T}} \\boldsymbol{P x}}=\\sqrt{\\boldsymbol{x}^{\\mathrm{T}} \\boldsymbol{x}}=|\\boldsymbol{x}|\)

即正交变换不改变向量的长度(从而保证三角形长度不变)

方阵的特征值与特征向量

\(A x=\\lambda x\)中A的特征值与特征向量

设 A 是 n 阶矩阵,如果数$\lambda \(和 n 维**非零**列向量x 使关系式\)A x=\lambda x\(成立,(或者\)(A-\lambda E)x=0$成立) 那么,这样的数λ称为矩阵A的特征值,非零向量x称为A的对应于特征值λ的特征向量

求特征值与特征向量

根据方阵A,\(A x=\\lambda x\)其中的特征值\(\\lambda\)与对应的特征向量\(x\)的问题 \(\\Leftrightarrow\)n个未知数n个方程的齐次线性方程组\((A-\\lambda E) x=0\)何时有非零解,以及非零解的求解问题

根据方阵A,\(A x=\\lambda x\)其中的特征值\(\\lambda\) \(\\Leftrightarrow\)n个未知数n个方程的齐次线性方程组\((A-\\lambda E) x=0\)有非零解 \(\\Leftrightarrow\)系数矩阵行列式=0,即\(|A-\\lambda E| = 0\) \(\\Leftrightarrow\)求矩阵A的特征方程(特征多项式[^2]等于0)的解,即(下式中\(\\lambda\)的解): \(\\left|\\begin{array}{cccc}a\_{11}-\\lambda \& a\_{12} \& \\cdots \& a\_{1 n} \\ a\_{21} \& a\_{22}-\\lambda \& \\cdots \& a\_{2 n} \\ \\vdots \& \\vdots \& \& \\vdots \\ a\_{n 1} \& a\_{n 2} \& \\cdots \& a\_{n n}-\\lambda\\end{array}\\right|=0\)

[^2]: \(|A-\\lambda E|\)\(\\lambda\)的n次多项式,记\(f(\\lambda) = |A-\\lambda E|\)为矩阵A的特征多项式,有地方也取\(f(\\lambda) = |\\lambda E-A|\)

求特征值与特征向量的步骤

根据上面解方程组的思路,给出求特征值与特征向量的一般方法: 1)由\(|A-\\lambda E| = 0\)求特征值\(\\lambda\_i\),共n个(含重根) 2)由\((A-\\lambda\_i E) x=0\)求基础解系,用基础解系表示处特征向量的通解

事实上,还可以下面特征值的性质/公式来求解特征值

特征值的性质

n阶方阵A有n个特征值(含重根)

根据求特征值与特征向量的过程(特征多项式\(|A-\\lambda E|\)\(\\lambda\)的n次多项式), 可知n阶方阵A有n个特征值(以重根计算)

特征值之和\(\\lambda\_{1}+\\lambda\_{2}+\\cdots+\\lambda\_{n}=a\_{11}+a\_{22}+\\cdots+a\_{n n}\) 与特征值之积\(\\lambda\_{1} \\lambda\_{2} \\cdots \\lambda\_{n}=|\\boldsymbol{A}|\)

\(n\) 阶矩阵 \(\\boldsymbol{A}=\\left(a\_{i j}\\right)\) 的特征值为 \(\\lambda\_{1}, \\lambda\_{2}, \\cdots, \\lambda\_{n}\) \(\\lambda\_{1}+\\lambda\_{2}+\\cdots+\\lambda\_{n}=a\_{11}+a\_{22}+\\cdots+a\_{n n}\) (特征值之和等于方阵的迹) \(\\lambda\_{1} \\lambda\_{2} \\cdots \\lambda\_{n}=|\\boldsymbol{A}|\) (特征值之积等于方阵的行列式)

证明: 根据 \(f(\\lambda)=\\left(\\lambda-\\lambda\_{1}\\right)\\left(\\lambda-\\lambda\_{2}\\right) \\cdots\\left(\\lambda-\\lambda\_{n}\\right)\) \(=k\_0 \\lambda^0 + \\cdots + k\_{n-1} \\lambda^{n-1} + k\_{n} \\lambda^n\) 显然 $k_0 = \lambda_{1} \lambda_{2} \cdots \lambda_{n} $, \(k\_{n-1} = -(\\lambda\_1 + \\lambda\_2 + \\cdots + \\lambda\_n)\)

又根据 $f(\lambda)=|\lambda E-A|=\left|\begin{array}{cccc}\lambda-a_{11} & a_{12} & \cdots & a_{1 n} \ a_{21} & \lambda-a_{22} & \cdots & a_{2 n} \ \vdots & \vdots & & \vdots \ a_{n 1} & a_{n 2} & \cdots & \lambda-a_{n n}\end{array}\right| \(, 要想产生n-1次项\)k_{n-1}\lambda{n-1}\(,只能由主对角线的乘积\)(\lambda-a_{11})(\lambda-a_{22})\cdots(\lambda-a_{nn})\(产生, 且\)k_{n-1}\lambda{n-1} = -(a_{11}+a_{22} + \cdots + a_{nn})$ 根据行列式的定义:所有不同行不同列的元素乘积组成的项之和, 0次项$k_0 \lambda_0 \(是排除掉其他幂次后的项,恰好\)k_0 \lambda_0 = |A|$

综上, \(\\lambda\_{1}+\\lambda\_{2}+\\cdots+\\lambda\_{n}=a\_{11}+a\_{22}+\\cdots+a\_{n n}\) (特征值之和等于方阵的迹) \(\\lambda\_{1} \\lambda\_{2} \\cdots \\lambda\_{n}=|\\boldsymbol{A}|\) (特征值之积等于方阵的行列式)

\(\\lambda\)是A的特征值\(\\Rightarrow\)\(\\lambda^k\)\(A^k\) 的特征值

\(A x=\\lambda x,x\\neq 0\)\(\\Rightarrow\)\(A^k x=\\lambda^k x,x\\neq 0\)

\(\\lambda\)是A的特征值\(\\Rightarrow\)\(\\lambda+k\)\(A+kE\) 的特征值​

\(A x=\\lambda x,x\\neq 0\)\(\\Rightarrow\)\((A+kE) x=(\\lambda+k) x,x\\neq 0\)

\(\\lambda\)是A的特征值\(\\Rightarrow\)\(\\frac{1}{\\lambda}\)\(A^{-1}\)的特征值

\(A x=\\lambda x,x\\neq 0\)\(\\Rightarrow\)\(A^{-1} x=\\frac{1}{\\lambda} x,x\\neq 0\)

推论:A可逆\(\\Rightarrow\)特征值非0
\(\\lambda\)是A的特征值\(\\Rightarrow\)\(\\frac{|A|}{\\lambda}\)\(A^{\*}\)的特征值

\(A x=\\lambda x,x\\neq 0\)\(\\Rightarrow\)\(A^{\*} x=\\frac{|A|}{\\lambda} x,x\\neq 0\)

\(\\lambda\)是A的特征值\(\\Rightarrow\)特征值多项式\(\\varphi(\\lambda)\)是对应矩阵多项式\(\\varphi(\\boldsymbol{A})\)的特征值

\(\\lambda\) 是方阵 A 的特征值,

\(\\lambda^{2}\)\(A^2\)的特征值, \(\\lambda^k\)\(A^k\) 的特征值

\(\\frac{1}{\\lambda}\)\(\\boldsymbol{A}^{-1}\) 的特征值 (当 A 可逆时)

推论:当A可逆时,特征值不为0

\(\\varphi(\\lambda)=a\_{0}+a\_{1} \\lambda+\\cdots+a\_{m} \\lambda^{m}\)\(\\varphi(\\boldsymbol{A})=a\_{0} \\boldsymbol{E}\)\(+a\_{1} \\boldsymbol{A}+\\cdots+a\_{n} \\boldsymbol{A}^{m}\)\(+a\_{1} \\boldsymbol{A}+\\cdots+a\_{n} \\boldsymbol{A}^{m}\)的特征值 (实际上,这里的幂次m可取负数,只要认为\(A^{m}=(A^{-1})^n\))

特征值不相等\(\\Rightarrow\)特征向量线性无关

\(\\lambda\_{1}, \\lambda\_{2}, \\cdots, \\lambda\_{m}\) 是方阵 \(A\)\(m\) 个特征值 \(, p\_{1}, p\_{2}, \\cdots, p\_{m}\) 依次是与之对应的特征向量,如果 \(\\lambda\_{1}, \\lambda\_{2}, \\cdots, \\lambda\_{m}\) 各不相等 ,则 \(p\_{1}, p\_{2}, \\cdots, p\_{m}\) 线性无关.

证明(用数学归纳法证明)

当m=1时,因特征向量\(p\_1\\neq 0\),故只含一个向量的向量组\(p\_1\)线性无关.

假设当 m = k – 1 时结论成立,要证当 m = k 时结论也成立。 假设\(p\_{1}, p\_{2}, \\cdots, p\_{k-1}\)线性无关, 令\(x\_{1} p\_{1}+x\_{2} p\_{2}+\\cdots+x\_{k-1} p\_{k-1}+x\_{k} p\_{k}=0\), (1) 用A左乘上式,得\(x\_{1} A p\_{1}+x\_{2} A p\_{2}+\\cdots+x\_{k-1} A p\_{k-1}+x\_{k} A p\_{k}=0\)\(x\_{1} \\lambda\_{1} p\_{1}+x\_{2} \\lambda\_{2} p\_{2}+\\cdots+x\_{k-1} \\lambda\_{k-1} p\_{k-1}+x\_{k} \\lambda\_{k} p\_{k}=0\) (2)

\((2) – \\lambda\_k (1)\)\(x\_{1}\\left(\\lambda\_{1}-\\lambda\_{k}\\right) p\_{1}+x\_{2}\\left(\\lambda\_{2}-\\lambda\_{k}\\right) p\_{2}+\\cdots+x\_{k-1}\\left(\\lambda\_{k-1}-\\lambda\_{k}\\right) p\_{k-1}=0\) 由于\(p\_{1}, p\_{2}, \\cdots, p\_{k-1}\)线性无关,\(x\_{i}\\left(\\lambda\_{i}-\\lambda\_{k}\\right)=0(i=1,2, \\cdots, k-1),\)\(\\lambda\_{i}-\\lambda\_{k} \\neq 0\)\((i=1,2, \\cdots, k-1)\), 于是\(x\_{i}=0(i=1,2, \\cdots, k-1)\) 代入(2)得\(x\_{k} p\_{k}=0\).而\(p\_{k} \\neq 0,\)\(x\_{k}=0 .\) 因此, 向量组 \(p\_{1}, p\_{2}, \\cdots, p\_{k}\) 线性无关.

相似矩阵

矩阵相似\(\\boldsymbol{P}^{-1} \\boldsymbol{A P}=\\boldsymbol{B}\)

设A,B都是n阶矩阵,若有可逆矩阵P,使\(\\boldsymbol{P}^{-1} \\boldsymbol{A P}=\\boldsymbol{B}\),则称B是A的相似矩阵,或说矩阵A与B相似. 对A进行运算\(\\boldsymbol{P}^{-1} \\boldsymbol{A P}\)称为对A进行相似变换, 可逆矩阵P称为把A变成B的相似变换矩阵

矩阵相似的性质

反身性对称性传递性

矩阵A与A相似

矩阵A与B相似\(\\Rightarrow\)矩阵B与A相似

矩阵A与B相似,B与C相似\(\\Rightarrow\)矩阵A与C相似

矩阵A与B相似\(\\Rightarrow\)矩阵\(A+kE\)\(B+kE\)相似

注意: 虽然有性质:矩阵A与B相似\(\\Rightarrow\)矩阵\(A+kE\)\(B+kE\)相似 但是,并没有A的多项式与B的多项式相似的结论!!!

矩阵A与B相似\(\\Rightarrow\)矩阵\(A^n\)\(B^n\)相似

特别的,矩阵A与\(\\Lambda\)相似\(\\Rightarrow\)矩阵\(A^n\)\(\\Lambda^n\)相似

矩阵A与B相似\(\\Rightarrow\)\(r(A)=r(B)\)

证明 矩阵A与B相似,即\(\\boldsymbol{P}^{-1} \\boldsymbol{A P}=\\boldsymbol{B}\), 又P是可逆矩阵,初等变换变换不改变矩阵的秩, 所以\(r(A)=r(B)\)

定理: n阶矩阵A与B相似\(\\Rightarrow\)A与B的特征多项式相同\(\\Rightarrow\)A与B的特征值相同

证明 \(|\\boldsymbol{B}-\\lambda \\boldsymbol{E}|=\\left|\\boldsymbol{P}^{-1} \\boldsymbol{A P}-\\boldsymbol{P}^{-1}(\\lambda \\boldsymbol{E}) \\boldsymbol{P}\\right|=\\left|\\boldsymbol{P}^{-1}(\\boldsymbol{A}-\\lambda \\boldsymbol{E}) \\boldsymbol{P}\\right|\) \(=\\left|\\boldsymbol{P}^{-1}\\right||\\boldsymbol{A}-\\lambda \\boldsymbol{E}||\\boldsymbol{P}|=|\\boldsymbol{A}-\\lambda \\boldsymbol{E}|\)

推论: n阶矩阵A与对角阵\(\\Lambda\)相似\(\\Rightarrow\)\(\\Lambda\)对角线上的值是\(\\boldsymbol{A}\)\(n\) 个特征值

若 n 阶矩阵 A 与对角阵\(\\mathbf{\\Lambda}=\\left(\\begin{array}{llll}\\lambda\_{1} \& \& \& \\ \& \\lambda\_{2} \& \& \\ \& \& \\ddots \& \\ \& \& \& \\lambda\_{n}\\end{array}\\right)\)相似,则 \(\\lambda\_{1}, \\lambda\_{2}, \\cdots, \\lambda\_{n}\) 即是 \(\\boldsymbol{A}\)\(n\) 个特征值

证明

\(\\lambda\_{1}, \\lambda\_{2}, \\cdots, \\lambda\_{n}\) 即是 \(\\boldsymbol{\\Lambda}\)\(n\) 个特征值,由矩阵相似的性质:[n阶矩阵A与B相似\(\\Rightarrow\)A与B的特征多项式相同\(\\Rightarrow\)A与B的特征值相同](#定理: n阶矩阵A与B相似\(\\Rightarrow\)A与B的特征多项式相同\(\\Rightarrow\)A与B的特征值相同)知 \(\\lambda\_{1}, \\lambda\_{2}, \\cdots, \\lambda\_{n}\) 也就是A的n个特征值

矩阵A与B相似\(\\Rightarrow\)\(|A|=|B|\)

证明 根据:[特征值之和\(\\lambda\_{1}+\\lambda\_{2}+\\cdots+\\lambda\_{n}=a\_{11}+a\_{22}+\\cdots+a\_{n n}\) 与特征值之积\(\\lambda\_{1} \\lambda\_{2} \\cdots \\lambda\_{n}=|\\boldsymbol{A}|\)](#特征值之和\(\\lambda\_{1}+\\lambda\_{2}+\\cdots+\\lambda\_{n}=a\_{11}+a\_{22}+\\cdots+a\_{n n}\) 与特征值之积\(\\lambda\_{1} \\lambda\_{2} \\cdots \\lambda\_{n}=|\\boldsymbol{A}|\)), 以及定理: [n阶矩阵A与B相似\(\\Rightarrow\)A与B的特征多项式相同\(\\Rightarrow\)A与B的特征值相同](#定理: n阶矩阵A与B相似\(\\Rightarrow\)A与B的特征多项式相同\(\\Rightarrow\)A与B的特征值相同) 立即可知,若矩阵A与B相似,则\(|A|=|B|\)

矩阵A与B相似\(\\Rightarrow\)\(\\sum a\_{ii}=\\sum b\_{ii}\)

证明 根据:[特征值之和\(\\lambda\_{1}+\\lambda\_{2}+\\cdots+\\lambda\_{n}=a\_{11}+a\_{22}+\\cdots+a\_{n n}\) 与特征值之积\(\\lambda\_{1} \\lambda\_{2} \\cdots \\lambda\_{n}=|\\boldsymbol{A}|\)](#特征值之和\(\\lambda\_{1}+\\lambda\_{2}+\\cdots+\\lambda\_{n}=a\_{11}+a\_{22}+\\cdots+a\_{n n}\) 与特征值之积\(\\lambda\_{1} \\lambda\_{2} \\cdots \\lambda\_{n}=|\\boldsymbol{A}|\)), 以及定理: [n阶矩阵A与B相似\(\\Rightarrow\)A与B的特征多项式相同\(\\Rightarrow\)A与B的特征值相同](#定理: n阶矩阵A与B相似\(\\Rightarrow\)A与B的特征多项式相同\(\\Rightarrow\)A与B的特征值相同) 立即可知,若矩阵A与B相似,则矩阵的迹相等

矩阵A与B相似\(\\Rightarrow\)矩阵\(A^T\)\(B^T\)相似

证明 矩阵A与B相似,即\(\\boldsymbol{P}^{-1} \\boldsymbol{A P}=\\boldsymbol{B}\), 则\((\\boldsymbol{P}^{-1} \\boldsymbol{A P})^T=\\boldsymbol{B}^T\), 即\(\\boldsymbol{P}^{T} \\boldsymbol{A} {(\\boldsymbol{P^{-1}}})^T=\\boldsymbol{B}^T\), 即\(\\boldsymbol{P}^{T} \\boldsymbol{A} {(\\boldsymbol{P^{T}}})^{-1}=\\boldsymbol{B}^T\) 即矩阵\(A^T\)\(B^T\)相似

矩阵A与B相似\(\\Rightarrow\)矩阵\(A^{-1}\)\(B^{-1}\)相似

证明 矩阵A与B相似,即\(\\boldsymbol{P}^{-1} \\boldsymbol{A P}=\\boldsymbol{B}\), 则\((\\boldsymbol{P}^{-1} \\boldsymbol{A P})^{-1}=\\boldsymbol{B}^{-1}\), 即\(\\boldsymbol{P} \\boldsymbol{A}^{-1} \\boldsymbol{P^{-1}}=\\boldsymbol{B}^{-1}\), 令\(Q=P^{-1}\),则\(\\boldsymbol{Q}^{-1} \\boldsymbol{A}^{-1} \\boldsymbol{Q}=\\boldsymbol{B}^{-1}\), 即矩阵\(A^{-1}\)\(B^{-1}\)相似

矩阵A与B相似\(\\Rightarrow\)矩阵\(A^*\)\(B^*\)相似​

证明 \(AA^*=A^* A = |A| E\)\(A^\* = |A| A^{-1}\) 根据矩阵A与B相似\(\\Rightarrow\)\(|A|=|B|\), 以及矩阵A与B相似\(\\Rightarrow\)矩阵\(A^{-1}\)\(B^{-1}\)相似\(\\boldsymbol{Q}^{-1} \\boldsymbol{A}^{-1} \\boldsymbol{Q}=\\boldsymbol{B}^{-1}\) 进一步有\(\\boldsymbol{Q}^{-1} |A|\\boldsymbol{A}^{-1} \\boldsymbol{Q}=|B| \\boldsymbol{B}^{-1}\)\(\\boldsymbol{Q}^{-1} \\boldsymbol{A}^{*} \\boldsymbol{Q}=\\boldsymbol{B}^{*}\) 即矩阵\(A^*\)\(B^*\)相似

矩阵A与B相似,矩阵C与D相似\(\\Rightarrow\)矩阵\(\\left(\\begin{array}{ll}A \& 0\\0 \& C \\end{array}\\right)\)\(\\left(\\begin{array}{ll}B \& 0\\0 \& D \\end{array}\\right)\)相似

//TODO

矩阵对角化\(P^{-1} A P=\\Lambda\)

对n阶矩阵A,寻求相似变换矩阵P,使\(\\boldsymbol{P}^{-1} \\boldsymbol{A} \\boldsymbol{P}=\\boldsymbol{\\Lambda}\)为对角阵这就称为把矩阵A对角化 (即找与矩阵A相似的对角矩阵)

注: 根据矩阵相似的[推论: n阶矩阵A与对角阵\(\\Lambda\)相似\(\\Rightarrow\)\(\\Lambda\)对角线上的值是\(\\boldsymbol{A}\)\(n\) 个特征值](#推论: n阶矩阵A与对角阵\(\\Lambda\)相似\(\\Rightarrow\)\(\\Lambda\)对角线上的值是\(\\boldsymbol{A}\)\(n\) 个特征值),可见用\(\\Lambda\)矩阵求特征值是一种很好的方法,

矩阵可对角化的充要条件

\(P^{-1} A P=\\Lambda\)\(\\Leftrightarrow\)P可逆且\(\\boldsymbol{A P}=\\boldsymbol{P \\Lambda}\)\(\\Leftrightarrow\)\(\\boldsymbol{A} \\boldsymbol{p}_{i}=\\lambda_{i} \\boldsymbol{p}_{i}\)\(\\boldsymbol{p}_{1}, \\boldsymbol{p}_{2}, \\cdots, \\boldsymbol{p}_{n}\)线性无关

即定理: n阶矩阵A与对角阵相似(即A能对角化)\(\\Leftrightarrow\)A有n个线性无关的特征向量

\("\\Rightarrow"\)的证明:

若有可逆矩阵 P 使 \(P^{-1} A P=\\Lambda\) 为对角阵, 即有\(A P=P A\). 把P用其列向量表示为\(\\boldsymbol{P}=\\left(\\boldsymbol{p}_{1}, \\boldsymbol{p}_{2}, \\cdots, \\boldsymbol{p}_{n}\\right)\)\(\\boldsymbol{A}\\left(p_{1}, p\_{2}, \\cdots, p\_{n}\\right)\) \(=\\left(p\_{1}, p\_{2}, \\cdots, p\_{n}\\right)\\left(\\begin{array}{cccc}\\lambda\_{1} \& \& \& \\ \& \\lambda\_{2} \& \& \\ \& \& \\ddots \& \\ \& \& \& \\lambda\_{n}\\end{array}\\right)\) \(=\\left(\\lambda\_{1} p\_{1}, \\lambda\_{2} p\_{2}, \\cdots, \\lambda\_{n} p\_{n}\\right)\)\(\\boldsymbol{A} \\boldsymbol{p}_{i}=\\lambda_{i} \\boldsymbol{p}_{i} \\quad(i=1,2, \\cdots, n)\) 又矩阵P可逆,则r(P)=n,对应的列向量组\(\\boldsymbol{p}_{1}, \\boldsymbol{p}_{2}, \\cdots, \\boldsymbol{p}_{n}\)线性无关

\("\\Leftarrow"\)的证明:

对于矩阵A,根据n阶方阵A有n个特征值(含重根),可以找到n个特征值\(\\lambda\_{1}, \\lambda\_{2}, \\cdots, \\lambda\_{n}\), 并可对应地求得n个特征向量\(\\boldsymbol{p}_{1}, \\boldsymbol{p}_{2}, \\cdots, \\boldsymbol{p}_{n}\),(写成列向量),写出n个特征方程\(\\boldsymbol{A} \\boldsymbol{p}_{i}=\\lambda\_{i} \\boldsymbol{p}_{i} \\quad(i=1,2, \\cdots, n)\) 令这n个特征向量构成矩阵\(\\boldsymbol{P}=\\left(\\boldsymbol{p}_{1}, \\boldsymbol{p}_{2}, \\cdots, \\boldsymbol{p}_{n}\\right)\)\(A P=P A\)\(\\boldsymbol{p}_{1}, \\boldsymbol{p}_{2}, \\cdots, \\boldsymbol{p}_{n}\)线性无关,则\(r\\left(\\boldsymbol{p}_{1}, \\boldsymbol{p}_{2}, \\cdots, \\boldsymbol{p}_{n}\\right)=n\)\(r(P)=n\),则P可逆, 则有\(P^{-1} A P=\\Lambda\)

\(P^{-1} A P=\\Lambda\)\(\\Leftrightarrow\)矩阵的每个特征值的代数重数等于它的几何重数的矩阵

参考:特征多项式、代数重数与几何重数

简单的说,\(|A-\\lambda E|=(\\lambda\_1-\\lambda)^{k\_1}\\cdots(\\lambda\_m – \\lambda)^{k\_m} = 0\)中,特征值\(\\lambda\_i\)的重数\(k\_i\)称为特征值\(\\lambda\_i\)的代数重数; \((A-\\lambda E)x = 0\)\(\\lambda=\\lambda\_i\)时,解空间的维数(解的极大线性无关组的个数)特征值\(\\lambda\_i\)的几何重数.

实际上,这和上一条性质[\(P^{-1} A P=\\Lambda\)\(\\Leftrightarrow\)P可逆且\(\\boldsymbol{A P}=\\boldsymbol{P \\Lambda}\)\(\\Leftrightarrow\)\(\\boldsymbol{A} \\boldsymbol{p}_{i}=\\lambda_{i} \\boldsymbol{p}_{i}\)\(\\boldsymbol{p}_{1}, \\boldsymbol{p}_{2}, \\cdots, \\boldsymbol{p}_{n}\)线性无关](#\(P^{-1} A P=\\Lambda\)\(\\Leftrightarrow\)P可逆且\(\\boldsymbol{A P}=\\boldsymbol{P \\Lambda}\)\(\\Leftrightarrow\)\(\\boldsymbol{A} \\boldsymbol{p}_{i}=\\lambda_{i} \\boldsymbol{p}_{i}\)\(\\boldsymbol{p}_{1}, \\boldsymbol{p}_{2}, \\cdots, \\boldsymbol{p}_{n}\)线性无关)是等价的,都是矩阵可对角化的充要条件

eg: 不可对角化的例子: \(A =\\left(\\begin{array}{ll}1 \& 1\\0 \& 1 \\end{array}\\right)\) 根据\(Ax=\\lambda x\),即\((A-\\lambda E) x = 0\),确定特征值与特征向量: 令\(|A-\\lambda E|=\\left|\\begin{array}{ll}1-\\lambda \& 1\\0 \& 1-\\lambda \\end{array}\\right|=(1-\\lambda)^2=0\) \(\\lambda=1\)是二重根,即特征值\(\\lambda = 1\)的代数重数为2. 若\(\\lambda=1\), 则\((A-\\lambda E) x = 0\)化为\(\\left(\\begin{array}{ll}0 \& 1\\0 \& 0 \\end{array}\\right)x= 0\)\(r(A-\\lambda E)=1\), 则\(n-r(A-\\lambda E)=2-1=1\),即方程组\(\\left(\\begin{array}{ll}0 \& 1\\0 \& 0 \\end{array}\\right)x= 0\)解空间的极大线性无关组个数为1 即特征值\(\\lambda = 1\)的几何重数为1

矩阵相似对角化性质

n阶矩阵A的特征值互不相等\(\\Rightarrow\)矩阵A与\(\\Lambda\)相似

证明: 由于n阶矩阵A的特征值\(\\lambda\_{1}, \\lambda\_{2}, \\cdots, \\lambda\_{n}\)互不相等,根据矩阵相似的性质:特征值不相等\(\\Rightarrow\)特征向量线性无关, 则各特征值对应的特征向量\(\\boldsymbol{p}_{1}, \\boldsymbol{p}_{2}, \\cdots, \\boldsymbol{p}_{n}\)线性无关 即\(\\boldsymbol{A} \\boldsymbol{p}_{i}=\\lambda\_{i} \\boldsymbol{p}_{i}\)\(\\boldsymbol{p}_{1}, \\boldsymbol{p}_{2}, \\cdots, \\boldsymbol{p}_{n}\)线性无关 根据矩阵对角化充要条件:[\(P^{-1} A P=\\Lambda\)\(\\Leftrightarrow\)P可逆且\(\\boldsymbol{A P}=\\boldsymbol{P \\Lambda}\)\(\\Leftrightarrow\)\(\\boldsymbol{A} \\boldsymbol{p}_{i}=\\lambda_{i} \\boldsymbol{p}_{i}\)\(\\boldsymbol{p}_{1}, \\boldsymbol{p}_{2}, \\cdots, \\boldsymbol{p}_{n}\)线性无关](#\(P^{-1} A P=\\Lambda\)\(\\Leftrightarrow\)P可逆且\(\\boldsymbol{A P}=\\boldsymbol{P \\Lambda}\)\(\\Leftrightarrow\)\(\\boldsymbol{A} \\boldsymbol{p}_{i}=\\lambda_{i} \\boldsymbol{p}_{i}\)\(\\boldsymbol{p}_{1}, \\boldsymbol{p}_{2}, \\cdots, \\boldsymbol{p}_{n}\)线性无关) 得:\(P^{-1} A P=\\Lambda\)

\(\\boldsymbol{P}^{-1} \\boldsymbol{A P}=\\boldsymbol{\\Lambda}\) \(\\Rightarrow\) \(\\varphi(\\boldsymbol{A})=\\boldsymbol{P} \\varphi(\\boldsymbol{\\Lambda}) \\boldsymbol{P}^{-1}\)

证明(线性代数矩阵章节曾经证过一次)

矩阵章节曾证明: 若有可逆矩阵 P 使 P \(^{-1} A P=\\Lambda\) 为对角阵 \(\\boldsymbol{A}=\\boldsymbol{P B P}^{-1}\),\(\\boldsymbol{A}^{k}=\\boldsymbol{P} \\boldsymbol{B}^{k} \\boldsymbol{P}^{-1}\),\(\\varphi(\\boldsymbol{A})=\\boldsymbol{P} \\varphi(\\boldsymbol{B}) \\boldsymbol{P}^{-1}\)

特别的:取B为对角阵, 即 P \(^{-1} A P=\\Lambda\) 为对角阵, 则有\(\\varphi(\\boldsymbol{A})=\\boldsymbol{P} \\varphi(\\boldsymbol{B}) \\boldsymbol{P}^{-1}\)

\(f(\\lambda)\)是矩阵A的特征多项式\(\\Rightarrow\)\(f(A)=O\)

注: \(f(\\lambda) = |A-\\lambda E|\)为矩阵A的特征多项式

证明(仅证可对角化的情况)

矩阵可对角化时的情况: A与对角阵相似,即有可逆矩阵P,使\(\\boldsymbol{P}^{-1} \\boldsymbol{A P}=\\boldsymbol{\\Lambda}=\\operatorname{diag}\\left(\\lambda\_{1}, \\cdots, \\lambda\_{n}\\right)\),其中\(f\\left(\\lambda\_{i}\\right)=0\) ( 因为\(\\lambda\_{1}, \\lambda\_{2}, \\cdots, \\lambda\_{n}\)\(\\boldsymbol{\\Lambda}\)\(n\) 个特征值,根据[定理: n阶矩阵A与B相似\(\\Rightarrow\)A与B的特征多项式相同\(\\Rightarrow\)A与B的特征值相同](#定理: n阶矩阵A与B相似\(\\Rightarrow\)A与B的特征多项式相同\(\\Rightarrow\)A与B的特征值相同) 则\(\\lambda\_{1}, \\lambda\_{2}, \\cdots, \\lambda\_{n}\) 是A的 \(n\) 个特征值,所以\(f\\left(\\lambda\_{i}\\right)=0\) ) 则\(f(A)=P f(\\Lambda) P^{-1}\) \(=P\\left(\\begin{array}{ccc}f\\left(\\lambda\_{1}\\right) \& \& \\ \& \\ddots \& \\ \& \& f\\left(\\lambda\_{n}\\right)\\end{array}\\right) \\boldsymbol{P}^{-1}\) \(=P O P^{-1}=O\)

其他情况: //TODO

对称矩阵的对角化

对称矩阵

(实)对称矩阵的性质

实对称阵的特征值为实数

证明 设复数\(\\lambda\)为矩阵A的特征值,复向量x为对应的特征向量,即\(A x=\\lambda x, x \\neq 0\)\(\\bar{\\lambda}\)\(\\lambda\)的共轭复数,\(\\bar{x}\)是x的共轭复向量. A 为实矩阵,有 \(A=\\bar{A}\), 故 \(A \\vec{x}=\)\(\\bar{A} \\bar{x}=(\\overline{A x})=(\\overline{\\lambda x})=\\bar{\\lambda} \\bar{x}\) 根据: \(\\bar{x}^{\\top} A x=\\bar{x}^{\\top}(A x)=\\bar{x}^{\\top} \\lambda x=\\lambda x^{\\top} x\) \(\\overline{\\boldsymbol{x}}^{\\mathrm{T}} \\boldsymbol{A} \\boldsymbol{x}=\\left(\\overline{\\boldsymbol{x}}^{\\mathrm{T}} \\boldsymbol{A}^{\\mathrm{T}}\\right) \\boldsymbol{x}=(\\boldsymbol{A} \\overline{\\boldsymbol{x}})^{\\mathrm{T}} \\boldsymbol{x}=(\\vec{\\lambda} \\overline{\\boldsymbol{x}})^{\\mathrm{T}} \\boldsymbol{x}=\\bar{\\lambda} \\overline{\\boldsymbol{x}}^{\\mathrm{T}} \\boldsymbol{x}\) 两式相减,有\((\\lambda-\\bar{\\lambda}) \\vec{x}^{\\top} x=0\)\(x \\neq 0\),所以 \(\\lambda-\\bar{\\lambda}=0,\)\(\\lambda=\\bar{\\lambda},\) 这就说明 \(\\lambda\) 是实数

显然,特征值 \(\\lambda\_i\) 为实数时,齐次线性方程组\(\\left(A-\\lambda\_{i} E\\right) x=0\)是实系数方程组, 再根据\(\\left|\\boldsymbol{A}-\\lambda\_{i} \\boldsymbol{E}\\right|=0\),必有实的基础解系,对应的特征向量可以取实向量

对称阵A特征值\(\\lambda\_1 \\neq \\lambda\_2\)\(\\Rightarrow\)特征向量\(p\_1,p\_2\)正交

证明 \(\\lambda\_{1} p\_{1}=A p\_{1}, \\lambda\_{2} p\_{2}=A p\_{2}, \\lambda\_{1} \\neq \\lambda\_{2}\) \(\\lambda\_{1} p\_{1}^{\\mathrm{T}}=\\left(\\lambda\_{1} p\_{1}\\right)^{\\mathrm{T}}=\\left(A p\_{1}\\right)^{\\mathrm{T}}=p\_{1}^{\\mathrm{T}} A^{\\mathrm{T}}=p\_{1}^{\\mathrm{T}} A\) \(\\lambda\_{1} \\boldsymbol{p}_{1}^{\\mathrm{T}} \\boldsymbol{p}_{2}=\\boldsymbol{p}_{1}^{\\mathrm{T}} \\boldsymbol{A} \\boldsymbol{p}_{2}=\\boldsymbol{p}_{1}^{\\mathrm{T}}\\left(\\lambda_{2} \\boldsymbol{p}_{2}\\right)=\\lambda_{2} \\boldsymbol{p}_{1}^{\\mathrm{T}} \\boldsymbol{p}_{2}\) 移项得\(\\left(\\lambda\_{1}-\\lambda\_{2}\\right) p\_{1}^{\\mathrm{T}} p\_{2}=0\)\(\\lambda\_{1} \\neq \\lambda\_{2},\)\(p\_{1}^{\\mathrm{T}} p\_{2}=0,\)\(p\_{1}\)\(p\_{2}\) 正交

A是对称阵\(\\Rightarrow\)存在正交矩阵P,使得\(P^{-1} A P=P^{T} A P=\\Lambda\)

证明:知乎:为什么实对称矩阵一定能对角化?

A是对称阵,\(\\lambda\)是A的特征方程的k重根\(\\Rightarrow\)矩阵\(A – \\lambda E\) 的秩\(R(\\boldsymbol{A}-\\lambda \\boldsymbol{E})=n-k\) \(\\Rightarrow\)对应特征值\(\\lambda\)恰有 \(k\) 个线性无关的特征向量

证明 根据[A是对称阵\(\\Rightarrow\)存在正交矩阵P,使得\(P^{-1} A P=P^{T} A P=\)\Lambda](#A是对称阵\(\\Rightarrow\)存在正交矩阵P,使得\(P^{-1} A P=P^{T} A P=\\Lambda\)), 则对称阵 A 与对角阵 \(\\boldsymbol{\\Lambda}=\\operatorname{diag}\\left(\\lambda\_{1}, \\cdots, \\lambda\_{n}\\right)\) 相似. 则\(\\boldsymbol{A}-\\lambda \\boldsymbol{E}\)与与 \(\\boldsymbol{\\Lambda}-\\lambda \\boldsymbol{E}=\\operatorname{diag}\\left(\\lambda\_{1}-\\lambda, \\cdots, \\lambda\_{n}-\\lambda\\right)\) 相似.

\(\\lambda\) 是 A 的 \(k\) 重特征根时, \(\\lambda\_{1}, \\cdots, \\lambda\_{n}\)中有k个等于 \(\\lambda,\)\(n-k\) 个不等于 \(\\lambda\), 则对角阵$ \Lambda – \lambda E\(的对角元恰有 k 个等于 0, 则\)n – k=r( \Lambda – \lambda E)= r( A – \lambda E)\(, 则\)n-r( A – \lambda E)= k\(, 即对应特征值\) \lambda $恰有 k 个线性无关的特征向量

对称阵必可对角化

由: [对称阵A特征值\(\\lambda\_1 \\neq \\lambda\_2\)\(\\Rightarrow\)特征向量\(p\_1,p\_2\)正交](#对称阵A特征值\(\\lambda\_1 \\neq \\lambda\_2\)\(\\Rightarrow\)特征向量\(p\_1,p\_2\)正交), [A是对称阵,\(\\lambda\)是A的特征方程的k重根\(\\Rightarrow\)\(\\lambda\)恰有 \(k\) 个线性无关的特征向量](#A是对称阵,\(\\lambda\)是A的特征方程的k重根\(\\Rightarrow\)矩阵\(A – \\lambda E\) 的秩\(R(\\boldsymbol{A}-\\lambda \\boldsymbol{E})=n-k\) \(\\Rightarrow\)对应特征值\(\\lambda\)恰有 \(k\) 个线性无关的特征向量) 可知: 对称阵A有n个线性无关的特征向量, 对称阵A的每个特征值的代数重数等于它的几何重数. 根据[\(P^{-1} A P=\\Lambda\)\(\\Leftrightarrow\)P可逆且\(\\boldsymbol{A P}=\\boldsymbol{P \\Lambda}\)\(\\Leftrightarrow\)\(\\boldsymbol{A} \\boldsymbol{p}_{i}=\\lambda_{i} \\boldsymbol{p}_{i}\)\(\\boldsymbol{p}_{1}, \\boldsymbol{p}_{2}, \\cdots, \\boldsymbol{p}_{n}\)线性无关](#\(P^{-1} A P=\\Lambda\)\(\\Leftrightarrow\)P可逆且\(\\boldsymbol{A P}=\\boldsymbol{P \\Lambda}\)\(\\Leftrightarrow\)\(\\boldsymbol{A} \\boldsymbol{p}_{i}=\\lambda_{i} \\boldsymbol{p}_{i}\)\(\\boldsymbol{p}_{1}, \\boldsymbol{p}_{2}, \\cdots, \\boldsymbol{p}_{n}\)线性无关), 则对称阵A必可对角化. (根据[\(P^{-1} A P=\\Lambda\)\(\\Leftrightarrow\)矩阵的每个特征值的代数重数等于它的几何重数](#\(P^{-1} A P=\\Lambda\)\(\\Leftrightarrow\)矩阵的每个特征值的代数重数等于它的几何重数的矩阵)也可得出对称阵必可对角化的结论)

对称矩阵对角化步骤

对称阵必可对角化 [A是对称阵\(\\Rightarrow\)存在正交矩阵P,使得\(P^{-1} A P=P^{T} A P=\\Lambda\)](#A是对称阵\(\\Rightarrow\)存在正交矩阵P,使得\(P^{-1} A P=P^{T} A P=\\Lambda\))

可以给出矩阵对角化的一般步骤:

1)求出 A 的全部互不相等的特征值 \(\\lambda\_{1}, \\cdots, \\lambda\_{s},\) 它们的重数依次为 \(k\_{1}, \\cdots,\)\(k\_{s}\\left(k\_{1}+\\cdots+k\_{s}=n\\right)\) 2)对每个 \(k\_{i}\) 重特征值 \(\\lambda\_{i},\) 求方程 \(\\left(A-\\lambda\_{i} E\\right) x=0\) 的基础解系, 得 \(k\_{i}\) 个线性无关的特征向量. 3)它们正交化[^3],单位化,得 \(k\_{i}\) 个两两正交的单位特征向量. 4)把这 n 个两两正交的单位特征向量构成正交阵 P,便有\(\\boldsymbol{P}^{-1} \\boldsymbol{A} \\boldsymbol{P}=\)\(\\boldsymbol{P}^{\\mathrm{T}} \\boldsymbol{A P}=\\boldsymbol{\\Lambda}\),注意 A 中对角元的排列次序应与 P 中列向量的排列次序相对应 .

[^3]:由于[对称阵A不同特征值的特征向量已保证正交](#对称阵A特征值\(\\lambda\_1 \\neq \\lambda\_2\)\(\\Rightarrow\)特征向量\(p\_1,p\_2\)正交),只需正交化每个特征值对应的特征向量即可

二次型及其标准型

二次型的引入

讨论n个变量的二次齐次多项式的化简问题,可以引入二次型.

以平面解析几何为例,为了便于研究二次曲线:\(a x^{2}+b x y+c y^{2}=1\)的几何性质, 做适当的坐标(旋转)变换: \(\\left{\\begin{array}{l}x=x^{\\prime} \\cos \\theta-y^{\\prime} \\sin \\theta \\ y=x^{\\prime} \\sin \\theta+y^{\\prime} \\cos \\theta\\end{array}\\right.\) 则二次曲线变为标准型:\(m x^{\\prime 2}+n y^{\\prime 2}=1\) 从代数学的角度看, 坐标变换前二次曲线左边\(a x^{2}+b x y+c y^{2}\)是二次齐次多项式, 坐标变换后曲线左边\(m x^{\\prime 2}+n y^{\\prime 2}\)是仅含平方项的二次齐次多项式. 通过坐标变换,二次齐次式形式得到化简.

二次型\(f=\\boldsymbol{x^{\\mathrm{T}} A x}\)

二次型定义

含有 \(n\) 个变量 \(x\_{1}, x\_{2}, \\cdots, x\_{n}\) 的二次齐次函数: \(f\\left(x\_{1}, x\_{2}, \\cdots, x\_{n}\\right)=a\_{11} x\_{1}^{2}+a\_{22} x\_{2}^{2}+\\cdots+a\_{n n} x\_{n}^{2}\)\(+2 a\_{12} x\_{1} x\_{2}+2 a\_{13} x\_{1} x\_{3}+\\cdots+2 a\_{n-1, n} x\_{n-1} x\_{n}\) 称为二次型.

\(a\_{j i}=a\_{i j}\),则二次型还可以写成: \(f=a\_{11} x\_{1}^{2}+a\_{12} x\_{1} x\_{2}+\\cdots+a\_{1 n} x\_{1} x\_{n}\)\(+a\_{21} x\_{2} x\_{1}+a\_{22} x\_{2}^{2}+\\cdots+a\_{2 n} x\_{2} x\_{n}\)\(+\\cdots+a\_{n 1} x\_{n} x\_{1}+a\_{n 2} x\_{n} x\_{2}+\\cdots+a\_{n n} x\_{n}^{2}\) \(=\\sum\_{i, j=1}^{n} a\_{i j} x\_{i} x\_{j}\)

进一步,利用矩阵,二次型还可以表示为: \(f=x\_{1}\\left(a\_{11} x\_{1}+a\_{12} x\_{2}+\\cdots+a\_{1 n} x\_{n}\\right)\)\(+x\_{2}\\left(a\_{21} x\_{1}+a\_{22} x\_{2}+\\cdots+a\_{2 n} x\_{n}\\right)\)\(+\\cdots+x\_{n}\\left(a\_{n 1} x\_{1}+a\_{n 2} x\_{2}+\\cdots+a\_{n n} x\_{n}\\right)\) \(=\\left(x\_{1}, x\_{2}, \\cdots, x\_{n}\\right)\)\(\\left(\\begin{array}{c}a\_{11} x\_{1}+a\_{12} x\_{2}+\\cdots+a\_{1 n} x\_{n} \\ a\_{21} x\_{1}+a\_{22} x\_{2}+\\cdots+a\_{2 n} x\_{n} \\ \\vdots \\ a\_{n 1} x\_{1}+a\_{n 2} x\_{2}+\\cdots+a\_{n n} x\_{n}\\end{array}\\right)\) \(=\\left(x\_{1}, x\_{2}, \\cdots, x\_{n}\\right)\\left\[\\begin{array}{cccc}a\_{11} \& a\_{12} \& \\cdots \& a\_{1 n} \\ a\_{21} \& a\_{22} \& \\cdots \& a\_{2 n} \\ \\vdots \& \\vdots \& \& \\vdots \\ a\_{n 1} \& a\_{n 2} \& \\cdots \& a\_{n n}\\end{array}\\right\]\\left(\\begin{array}{c}x\_{1} \\ x\_{2} \\ \\vdots \\ x\_{n}\\end{array}\\right)\) \(=\\boldsymbol{x}^{\\mathrm{T}} \\boldsymbol{A} \\boldsymbol{x}\) 其中A是对称阵(因为 \(a\_{j i}=a\_{i j}\))

由上面可知,任给一个二次型,就惟一地确定一个对称阵; 反之,任给一个对称阵,也可惟一地确定一个二次型。 这样,二次型与对称阵之间存在一一对应的关系。 因此,我们把对称阵A叫做二次型\(f\)的矩阵,也把**\(f\)叫做对称阵A的二次型**, 对称阵A的秩就叫做二次型f的秩

标准型\(f=\\boldsymbol{y}^{\\mathrm{T}} \\Lambda \\boldsymbol{ y}\)

对于二次型\(f=\\boldsymbol{x^{\\mathrm{T}} A x}\),若二次型的矩阵A是对角阵, 即f仅含平方项,即\(f=\\boldsymbol{y}^{\\mathrm{T}} \\Lambda \\boldsymbol{ y}\),称这样的二次型为标准型

规范型

对于标准型\(f=\\boldsymbol{x^{\\mathrm{T}} A x}\)(其中A为对角阵), 若对角阵A元素只包含0,+1,-1,称这样的标准型为规范型

矩阵合同

矩阵合同的引入

矩阵合同概念是在二次型做线性变换过程中产生的.

对于二次型\(f=\\boldsymbol{x}^{\\mathrm{T}} \\boldsymbol{A} \\boldsymbol{x}\), 记可逆矩阵\(C=\\left(c\_{i j}\\right)\),作线性变换\(x=C y\) 则有\(f=x^{\\mathrm{T}} A x=(C y)^{\\mathrm{T}} A C y=y^{\\mathrm{T}}\\left(C^{\\mathrm{T}} A C\\right) y\)

矩阵合同\(\\boldsymbol{B}=\\boldsymbol{C}^{\\mathrm{T}} \\boldsymbol{A C}\)

设 A 和 B 是 \(n\) 阶矩阵,若有可逆矩阵 \(\\boldsymbol{C},\) 使 \(\\boldsymbol{B}=\\boldsymbol{C}^{\\mathrm{T}} \\boldsymbol{A C}\),则称矩阵A 与 \(\\boldsymbol{B}\) 合同. (注意:这里并没有要求A与B为对称矩阵,则矩阵A与B不一定可以作为二次型的矩阵)

事实上,矩阵合同一般应用于二次型: 若矩阵A 与\(B\)合同,且A为对称矩阵,则矩阵A可认为是二次型f的矩阵, 矩阵A与B合同指明了各自对应二次型f到g作的线性变换是\(x=C y\),即\(f=f(x)=f(Cy)=g(y)\)

矩阵合同的性质

反身性对称性传递性

矩阵A与A合同

矩阵A与B合同\(\\Rightarrow\)矩阵B与A合同

矩阵A与B合同,矩阵B与C合同\(\\Rightarrow\)矩阵A与C合同

\(\\boldsymbol{B}=\\boldsymbol{C}^{\\mathrm{T}} \\boldsymbol{A C}\)且A为对称阵\(\\Rightarrow\)B也是对称阵

证明 \(\\boldsymbol{B}^{\\mathrm{T}}=\\left(\\boldsymbol{C}^{\\mathrm{T}} \\boldsymbol{A} \\boldsymbol{C}\\right)^{\\mathrm{T}}=\\boldsymbol{C}^{\\mathrm{T}} \\boldsymbol{A}^{\\mathrm{T}} \\boldsymbol{C}=\\boldsymbol{C}^{\\mathrm{T}} \\boldsymbol{A} \\boldsymbol{C}=\\boldsymbol{B}\) 即B也是对称阵

\(\\boldsymbol{B}=\\boldsymbol{C}^{\\mathrm{T}} \\boldsymbol{A C}\)\(\\Rightarrow\)\(R(A) = R(B)\)

证明 C是可逆矩阵,则\(C^T\)也是可逆矩阵, 对A作初等变换\(\\boldsymbol{C}^{\\mathrm{T}} \\boldsymbol{A C}=\\boldsymbol{B}\)不改变矩阵的秩, 则\(R(A) = R(B)\)

\(\\boldsymbol{B}=\\boldsymbol{C}^{\\mathrm{T}} \\boldsymbol{A C}\)且A与B是实对称阵\(\\Rightarrow\)对应二次型的正负惯性指数分别相同

证明(参考:https://www.jianshu.com/p/0ffe6ef97844) 充分性: 设X,Y是两个实对称矩阵,设他们有相同的惯性指数,则X、Y有相同的规范式A,即存在可逆矩阵C、P使得C’XC=A、P’YP=A即(P^-1)‘C’XC(P-1)=[C(P-1)]’X[(p^-1)C]=Y,所以X、Y合同. 必要性: 设X,Y是两个合同的实对称矩阵,即C’XC=Y;有Y与其规范式A合同,即P’YP=A. 所以P’(C’XC)P=A,即(CP)’X(CP)=A,此即表示X也合同于规范式A.所以X、Y有相同的规范式,即有相同的正负惯性指数.

这里涉及到二次型的正负惯性指数概念,以及惯性定理,详见后面惯性定理

二次型作线性变换\(\\Rightarrow\)原二次型的矩阵与现二次型的矩阵合同

\(x^T A x\)经线性变换\(x=Cy\) (C可逆时) 有\(x^T A x = y^T (C^T A C) y = y^T B y\) 其中二次型的矩阵A与B满足\(C^T A C = B\)且C可逆, 即A与B合同

二次型化为标准型

要使二次型 \(f\) 经可逆变换 \(x=C y\) 变成标准形, 即\(f=\\boldsymbol{x^{\\mathrm{T}} A x}=\\boldsymbol{y}^{\\mathrm{T}} \\boldsymbol{C}^{\\mathrm{T}} \\boldsymbol{A C y}=k\_{1} y\_{1}^{2}+k\_{2} y\_{2}^{2}+\\cdots+k\_{n} y\_{n}^{2}\) \(=\\boldsymbol{y}^{\\mathrm{T}} \\Lambda \\boldsymbol{ y}\)

(矩阵合同对角化/正交变换对角化/对称矩阵对角化)使对应二次型化为标准型

从从二次型的矩阵的角度看,二次型化为标准型的过程对应矩阵\(\\boldsymbol{C}^{\\mathrm{T}} \\boldsymbol{A C}=\\boldsymbol{\\Lambda}\), 问题转化为寻找可逆矩阵\(C\),使矩阵\(\\boldsymbol{C}^{\\mathrm{T}} \\boldsymbol{A C}=\\boldsymbol{\\Lambda}\), 即矩阵的合同对角化问题.

定理:任意二次型\(f=\\boldsymbol{x^{\\mathrm{T}} A x},\\left(\\mathbf{A}^{\\mathrm{T}}=\\mathbf{A}\\right)\),总能找到正交变换\(x=P y\)使\(f\)化为标准型\(f=\\boldsymbol{y^{\\mathrm{T}} \\Lambda y}\)\(=\\lambda\_{1} y\_{1}^{2}+\\lambda\_{2} y\_{2}^{2}+\\cdots+\\lambda\_{n} y\_{n}^{2}\)

证明: 任意二次型的矩阵A是对称阵, 由对称阵的性质:[A是对称阵\(\\Rightarrow\)存在正交矩阵P,使得\(P^{-1} A P=P^{T} A P=\\Lambda\)](#A是对称阵\(\\Rightarrow\)存在正交矩阵P,使得\(P^{-1} A P=P^{T} A P=\\Lambda\)) 则必存在正交矩阵存在正交矩阵P,使得\(P^{-1} A P=P^{T} A P=\\Lambda\) 即A必可合同对角化, 则二次型\(f=\\boldsymbol{x^{\\mathrm{T}} A x}\),总能找到正交变换\(x=P y\)使\(f\)化为标准型\(f=\\boldsymbol{y^{\\mathrm{T}} \\Lambda y}\)\(=\\lambda\_{1} y\_{1}^{2}+\\lambda\_{2} y\_{2}^{2}+\\cdots+\\lambda\_{n} y\_{n}^{2}\)

推论:任意二次型\(f=\\boldsymbol{x^{\\mathrm{T}} A x},\\left(\\mathbf{A}^{\\mathrm{T}}=\\mathbf{A}\\right)\),总能找到正交变换\(x=C z\)使\(f(Cz)\)为规范型

证明: 首先,根据定理:[任意二次型\(f=\\boldsymbol{x^{\\mathrm{T}} A x},\\left(\\mathbf{A}^{\\mathrm{T}}=\\mathbf{A}\\right)\),总能找到正交变换\(x=P y\)使\(f\)化为标准型\(f(Py)=\\boldsymbol{y^{\\mathrm{T}} \\Lambda y}\)](#定理:任意二次型\(f=\\boldsymbol{x^{\\mathrm{T}} A x},\\left(\\mathbf{A}^{\\mathrm{T}}=\\mathbf{A}\\right)\),总能找到正交变换\(x=P y\)使\(f\)化为标准型\(f=\\boldsymbol{y^{\\mathrm{T}} \\Lambda y}\)\(=\\lambda\_{1} y\_{1}^{2}+\\lambda\_{2} y\_{2}^{2}+\\cdots+\\lambda\_{n} y\_{n}^{2}\)) 即二次型先正交变换成标准型:\(f(\\boldsymbol{P y})=\\boldsymbol{y}^{\\mathrm{T}} \\boldsymbol{\\Lambda} \\boldsymbol{y}=\\lambda\_{1} y\_{1}^{2}+\\cdots+\\lambda\_{n} y\_{n}^{2}\) 设二次型\(f\)的秩为r,即\(\\lambda\_1,\\lambda\_2,\\cdots,\\lambda\_n\)中有r个非零值, 不妨设\(\\lambda\_{1}, \\cdots, \\lambda\_{r}\)不等于0,\(\\lambda\_{r+1}=\\cdots=\\lambda\_{n}=0\) 取一个特殊矩阵: \(\\boldsymbol{K}=\\left(\\begin{array}{cccc}k\_{1} \& \& \& \\ \& k\_{2} \& \& \\ \& \& \\ddots \& \\ \& \& \& k\_{n}\\end{array}\\right)\),其中\(k\_{i}=\\left{\\begin{array}{cc}\\frac{1}{\\sqrt{| \\lambda\_{i}|}},\& i \\leqslant r \\ 1,\&i \> r\\end{array}\\right.\) 则K可逆, 作线性变换\(y=K z\), \(f(\\boldsymbol{P y})=f(P K z)=z^{\\mathrm{T}} K^{\\mathrm{T}} P^{\\mathrm{T}} A P K z=z^{\\mathrm{T}} K^{\\mathrm{T}} \\Lambda K z=z^{\\mathrm{T}} \\Lambda\_2 z\) 其中\(\\Lambda\_2 = \\boldsymbol{K}^{\\mathrm{T}} \\boldsymbol{\\Lambda K}=\\operatorname{diag}\\left(\\frac{\\lambda\_{1}}{\\left|\\lambda\_{1}\\right|}, \\cdots, \\frac{\\lambda\_{r}}{\\mid \\lambda\_{r}\\mid}, 0, \\cdots, 0\\right)\) 即通过线性变换\(x=PKz=Cz\),可将任意二次型\(f=\\boldsymbol{x^{\\mathrm{T}} A x},\\left(\\mathbf{A}^{\\mathrm{T}}=\\mathbf{A}\\right)\),变为规范型, 且注意到P是正交矩阵,\(C=PK\)仍是正交矩阵.

矩阵合同对角化/矩阵正交对角化/对称矩阵对角化步骤

由于二次型的矩阵是对称矩阵, 则寻找可逆矩阵\(C\),使矩阵\(\\boldsymbol{C}^{\\mathrm{T}} \\boldsymbol{A C}=\\boldsymbol{\\Lambda}\)的步骤就是对称矩阵的正交对角化步骤

正交变换好处是不改变几何形状(参见[正交变换的性质](#设y = Px 为正交变换,则\(|y|=|x|\)))

配方法化二次型为标准型

如果不考虑几何形状的的改变,除了正交变换法, 也可以使用配方法来将二次型变换为标准型

注意:有多种方法可以把二次型转换为标准型,对应有多种可逆的线性变换

拉格朗日配方法

若二次型中含\(x\_1\)的平方项, 先将含\(x\_1\)的所有项(包含非平方项)归并起来,配方. 若二次型中含\(x\_2\)的平方项, 将剩余项中含\(x\_2\)的所有项(包含非平方项)归并起来,配方. … 作线性变换: 将配方之后的平方项内的一次项之和设为为\(y\_1,y\_2,…\), 令未出现的\(x\_i\)项设为\(y\_j\),

eg: 对于二次型\(f=x\_{1}^{2}+2 x\_{2}^{2}+5 x\_{3}^{2}+2 x\_{1} x\_{2}+2 x\_{1} x\_{3}+6 x\_{2} x\_{3}\) 其中含\(x\_1\)的平方项,可先将含\(x\_1\)的所有项归并起来,配方: \(f=\\left(x\_{1}+x\_{2}+x\_{3}\\right)^{2}-x\_{2}^{2}-x\_{3}^{2}-2 x\_{2} x\_{3}+2 x\_{2}^{2}+5 x\_{3}^{2}+6 x\_{2} x\_{3}\) 剩余项中含\(x\_2\)的平方项,将剩余项中含\(x\_2\)的所有项归并起来,配方: \(f=\\left(x\_{1}+x\_{2}+x\_{3}\\right)^{2}+\\left(x\_{2}+2 x\_{3}\\right)^{2}\) 则作线性变换: \(\\left{\\begin{array}{ll}y\_{1}=x\_{1}+\&x\_{2}+\&x\_{3} \\ y\_{2}= \& x\_{2}+\&2 x\_{3} \\ y\_{3}=\& \& x\_{3}\\end{array}\\right.\) 就将二次型化为了标准型

若二次型中完全不含\(x\_i\)的平方项, 可先作一次简单的线性变换,使新的二次型中出现平方项, 然后重新用上面的方法配方

eg: 对于二次型\(f=2 x\_{1} x\_{2}+2 x\_{1} x\_{3}-6 x\_{2} x\_{3}\) 其完全不含平方项,无法配方, 可以先作一次简单的线性变换: \(\\left{\\begin{array}{l}x\_{1}=y\_{1}+y\_{2} \\ x\_{2}=y\_{1}-y\_{2} \\ x\_{3}=y\_{3}\\end{array}\\right.\) 二次型化为:\(f=2 y\_{1}^{2}-2 y\_{2}^{2}-4 y\_{1} y\_{3}+8 y\_{2} y\_{3}\) 其中出现了平方项,可以配方, 配方结果为:\(f=2\\left(y\_{1}-y\_{3}\\right)^{2}-2\\left(y\_{2}-2 y\_{3}\\right)^{2}+6 y\_{3}^{2}\) 作线性变换: \(\\left{\\begin{array}{l}z\_{1}=\\sqrt{2}\\left(y\_{1}-y\_{3}\\right) \\ z\_{2}=\\sqrt{2}\\left(y\_{2}-2 y\_{3}\\right) \\ z\_{3}=\\sqrt{6} y\_{3}\\end{array}\\right.\) 可得规范型:\(f=z\_{1}^{2}-z\_{2}^{2}+z\_{3}^{2}\)

正定二次型

二次型可以化为标准型,显然对应的线性变换不唯一;但是标准型中所含的项数是一定的. 在线性变换为实变换时,不同标准型中正系数的个数也是一定的(从而负系数的个数也是一定的). 此规律总结为如下惯性定理.

惯性定理

设有二次型 \(f=x^{\\mathrm{T}} A x,\) 它的秩为 \(r\), 有两个可逆变换\(x=C y\)\(x=P z\) 使得 \(f=k\_{1} y\_{1}^{2}+k\_{2} y\_{2}^{2}+\\cdots+k\_{r} y\_{r}^{2} \\quad\\left(k\_{i} \\neq 0\\right)\) \(f=\\lambda\_{1} z\_{1}^{2}+\\lambda\_{2} z\_{2}^{2}+\\cdots+\\lambda\_{r} z\_{r}^{2} \\quad\\left(\\lambda\_{i} \\neq 0\\right)\)\(k\_{1}, \\cdots, k\_{r}\) 中正数的个数与 \(\\lambda\_{1}, \\cdots, \\lambda\_{r}\) 中正数的个数相等

二次型的标准形中正系数的个数称为二次型的正惯性指数, 二次型的标准形中负系数的个数称为负惯性指数. 若二次型 f 的正惯性指数为 p,秩为 r,则 \(f\) 的规范形便可确定为\(f=y\_{1}^{2}+\\cdots+y\_{p}^{2}-y\_{p+1}^{2}-\\cdots-y\_{r}^{2}\)

正定二次型

设有二次型 \(f(x)=x^{\\mathrm{T}} A x,\) 如果对任何 \(x \\neq 0\),都有 \(f(x)\>0\) (显然\(f(0)=0\)),称**\(f\) 为正定二次型**,并称对称阵 A 是正定的; 如果对任何 \(x \\neq 0\),都有 \(f(x)\<0\) (显然\(f(0)=0\)),称**\(f\) 为负定二次型**,并称对称阵 A 是负定的;

二次型正定的充分必要条件

\(n\) 元二次型 \(f=x^{\\mathrm{T}} A x\) 为正定的\(\\Leftrightarrow\)它的标准型的n个系数全为正\(\\Leftrightarrow\)它的规范型的n个系数都为1\(\\Leftrightarrow\)它的正惯性系数等于n

证明 设存在可逆变换\(x=C y\) 使\(f(x)=f(C y)=\\sum\_{i=1}^{n} k\_{i} y\_{i}^{2}\)

充分性: 设 \(k\_{i}\>0(i=1, \\cdots, n) .\) 任给 \(x \\neq 0,\)\(y=C^{-1} x \\neq 0,\)\(f(x)=\\sum\_{i=1}^{n} k\_{i} y\_{i}^{2}\>0\)

必要性: 用反证法. 假设$ k_s \leqslant 0$, 则当 \(y = e\_s\) (单位坐标向置)时, \(f(x)=f(Cy)=f\\left(C e\_{s}\\right)=k\_{t} \\leqslant 0\) 这与二次型正定矛盾.故\(k\_s\>0\)\(k\_1,\\cdots,k\_n\)都可用反证法证明大于0

推论:对称阵A正定\(\\Leftrightarrow\)A的特征值全为正

证明

用正交变换法对角化矩阵A,即\(P^{-1} A P=P^{T} A P=\\Lambda\), 则\(\\Lambda\)是它的标准型的矩阵,且A与\(\\Lambda\)相似.

根据二次型正定充要条件:[\(n\) 元二次型 \(f=x^{\\mathrm{T}} A x\) 为正定的\(\\Leftrightarrow\)它的标准型的n个系数全为正\(\\Leftrightarrow\)它的规范型的n个系数都为1\(\\Leftrightarrow\)它的正惯性系数等于n](#\(n\) 元二次型 \(f=x^{\\mathrm{T}} A x\) 为正定的\(\\Leftrightarrow\)它的标准型的n个系数全为正\(\\Leftrightarrow\)它的规范型的n个系数都为1\(\\Leftrightarrow\)它的正惯性系数等于n), 对称阵A正定\(\\Leftrightarrow\)标准型的矩阵\(\\Lambda\)的n个对角线元素全为正.

根据相似矩阵的性质推论: [n阶矩阵A与对角阵\(\\Lambda\)相似\(\\Rightarrow\)\(\\Lambda\)对角线上的值是\(\\boldsymbol{A}\)\(n\) 个特征值](#推论: n阶矩阵A与对角阵\(\\Lambda\)相似\(\\Rightarrow\)\(\\Lambda\)对角线上的值是\(\\boldsymbol{A}\)\(n\) 个特征值),(实际上,从矩阵相似对角化过程来看,此性质应当是充要的) A与\(\\Lambda\)相似\(\\Leftrightarrow\)A与\(\\Lambda\)特征值相同

赫尔维茨定理:对称阵A正定\(\\Leftrightarrow\)A 的各阶主子式都为正

对称阵A正定 \(\\Leftrightarrow\)A 的各阶主子式都为正, 即\(a\_{11}\>0\),\(\\left|\\begin{array}{ll}a\_{11} \& a\_{12} \\ a\_{21} \& a\_{22}\\end{array}\\right|\>0\),\(\\cdots\),\(\\left|\\begin{array}{ccc}a\_{11} \& \\cdots \& a\_{1 n} \\ \\vdots \& \& \\vdots \\ a\_{n 1} \& \\cdots \& a\_{n n}\\end{array}\\right|\>0\)

对称阵A负定 \(\\Leftrightarrow\)A的奇数阶主子式为负,而偶数阶主子式为正, 即\((-1)^{r}\\left|\\begin{array}{ccc}a\_{11} \& \\cdots \& a\_{1 r} \\ \\vdots \& \& \\vdots \\ a\_{r 1} \& \\cdots \& a\_{r r}\\end{array}\\right|\>0(r=1,2, \\cdots, n)\)


评论

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注