高等代数 - 标准形
zhiyangfan
·
2025-05-20 18:35:54
·
个人记录
在高等代数笔记发了一遍,由于 wwli 的理解方式太深刻了,所以再单独发一遍。
什么是标准形
考虑矩阵之间的等价关系共轭,称 \mathbf A,\mathbf B\in\mathrm M_{n\times n}(F) 共轭,当且仅当存在可逆矩阵 \mathbf P 使得:
\mathbf A=\mathbf P^{-1}\mathbf B\mathbf P
也可以理解为在换基后两个矩阵相等,或对应的 F[X] 模同构。
判断矩阵共轭是一个非常重要的问题。一个自然的想法是找到每个共轭等价类的代表元,作为所谓的“标准”,这样只需判断矩阵共轭到的“标准”是否相同即可。这个“标准”的矩阵就称为标准形。
比如对于可对角化矩阵(回忆到可对角化当且仅当极小多项式分裂无重根),对应到的对角矩阵即为一种标准形。但由于并非所有矩阵都可对角化,我们需要找到一些更普适的方法。
从模论的结构定理出发
回忆到模论中的结构定理,将模按照挠元直和分解:
设 R 为主理想环,M 为有限生成 R 模,则有同构:
M \simeq R/I_1\oplus\cdots R/I_k\oplus E
其中
且分解具有唯一性。
由于 F[X] 为主理想环,所以我们可以将上述结论直接套到 F[X] 模上,尝试找到对应的矩阵版本。根据上述形式,我们来考察 M/I 对应的矩阵 \bf A。其中不妨设 I=(f),f\in F[X]\backslash F,定义 n 为 \deg f=\dim M/I。考虑 M/I 作为 F 向量空间的有序基,可以取为:
1+(f),X+(f),\cdots,X^{n-1}+(f)
那么该模对应的线性映射 T 的效果显然是 T(g+(f))=Xg+(f),那想要知道对应的 \bf A 是什么效果只需要考察它在上述有序基的表现即可。唯一特殊的是:
T(X^{n-1}+(f))=X^n+(f)=-c_0-c_1X-\cdots-c_{n-1}X^{n-1}+(f)
那么自然有:
设 f=c_0+\cdots+c_{n-1}X^{n-1}+X^n\in F[X],其中 n\in\mathbb{Z}_{\ge 1}。对于 F[X] 模 F[X]/(f) 取其有序基为上述有序基,则其对应的 n\times n 矩阵是 f 的友矩阵:
\mathbf{C}_f=
\begin{pmatrix}
0&0&\cdots&0&-c_0\\
1&0&\cdots&0&-c_1\\
0&1&\cdots&0&-c_2\\
\vdots&&\ddots&&\vdots\\
0&0&\cdots&1&-c_{n-1}
\end{pmatrix}
那么套入结构定理即:
设 n\in\mathbb{Z}_{\ge 1},而 \mathbf{A}\in\mathrm{M}_{n\times n}(F),存在唯一一列前后整除的非常数首一多项式:
f_1|\cdots|f_k,f_i\in F[X]
使得 \sum_{i=1}^k \deg f_i=n 且 \bf A 共轭于分块对角矩阵:
\mathrm{diag}(\mathbf{C}_{f_1},\cdots,\mathbf{C}_{f_k})
该矩阵称为 \bf A 的有理标准形,f_1,\cdots,f_k 称为 \bf A 的不变因子。
这里没有自由模是因为 \bf A 是有限维的,但是 F[X] 是无限维的。
且不难验证:
可以发现,这里给出了 Cayley-Hamilton 定理的证明,因为该论证自然说明了 \mathrm{Min}_{\bf A}|\mathrm{Char}_{\bf A},且只依赖于模论的结构定理。
根据结构定理的另一种基于素元分解的写法,我们还可以把上述形式改写为:
设 \mathbf A\in\mathrm M_{n\times n}(F),取 \mathrm{Min}_{\bf A} 的不可约分解 p_1^{e_1}\cdots p_h^{e_h},其中 p_1,\cdots,p_h 是相异的不可约首一多项式,则 \bf A 共轭于形如 \mathrm{diag}(\mathbf A_1,\cdots,\mathbf A_h) 的分块对角矩阵,其中对每个 1\le j\le h 都有:
\mathbf A_j=\mathrm{diag}\left(\mathbf C_{p_j}^{b_{1,j}},\cdots,\mathbf C_{p_j}^{b_{r_j,j}}\right),r_j\in\mathbb Z_{\ge 1},1\le b_{1,j}\le \cdots\le b_{r_j,j}
不难发现 \mathrm{Char}_{\mathbf A_j}=p_j^{b_{1,j}+\cdots} 正是 \mathrm{Char}_{\bf A} 中被 p_j 整除的部分。
之所以称为有理,是与 Jordan 标准形作为对比。Jordan 标准形要求矩阵特征多项式分裂,而有理标准形无需。所以后者不需要将 \mathbb Q 扩域为 \mathbb C 也能操作。
如何计算有理标准形呢?考虑引理:
设 E 为秩 n 自由 F[X] 模,N 为子模。任选 E 的基 e_1,\cdots,e_n 和 N 的生成元 x_1,\cdots,x_m,取 \mathbf A\in\mathrm{M}_{n\times m}(F[X]),其中
\begin{pmatrix}x_1&\cdots&x_m\end{pmatrix}=\begin{pmatrix}e_1&\cdots&e_1\end{pmatrix}\bf A
这里 x_j,e_i 虽然不是列向量,但可以理解为:
x_j=\sum_{i=1}^n a_{ij}e_i
存在可逆矩阵 \mathbf P\in\mathrm{M}_{m\times m},\mathbf Q\in\mathrm{M}_{n\times n} 使得:
\mathbf{A}=\mathbf{Q}\begin{pmatrix}d_1&&\\\\&d_2&\\\\&&\ddots\end{pmatrix}\bf P
且 d_1|d_2|\cdots,则:
E/N\simeq\bigoplus_{i=1}^n F[X]/(d_i)
事实上,取 \begin{pmatrix}f_1&\cdots&f_n\end{pmatrix}=\begin{pmatrix}e_1&\cdots&e_1\end{pmatrix}\bf Q,那么 N=\oplus_{i=1}^n Rd_if_i。只需将 \bf P 除到右边即可,且注意到这并不改变右边依然生成 N。之后代入直和取商即得同构。
那我们考虑取 E=F[X]^{\oplus n},考察同态:
\begin{aligned}
\varphi:&F[X]^{\oplus n}\rightarrow V\\
&\sum_{i=1}^n r_ie_i\mapsto\sum_{i=1}^n r_i(T)v_i
\end{aligned}
其中 V,T 是 F[X] 对应的二元组,显然 \varphi 满。考虑其核,可以证明其核为:
\langle x_1,\cdots,x_n\rangle
其中:
x_j=Xe_j-\sum_{i=1}^n a_{ij}e_i
所以我们有同构:
V\simeq F[X]^{\oplus n}/\mathrm{ker}(\varphi)\simeq \bigoplus_{i=1}^n F[X]/(d_i)
考虑最后一项由上述引理确定,只需考虑对应的转化矩阵。事实上取 X\cdot \mathbf 1_{n\times n}-\bf A 即可,其中 \bf A 是 T 对应的矩阵。不难验证:
\begin{pmatrix}x_1&\cdots&x_n\end{pmatrix}=\begin{pmatrix}e_1&\cdots&e_1\end{pmatrix}(X\cdot \mathbf 1_{n\times n}-\bf A)
那么我们将 X\cdot \mathbf 1_{n\times n}-\bf A 消元得到对角矩阵后得到的 d_i 即为上述同构中对应的 d_i,从而就是 T 有理标准形中的不变因子!
对于任意交换环 R 定义相抵:设 \mathbf{L,M}\in \mathrm{M}_{m\times n}(R),若存在可逆矩阵 \mathbf{P}\in \mathrm{M}_{n\times n}(R),\mathbf{Q}\in \mathrm{M}_{m\times m}(R) 使得 \mathbf{L=QMP},则称 \bf L,M 相抵。那么对所有 \mathbf{ A,B}\in\mathrm M_{n\times n}(F) 下列称述等价:
相抵只需进行初等行列变换消元即可!所以我们成功把矩阵共轭问题转化为了消元问题。
特殊矩阵的有理标准形
考虑幂零矩阵:
设 R 为环,r\in R,若存在 d\ge 1 使得 r^d=0_R,则称 r 幂零,条件中最小可能的 d 称为 r 的幂零指数。
设 \dim V=n\in\mathbb Z_{\ge 1},而 T\in\mathrm{End}(V),则以下陈述相互等价:
存在 k\in\mathbb Z_{\ge 1},使得 \mathrm{Min}_T=X^k。
V=V_{[0]}
其中 k 为 T 的幂零指数。
那我们考虑幂零矩阵的有理标准形,对应的不变因子一定是 X^k,友矩阵为:
\mathbf{C}_{X^k}=\begin{pmatrix}
0&0&\cdots&0\\
1&0&\ddots&\vdots\\
0&\ddots&\ddots&0\\
0&\cdots&1&0
\end{pmatrix}
进一步地,我们考虑特征多项式分裂的矩阵,那么不变因子的形式一定形如 (X-\lambda)^k,那么考虑将上述矩阵平移 \lambda 即得:
\mathbf{C}_{\lambda}=\begin{pmatrix}
\lambda&0&\cdots&0\\
1&\lambda&\ddots&\vdots\\
0&\ddots&\ddots&0\\
0&\cdots&1&\lambda
\end{pmatrix}
因为有:
\mathrm{Min}_{\mathbf{C}_{X^k}}=\mathrm{Char}_{\mathbf{C}_{X^k}}=X^k
通过简单的平移可知:
\mathrm{Min}_{\mathbf{C}_{\lambda}}=\mathrm{Char}_{\mathbf{C}_{\lambda}}=(X-\lambda)^k
由于极小多项式和特征多项式相同,所以它共轭于 (X-\lambda)^k 的友矩阵。这样,我们对于特征多项式分裂的矩阵就找到了一个新的利用上述矩阵的分块方法,称为 Jordan 标准形。
Jordan 标准形
定义 Jordan 块如下:
设 \lambda\in F,d\in\mathbb Z_{\ge 1}。则特征值为 \lambda 的 d\times d 的上三角 Jordan 块定义为以下矩阵:
\mathbf J_d(\lambda)=
\begin{pmatrix}
\lambda&1&0&\cdots&0&0\\
0&\lambda&1&\cdots&0&0\\
\vdots&&\ddots&\ddots&&0\\
\vdots&&&\ddots&\ddots&\vdots\\
0&0&\cdots&0&\lambda&1\\
0&0&\cdots&0&0&\lambda
\end{pmatrix}
\in \mathrm M_{d\times d}(F)
特征值为 \lambda 的 d\times d 下三角 Jordan 块为:
\mathbf J_d^{\text{下}}(\lambda)={}^{\rm t}\mathbf{J}_d(\lambda)
其中 \mathbf J_1(\lambda)=\mathbf J_1^{\text{下}}(\lambda)=\lambda\in F=\mathrm M_{1\times 1}(F)。
那么基于有理标准形一模一样的结论,我们有 Jordan 标准形。
设 V 为 n 为向量空间,T\in\mathrm{End}(V)。设 \mathrm{Char}_T 在 F 上分裂,记其相异根为 \lambda_1,\cdots,\lambda_m\in F。存在 V 的有序基,使得 T 表为分块对角矩阵 \mathrm{diag}(\mathbf A_1,\cdots,\mathbf A_m),其中:
\mathbf A_j=
\begin{pmatrix}
\boxed{\mathbf J_{b_{1,j}}(\lambda_j)}&&\\
&\ddots&\\
&&\boxed{\mathbf J_{b_{r_j,j}}(\lambda_j)}
\end{pmatrix}
该形式无非是
> 设 $\mathbf A\in\mathrm M_{n\times n}(F)$,取 $\mathrm{Min}_{\bf A}$ 的不可约分解 $p_1^{e_1}\cdots p_h^{e_h}$,其中 $p_1,\cdots,p_h$ 是相异的不可约首一多项式,则 $\bf A$ 共轭于形如 $\mathrm{diag}(\mathbf A_1,\cdots,\mathbf A_h)$ 的分块对角矩阵,其中对每个 $1\le j\le h$ 都有:
>
> $$
> \mathbf A_j=\mathrm{diag}\left(\mathbf C_{p_j}^{b_{1,j}},\cdots,\mathbf C_{p_j}^{b_{r_j,j}}\right),r_j\in\mathbb Z_{\ge 1},1\le b_{1,j}\le \cdots\le b_{r_j,j}
> $$
有理标准形把 $\mathbf C$ 共轭为 $\mathbf J$ 的结果。
对于 Jordan 标准形的计算,因为它无外乎是有理标准形套皮,所以计算有理标准形的方法自然也可以应用于 Jordan 标准形,求出不变因子即可。但我们也可以通过计算秩来确定。以下只给出幂零矩阵的情况,非幂零矩阵只需对每个特征值考虑,平移为幂零矩阵的情况即可。(即将 $T$ 改为 $T-\lambda$)
设 $V$ 是 $n$ 维 $F$ 向量空间,$T\in\mathrm{End}(V)$ 幂零,则:
1. 在 $T$ 的 Jordan 标准形中,Jordan 块的总数为 $n-\mathrm{rk}T$。
1. 对于每个 $d\ge 1$,标准形中的 $d\times d$ Jordan 块的个数 $N(d)$ 满足:
$$
N(d)=\mathrm{rk}(T^{d+1})+\mathrm{rk}(T^{d-1})-2\mathrm{rk}(T^d)
$$
对于 (1),注意到 $\mathbf J_d(0)$ 的秩为 $d-1$,故 $\mathrm{rk}T$ 就等于 $n$ 减去 Jordan 块总数。
对于 (2),计算 $\mathbf{J}_b(0)^k$,不难发现:
$$
\mathrm{rk}(\mathbf{J}_b(0)^k)=\begin{cases}
0&k>b\\
b-k&k\le b
\end{cases}
$$
那 $d\ge 1$ 时:
$$
\mathrm{rk}(T^{d+1})-\mathrm{rk}(T^d)=\sum_{b_j\ge d+1}(b_j-d-1)-\sum_{b_j\ge d}(b_j-d)=\sum_{b_j\ge d+1}(-1)
$$
自然有:
$$
\mathrm{rk}(T^{d})-\mathrm{rk}(T^{d-1})=\sum_{b_j\ge d}(-1)
$$
相减即可。