9._延伸阅读_多项式与_线性代数

多项式与《线性代数》

在线性代数里,研究的是“线性”,整个线性代数都是围绕“向量”打转,但是如果把线性代数进一步抽象、延伸,就形成了《高等代数》,在高等代数里,增加了多项式处理。

在历史上,由于研究一元高次代数方程,很自然地就开始研究一元多项式 f(x)=a0xn+a1xn1++anf(x)=a_0 x^n+a_1 x^{n-1}+\cdots+a_n .在长时间内,是把 xx 当作一个变量来看待,f(x)f(x) 则是 xx 的函数。多项式作为一类特殊的一元函数,自然可以按函数的意义相加、相乘,而且做加法、乘法之后仍是一个多项式。它们同时又满足与整数的加法、乘法相同的运算法则。于是从代数学的观点看,全体多项式关于其加法、乘法,与有理整数环一样,也成为一个代数系统.

要从理论上从更高的观点来研究一个代数系统,我们应当舍弃那些非本质的具体的东西。如果我们研讨的是多项式由其加法、乘法运算及相应的运算法则所决定的性质,那么 xx 是不是自变量,f(x)f(x) 是否是函数在这里没有起什么作用,是应当舍弃的东西。也就是说,我们只要把 xx当作一个形式的记号来看待就可以了,在这种情况下,xx 被称作一个 "不定元",意思是说它未有任何具体的含义,仅当作界定一个多项式的记号而已。然后,定义多项式的加法与乘法运算,使其成为一个抽象的代数系统,从而成为代数学的研究对象.

多项式构成线性空间

要证明多项式构成线性空间,只要证明他们满足八大性质即可。 定义KK 是一个数域,xx 是一个不定元.下面的形式表达式

f(x)=a0+a1x+a2x2++anxn+f(x)=a_0+a_1 x+a_2 x^2+\cdots+a_n x^n+\cdots

(其中 a0,a1,a2,a_0, a_1, a_2, \cdots 属于 KK ,且仅有有限个不是 0 )称为数域 KK一个不定元 xx 的一元多项式

注意现在上述表达式中的记号"+ ","x2x^2","x3x^3",\cdots 等等都还没有加法或乘法的方幂的含义,而仅仅是一个形式的记号,所以,上面的表达式完全可以写成

f(x)=(a0,a1,a2,,an,).f(x)=\left(a_0, a_1, a_2, \cdots, a_n, \cdots\right) .

我们之所以要写成上面的样子,是因为只要我们在多项式间定义加法和乘法后,它们自然就会具有所期望的含义,这一点下面就会看到。

数域 KK 上一个不定元 xx 的多项式的全体所成的集合记做 K[x]K[x]

K[x]K[x] 内定义加法、乘法如下: 加法

f(x)=a0+a1x+a2x2+,g(x)=b0+b1x+b2x2+,\begin{aligned} & f(x)=a_0+a_1 x+a_2 x^2+\cdots, \\ & g(x)=b_0+b_1 x+b_2 x^2+\cdots, \end{aligned}

则定义

f(x)+g(x)=(a0+b0)+(a1+b1)x+(a2+b2)x2+.f(x)+g(x)=\left(a_0+b_0\right)+\left(a_1+b_1\right) x+\left(a_2+b_2\right) x^2+\cdots .

显然,f(x)+g(x)f(x)+g(x) 仍为 KK 上的一元多项式,因为 ai+bia_i+b_i 仍仅有有限个不为 0,f(x)+g(x)0, f(x)+g(x) 称为 f(x)f(x)g(x)g(x)

乘法

f(x)=a0+a1x+a2x2+,g(x)=b0+b1x+b2x2+.\begin{aligned} & f(x)=a_0+a_1 x+a_2 x^2+\cdots, \\ & g(x)=b_0+b_1 x+b_2 x^2+\cdots . \end{aligned}

ck=a0bk+a1bk1+a2bk2++akb0(k=0,1,2,).c_k=a_0 b_k+a_1 b_{k-1}+a_2 b_{k-2}+\cdots+a_k b_0 \quad(k=0,1,2, \cdots) .

现在 c0,c1,c2,c_0, c_1, c_2, \cdots 仍仅有有限个不为 0 ,定义

f(x)g(x)=c0+c1x+c2x2+,f(x) g(x)=c_0+c_1 x+c_2 x^2+\cdots,

f(x)g(x)f(x) g(x) 仍为 KK 上的一元多项式,称为 f(x)f(x)g(x)g(x)乘积

性质

容易验证,上面定义的加法、乘法满足如下运算法则: 1)加法有结合律,即

f(x)+(g(x)+h(x))=(f(x)+g(x))+h(x);f(x)+(g(x)+h(x))=(f(x)+g(x))+h(x) ;

2)2)0(x)=0+0x+0x2+0(x)=0+0 x+0 x^2+\cdots ,则对任给的 f(x)K[x]f(x) \in K[x] ,有 f(x)+0(x)=f(x),0(x)f(x)+0(x)=f(x), 0(x) 称为零多项式,简记为 0 ;

3)任给 f(x)=a0+a1x+a2x2+f(x)=a_0+a_1 x+a_2 x^2+\cdots ,令 f(x)=a0+(a1)x+(a2)x2+-f(x)=-a_0+\left(-a_1\right) x +\left(-a_2\right) x^2+\cdots ,则 f(x)+(f(x))=0f(x)+(-f(x))=04)4) 加法有交换律,即 f(x)+g(x)=g(x)+f(x)f(x)+g(x)=g(x)+f(x) ; 5)乘法有结合律,即 f(x)(g(x)h(x))=(f(x)g(x))h(x)f(x)(g(x) h(x))=(f(x) g(x)) h(x) ; 6)有 I(x)=1+0x+0x2+I(x)=1+0 x+0 x^2+\cdots ,使 f(x)K[x]\forall f(x) \in K[x] ,有 f(x)I(x)=f(x),I(x)f(x) I(x) =f(x), I(x) 简记为 1 ;

7)乘法有交换律,即 f(x)g(x)=g(x)f(x)f(x) g(x)=g(x) f(x) ; 8)加法与乘法有分配律,即 f(x)(g(x)+h(x))=f(x)g(x)+f(x)h(x)f(x)(g(x)+h(x))=f(x) g(x)+f(x) h(x)

K[x]K[x] 连同上面定义的加法与乘法,称为数域 KK 上的一元多项式环

应当指出,如果把上面的数域 KK 换成有 pppp 为素数)个元素的有限域 Fp\mathbb{F}_p ,那么前面的定义仍有效,所得的代数系统称为 Fp\mathbb{F}_p 上的一元多项式环,记做 Fp[x]\mathbb{F}_p[x]

下面约定,在多项式 f(x)f(x) 的形式表达式中, 0xi0 x^i 可略去不写, 1xi1 x^i 简写为 xix^i .于是多项式可写为

f(x)=a0+a1x++anxnf(x)=a_0+a_1 x+\cdots+a_n x^n

其中 a0,a1,,anK,an0.a0,a1,,ana_0, a_1, \cdots, a_n \in K, a_n \neq 0 . a_0, a_1, \cdots, a_n 称为 f(x)f(x)系数ana_n首项系数a0a_0常数项nn 称为 f(x)f(x)次数,记做 degf(x)=n\operatorname{deg} f(x)=ndegf=n.akxk\operatorname{deg} f =n . a_k x^k 称为一个单项式,它是最简单的一类多项式。

按多项式加法的定义,现在 f(x)f(x)n+1n+1 个单项式 a0,a1x,a2x2,,anxna_0, a_1 x, a_2 x^2, \cdots, a_n x^n 连加的结果,于是 f(x)f(x) 表达式中的记号"+"现在具有多项式加法的含义。又易见 xmxn=xm+nx^m \cdot x^n=x^{m+n} .于是 xkx^kkk 个单项式 xx 的连乘积:xk=xxxx^k=x x^{\cdots} x . 于是 f(x)f(x) 表达式中的记号 x2,x3,,xnx^2, x^3, \cdots, x^n 现在都具有方幂的含义,而且满足指数律:xmxn=xm+n,(xm)n=xmnx^m \cdot x^n=x^{m+n},\left(x^m\right)^n=x^{m n} 。另外,我们约定 x0=1(xx^0=1(x的负方幂没有定义).

我们使用 degf=n\operatorname{deg} f =n 表示多项式的最高次数。

注意零多项式次数没有定义.但有时为了方便,也可认为零多项式的次数是 -\infty

另外,我们把 f(x)+(g(x))f(x)+(-g(x)) 写成 f(x)g(x)f(x)-g(x) ,称为 K[x]K[x] 内的减法.下面两条简单的事实也请读者注意.

1)两个多项式

f(x)=a0+a1x+a2x2+,g(x)=b0+b1x+b2x2+\begin{aligned} & f(x)=a_0+a_1 x+a_2 x^2+\cdots, \\ & g(x)=b_0+b_1 x+b_2 x^2+\cdots \end{aligned}

相等是指 ai=bi(i=0,1,2,)a_i=b_i(i=0,1,2, \cdots)

2)若 f(x)0,g(x)0f(x) \neq 0, g(x) \neq 0 ,则

deg(f(x)g(x))=degf(x)+degg(x).\operatorname{deg}(f(x) g(x))=\operatorname{deg} f(x)+\operatorname{deg} g(x) .

即两个非零多项式相乘时,其次数相加。设 f(x)f(x) 的首项系数为 ana_ng(x)g(x) 的首项系数为 bmb_m ,则按乘法定义可知 f(x)g(x)f(x) g(x) 的首项系数为 anbma_n b_m 。如果一个多项式首项系数为 1 ,则称为首一多项式。因此,两个首一多项式的乘积仍为首一多项式。

从性质(2)立即推出:当 f(x),g(x)f(x), g(x) 都非零时,f(x)g(x)0f(x) g(x) \neq 0 。因 此,在 K[x]K[x] 内有消去律,即由 f(x)g(x)=f(x)h(x),f(x)0f(x) g(x)=f(x) h(x), f(x) \neq 0 ,有 f(x)(g(x)h(x))=0f(x)(g(x)-h(x))=0 ,则必有 g(x)=h(x)g(x)=h(x)

多项式的基与维度

既然是一个向量空间,自然就有基和维度的概念。

自然的基{1,x,x2,x3,} \{1, x, x^2, x^3, \dots\} 构成了这个空间的一组基。这组基是无限维的,因为你有无穷多个基向量(x(x的幂次可以无限高)。

有限维子空间:如果我们只考虑所有次数不超过 (n) 的多项式,它们就构成了一个 n+1n+1 维的线性子空间。其一组自然的基就是 {1,x,x2,,xn}\{1, x, x^2, \dots, x^n\}。任何一个次数不超过nn 的多项式,都可以唯一地表示为这组基的线性组合,组合的系数就是这个多项式的各项系数。

这就把多项式系数和向量的坐标联系起来了! 多项式 p(x)=a0+a1x+a2x2++anxnp(x) = a_0 + a_1x + a_2x^2 + \dots + a_nx^n 在这个基下的坐标就是 (a0,a1,a2,,an)T(a_0, a_1, a_2, \dots, a_n)^T

嗯,有基、有维度、有坐标,这就是向量空间。

有什么用?线性变换与矩阵表示

当我们把多项式看作向量后,作用于多项式的操作就可以看作是线性变换

一个非常重要的线性变换是求导运算 DD,定义为 D(p(x))=p(x)D(p(x)) = p‘(x)

  • 线性验证

  • D(p(x)+q(x))=p(x)+q(x)=D(p(x))+D(q(x))D(p(x) + q(x)) = p'(x) + q'(x) = D(p(x)) + D(q(x))

  • D(cp(x))=cp(x)=cD(p(x))D(c \cdot p(x)) = c \cdot p'(x) = c \cdot D(p(x))

  • 结论:求导算子 DD 是一个线性变换!

既然是线性变换,我们就可以为它选取一组基,并写出它的矩阵。让我们在次数不超过2的多项式子空间 P2P_2 (基为 {1,x,x2}\{1, x, x^2\})中来看:

  • D(1)=0=01+0x+0x2D(1) = 0 = 0 \cdot 1 + 0 \cdot x + 0 \cdot x^2

  • D(x)=1=11+0x+0x2D(x) = 1 = 1 \cdot 1 + 0 \cdot x + 0 \cdot x^2

  • D(x2)=2x=01+2x+0x2D(x^2) = 2x = 0 \cdot 1 + 2 \cdot x + 0 \cdot x^2

那么,求导算子 DD 在这组基下的矩阵就是:

A=[010002000]A = \begin{bmatrix} 0 & 1 & 0 \\ 0 & 0 & 2 \\ 0 & 0 & 0 \end{bmatrix}

现在,对一个多项式 p(x)=a+bx+cx2p(x) = a + bx + cx^2(其坐标向量为 [abc]\begin{bmatrix} a \\ b \\ c \end{bmatrix})求导,就等价于用矩阵 AA 去乘它的坐标向量:

A[abc]=[b2c0]A \begin{bmatrix} a \\ b \\ c \end{bmatrix} = \begin{bmatrix} b \\ 2c \\ 0 \end{bmatrix}

这个结果向量 [b2c0]\begin{bmatrix} b \\ 2c \\ 0 \end{bmatrix} 对应的正是导数 p(x)=b+2cxp'(x) = b + 2cx

意义:我们将一个分析运算(求导)完全转化为了一个代数运算(矩阵乘法)。

无处不在的伴侣矩阵

这是多项式与线性代数勾搭最富成果的领域之一。

问题:如何找到一个矩阵,它的特征多项式恰好是某个给定的多项式?

答案:伴侣矩阵。

对于首一多项式 p(x)=xn+an1xn1++a1x+a0p(x) = x^n + a_{n-1}x^{n-1} + \dots + a_1x + a_0,可以构造一个 n×nn \times n 的矩阵,称为 p(x)p(x)伴侣矩阵

C(p)=[000a0100a1010a2001an1]C(p) = \begin{bmatrix} 0 & 0 & \dots & 0 & -a_0 \\ 1 & 0 & \dots & 0 & -a_1 \\ 0 & 1 & \dots & 0 & -a_2 \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ 0 & 0 & \dots & 1 & -a_{n-1} \end{bmatrix}

可以证明,矩阵 C(p)C(p) 的特征多项式正好就是 p(x)p(x)

在特征值里,会更有体会。

从代数角度研究质数

另外一个方面,对于

f(x)=a0+a1x+a2x2++anxn+f(x)=a_0+a_1 x+a_2 x^2+\cdots+a_n x^n+\cdots

如果 f(x)=0f(x)=0 则变成了多项式方程组的解,即高次方程,可以证明n次高次方程必有n个根(含重根)

而求解方程最简单的就是因此分解,假设f(x)f(x)有一个根为a,则f(x)f(x)必能分解为

f(x)=(xa)g(x)f(x)=(x-a)g(x)

的形式,这相当于把高次方程转换为了低次方程。

重因式(重根)

在高次方程解里,重根是一个比较棘手的问题,或者你在求解矩阵特征值会能理解。 让我们看一个例子:

f(x)=(x2)3(x+1)f(x) = (x - 2)³ * (x + 1) 这个多项式被分解成了两个“质因式”:

  1. (x2)(x - 2):它出现了 3 次。所以,(x2)(x - 2) 就是 f(x)f(x) 的一个 三重因式

  2. (x+1)(x + 1):它只出现了 1 次。所以,(x+1)(x + 1)f(x)f(x) 的一个 单因式

对应的: 方程 f(x)=0f(x) = 0x=2x = 2 处有一个 三重根(重根)。 在 x=1x = -1 处有一个 单根

图像上的直观感受

重因式(重根)会显著影响函数图像的几何形状:

  • (x - a) 是一次(单因式)

  • 图像在 x = a穿过 x 轴。线条是倾斜的。

(想象一条斜线穿过x轴)

  • (x - a)² 是二次(二重因式)

  • 图像在 x = a接触 x 轴,并与 x 轴相切。线条在这里变得平坦。

  • 例子:y = (x-1)² 是一个抛物线,顶点在 (1,0)。

(想象一个U型抛物线,底部刚好贴在x轴上)

  • (x - a)³ 是三次(三重因式)

  • 图像在 x = a穿过 x 轴,但同时也会有一个拐点(像一条蛇一样扭动着穿过x轴)。

  • 例子:y = (x-1)³,它在 (1,0) 处穿过 x 轴,但不像斜线那样直接,而是像一个“S”形的中心点。

(想象一条曲线,在接触x轴时变得水平,然后继续延伸,像一个平缓的S)

对于这些的研究导致了群的产生,群是近世代数(抽象代数)的重要内容,详见 群论入门