Ax=0 solutions
如果一个矩䧃化简为
A=⎣⎡100200210220000⎦⎤(0)
求解Ax=0
可汗学院解法
先继续化简为Reduced Row Echelon Form (RREF)
⎣⎡100200010−220000⎦⎤(1.1)
还原为方程组:
{x1=−2x2+2x4x3=−2x4(1.2)
用x2和x4来表示x1和x3,填满矩阵相应位置即可得解:
[x1x2x3x4]=x2[−2100]+x4[20−21](1.3)
如果不是太直观的话,其实就是把以下方程写成了矩阵的形式:
⎩⎨⎧x1=−2x2+2x4x2=x2x3=−2x4x4=x4(1.4)
剑桥教材解法
《Mathematics for Machine Learning》
by Marc Peter Deisenroth, A Aldo Faisal, Cheng Soon Ong,
Cambridge University
化简为RREF后,观察到c1和c3列可组成一个单位矩阵(identity matrix)[1001]
如果是解Ax=b,此时可用此矩阵求出特解,但此处是0,所以此步省略,直接求通解
我们用c1和c3来表示其它列:
{c2=2c1c4=−2c1+2c3(2.1)
我们利用c2−c2=0,c4−c4=0来构造0值(通解都是求0):
{2c1−c2=0−2c1+2c3−c4=0(2.2)
补齐方程,整理顺序(以便直观地看到系数)得:
{2c1−1c2+0c3+0c4=0−2c1+0c2+2c3−1c4=0(2.3)
因为矩阵乘向量可以理解为矩阵和列向量c与向量x的点积之和∑i=14xici,所以红色的系数部分其实就是(x1,x2,x3,x4),得解:
{x∈R4:x=λ1[2−100]+λ2[20−21],λ1,λ2∈R}(2.4)
与可汗学院的解得到的两个向量比较下,是一样的,都是[2,−1,0,0]T和[2,0,−2,1]T。
麻省理工教材解法
《Introduction to Linear Alegebra》
by Gilbert Strang,
Massachusetts Institute of Technology
无需继续化简为RREF,直接对方程组:
{x1=−2x2+2x4x3=−2x4(3.1)
使用特解。考虑到x1,x3为主元(pivot),那么分别设[x2x4] 为[10] 和[01] 。
两种情况各代入一次,解出x1,x3,仍然是[2,−1,0,0]T和[2,0,−2,1]T,红色标识了代入值,黑色即为代入后的解。
MIT不止提供了这一个思路,继续。
这次需要化简为RREF,然后互换第2列和第3列(==记住这次互换==),还记得剑桥的方法里发现c1,c3能组成一个单位矩阵吗?这里的目的是通过移动列,直接在表现形式上变成单位矩阵:
⎣⎡100010200−220⎦⎤(3.2)
这里把用虚线反矩阵划成了四个区,左上角为一个Identity Matrix,我们记为I,右上角为自由列,我们记为F,矩阵(这次我们标记为R)变成了
R=[I0F0](3.3)
求解Rx=0,得到x=[−FI],把F和I分别展开(记得F要乘上-1):
⎣⎡−20102−201⎦⎤(3.4)
还记得前面黄色高亮的部分吗?我们交换了两列,倒置后,我们要把第2, 3行给交换一下:
⎣⎡−210020−21⎦⎤(3.5)
是不是又得到了两个熟悉的[2,−1,0,0]T和[2,0,−2,1]T。?
当时看到Gilbert教授简单粗暴地用[10] 和[01] 直接代入求出解,道理都不跟你讲,然后又给你画大饼,又是F又是I的,觉得可能他的课程不适合初学者,LOL。不过,这些Gilbert教授在此演示的解法并不适用于Ax=b。
在此特用笔记把几本教材里的思路都记录一下。