線型代数の声を聴く

線型代数の概念が、なぜそう定義されるのか — その声に耳を澄ます。

逆行列を求める — 拡大行列の右半分に現れるもの

この記事でわかるようになること

  • 逆行列を計算する アルゴリズム $[A \mid I_n] \to [I_n \mid A^{-1}]$ を、自分の手で動かせる
  • このアルゴリズムが、前回 2.4.1 (3) ⇒ (5) の 証明そのものを実装したものだ と言える
  • アルゴリズムが「正則性の判定」と「逆行列の計算」を同時にやってくれる理由を説明できる
  • 第 2 章で積み上げた装置 — 行基本変形・簡約化・階数・解の運命・正則性 — が、すべてひとつの計算手続きの異なる側面だ、と俯瞰できる

前提知識

  • 2.4.1「正則行列と逆行列」(定理 2.4.2、特に (3) ⇒ (5) の構成)
  • 2.3.1「解の有無と一意性」(行基本変形が「列を混ぜない」観察)
  • 2.2.2「簡約化と階数」

現在地

  • 第2章「連立1次方程式」(全10章中)
    • 2.1 基本変形
    • 2.2 簡約な行列
    • 2.3 連立1次方程式を解く
    • 2.4 正則行列(全2記事)
      • 2.4.1 正則行列と逆行列
      • 2.4.2 逆行列を求める ← いまここ

問い

前回 2.4.1 で、正方行列 $A$ が 正則 であることと、$A$ に逆行列 $A^{-1}$ が存在することは同じことだ、と確かめた。

ただし、そこで残された宿題がある。「逆行列が存在する」と知ったあとで、実際にどう $A^{-1}$ を計算するのか?

本記事の答えは、目を見張るほど直接的だ。$n \times n$ の正則行列 $A$ に対して、$n \times 2n$ の拡大行列を作って簡約化するだけ。簡約化が完了すると、左半分は当然 $I_n$ になっているが、それと 同時に 右半分には逆行列 $A^{-1}$ がそのままの形で現れている。

$$ [A \mid I_n] \;\longrightarrow\; [I_n \mid A^{-1}] $$

なぜこんなことが可能なのか?どうやって手を動かすのか?— それを順に見ていく。

アルゴリズムの種は 2.4.1 で蒔かれていた

実は、前回 2.4.1 の (3) ⇒ (5) の証明で、私たちは既に逆行列の作り方を手に入れていた。思い出そう。仮定 (3) のもと、

$$ A\boldsymbol{c}_j = \boldsymbol{e}_j \quad (j = 1, 2, \ldots, n) $$

をそれぞれ解いて得た解たちを横に並べた

$$ C = [\,\boldsymbol{c}_1 \; \boldsymbol{c}_2 \; \cdots \; \boldsymbol{c}_n\,] $$

は、$AC = I_n$ を満たし、定理 2.4.1 によって $C = A^{-1}$ となる — というのが (3) ⇒ (5) の中身だった。

つまり $A^{-1}$ は、各単位ベクトルを右辺にとった $n$ 本の連立方程式の解を、列ベクトルとして横に並べたもの。それだけ。

問題は、計算の手間。素朴には $n$ 本の連立方程式を別々に解くことになる。一本ごとに拡大係数行列を作って簡約化していたら、左側の $A$ への行操作が $n$ 回繰り返されてしまう — 同じ計算を何度もやらされる。

同時並列で進める — 一回の簡約化で $n$ 本まとめて

ここで効くのが、行基本変形が 「列を混ぜない」 という事実(2.3.1 で見た)。各 $j$ について、

$$ [A \mid \boldsymbol{e}_j] \;\longrightarrow\; \cdots \;\longrightarrow\; [I_n \mid \boldsymbol{c}_j] $$

の簡約化を進めるとき、左側の $A$ に施される行操作は $j$ に依存しない。つまり、$n$ 本の簡約化はすべて同じ行操作で実行できる

同じ操作を $n$ 回繰り返すのは無駄。最初から $n$ 本の右辺をすべて並べてしまえばよい。

$$ [A \mid \boldsymbol{e}_1 \; \boldsymbol{e}_2 \; \cdots \; \boldsymbol{e}_n] = [A \mid I_n] $$

(単位ベクトルを横に束ねたものは、定義どおり単位行列に他ならない。)

この $n \times 2n$ 行列を 一度 簡約化すると、左半分には $A$ の簡約化が現れ、右半分には同じ行操作を各単位ベクトルにそれぞれ施した結果が並ぶ。

$A$ が正則であれば、左半分は単位行列で、右半分は (3) ⇒ (5) で構成した解たちを横に並べたもの — すなわち $A^{-1}$ そのもの。

$$ [A \mid I_n] \;\longrightarrow\; [I_n \mid A^{-1}] $$

これが 逆行列計算アルゴリズムの全貌。一行に圧縮できるほど簡潔である。

観察:アルゴリズムの仕組みを一言で言い換えると、「$A$ を単位行列に変える行基本変形を見つけて、その同じ操作を単位行列のほうに施す」。$A$ から単位行列への動きの 裏側 で、単位行列から $A^{-1}$ への動きが、何の追加計算もなく勝手に進行している — これが掃き出し型アルゴリズムの精神である。

例題:3 次正則行列の逆行列

具体例で動かしてみよう。

$$ A = \begin{bmatrix} 1 & 1 & 0 \\\\ 1 & 2 & 1 \\\\ 0 & 1 & 2 \end{bmatrix} $$

を考える。$3 \times 6$ の拡大行列を作る。

$$ [A \mid I_3] = \begin{bmatrix} 1 & 1 & 0 & \mid & 1 & 0 & 0 \\\\ 1 & 2 & 1 & \mid & 0 & 1 & 0 \\\\ 0 & 1 & 2 & \mid & 0 & 0 & 1 \end{bmatrix} $$

第 2 行に第 1 行の $-1$ 倍を加える(第 1 列を整える)。

$$ \;\longrightarrow\; \begin{bmatrix} 1 & 1 & 0 & \mid & 1 & 0 & 0 \\\\ 0 & 1 & 1 & \mid & -1 & 1 & 0 \\\\ 0 & 1 & 2 & \mid & 0 & 0 & 1 \end{bmatrix} $$

第 1 行に第 2 行の $-1$ 倍を加え、さらに第 3 行から第 2 行を引く(第 2 列を整える)。

$$ \;\longrightarrow\; \begin{bmatrix} 1 & 0 & -1 & \mid & 2 & -1 & 0 \\\\ 0 & 1 & 1 & \mid & -1 & 1 & 0 \\\\ 0 & 0 & 1 & \mid & 1 & -1 & 1 \end{bmatrix} $$

第 1 行に第 3 行を加え、第 2 行から第 3 行を引く(第 3 列を整える)。

$$ \;\longrightarrow\; \begin{bmatrix} 1 & 0 & 0 & \mid & 3 & -2 & 1 \\\\ 0 & 1 & 0 & \mid & -2 & 2 & -1 \\\\ 0 & 0 & 1 & \mid & 1 & -1 & 1 \end{bmatrix} $$

簡約化が完了。左半分が $I_3$ に整ったので $A$ は正則で、右半分が逆行列。

$$ A^{-1} = \begin{bmatrix} 3 & -2 & 1 \\\\ -2 & 2 & -1 \\\\ 1 & -1 & 1 \end{bmatrix} $$

念のため $A A^{-1}$ を計算してみると、各 $(i, j)$ 成分が確かに単位行列の対応する値($i = j$ で $1$、$i \neq j$ で $0$)になっていることが確かめられる(計算は読者に委ねる)。

注意 — 簡約化が単位行列に到達しなかったら

簡約化を進めて、左半分が単位行列にならない(零行が出現する)場合はどうか。

定理 2.4.2 により、$A$ の簡約化が単位行列でない ⟺ $\mathrm{rank}(A) < n$ ⟺ $A$ は正則ではない、だった。だから:

アルゴリズムを実行して左半分が単位行列に整わなければ、$A$ は正則ではない(逆行列は存在しない)。

裏返すと、アルゴリズム自体が正則性の判定も同時にやってくれる。「簡約化したら左半分が単位行列に整ったか」を見るだけで、$A$ が正則であるかを判定でき、正則であればその場で $A^{-1}$ も手に入る。判定と計算が一つの手続きで同時に終わる — これが掃き出し法の経済性である。

第 2 章を振り返る

ここで第 2 章は終わる。一段引いて、私たちが歩いてきた道を眺めてみよう。

第 1 章で、行列を「数の長方形」として手にとった。それは静的なオブジェクトに見えた。

第 2 章では、その行列に対する 行基本変形 という操作を導入し、そこから 簡約化 という終着点、そこから読める 階数 という量、それらの組み合わせで決まる 連立方程式の解の運命(三通りに分かれる)、特殊形である 同次方程式と過小決定系、そして特殊状況での 正則性と逆行列 へと、たった一つの装置を一筋に上ってきた。

驚くべきは、すべての道具が「行基本変形 → 簡約化」というたった一つの装置から派生していること。階数も、解の有無の判定も、自由度の本数も、正則性の判定も、逆行列の構成も — すべてが同じ計算手続きの異なる側面である。

これが、線型代数が「数の代数」を超えて 構造の代数 であることの、最初の証拠になる。「行列とは何か」という第 1 章の問いに、第 2 章は 「行列とは、こういう統一的な装置で読み解ける構造体である」 と答え返した、と言ってよい。

次回予告 — 第 3 章「行列式」、そして第 4 章「ベクトル空間」へ

しかし、肝心な「なぜ装置が機能するのか」が、まだ宙ぶらりんに残っている。

  • 簡約化の 一意性(2.2.2 の定理 2.2.1)はなぜ成り立つのか?(本格証明は持ち越したまま)
  • 階数は「行から見ても列から見ても同じ」のはずだが、なぜ?
  • 定理 2.4.1(片側 $\Rightarrow$ 両側)はなぜ正方行列に固有なのか?

これらの答えは、おもに 第 4 章「ベクトル空間」 で整える 線型独立 という代数的・幾何的な概念にある。線型独立の言葉が手に入ると、本章で受け入れてきたいくつもの主張に 本当の理由 が一斉につく — 簡約化の一意性、行から見た階数と列から見た階数の一致、定理 2.4.1 が正方行列に固有である理由、すべてが線型独立をめぐる風景の一部として決着する。

その手前に立つ 第 3 章「行列式」 では、正方行列にもう一つの数 — 行列式 $\det A$ — を持たせる。行列式は正則性のもう一つの判定法を与え(「$A$ が正則 ⟺ $\det A \neq 0$」)、また連立 1 次方程式の解を クラメルの公式 という閉じた式で書き表す道具にもなる。本章で歩いた「行基本変形 → 簡約化」というアルゴリズム的アプローチに対する、もう一つの顔 である。

第 2 章は、これらすべての風景を見るための 入口の章 だった、と言ってよいかもしれない。

未回収の問い

  • 正則性の判定には他にも 行列式(determinant)という古典的な道具がある。簡約化を経由せず、行列の成分から直接「正則かどうか」を計算できる量だが、これは本シリーズでは第 3 章「行列式」で正面から扱う(本記事の次回予告で予告したとおり)
  • 大きな行列の逆行列を計算するときの 計算量と数値安定性。理論上は本章のアルゴリズムで十分だが、実用では LU 分解などのより洗練された方法が用いられる(本シリーズの主目的は理論なので、応用は深入りしない)
  • 定理 2.4.1(片側 $\Rightarrow$ 両側)の本格証明 — 第 4 章「ベクトル空間」へ送ったまま。線型独立性の言葉を整えてから決着する

← 前の記事:2.4.1 正則行列と逆行列 — 五つの顔をもつひとつの性質
→ 次の記事:3.1.1 置換 — 並べ替えを「ひとつの動き」として捉え直す

正則行列と逆行列 — 五つの顔をもつひとつの性質

この記事でわかるようになること

  • 正方行列 $A$ に対する 逆行列 $A^{-1}$ の定義を、両側等式 $AB = BA = I_n$ として書き下せる
  • 逆行列が (あれば)一意に定まる ことを、結合律と単位行列の性質だけから導ける
  • 正則行列 という言葉の定義を述べられる
  • 正方行列について、(1) 階数 $=n$、(2) 簡約化 $=I_n$、(3) 任意右辺で唯一解、(4) 自明解のみ、(5) 正則 の 五つの条件がすべて同値 であること(定理 2.4.2)を、循環論法で証明できる
  • これら五つを束ねるひとつの性質 — 正則性 — が、第 2 章を貫いてきたいくつもの観点を一点に結ぶ風景だと言える

前提知識

  • 2.3.1「解の有無と一意性」(定理 2.3.1, 2.3.2)
  • 2.3.2「同次方程式と過小決定系」(定理 2.3.3、特に (1))
  • 2.2.2「簡約化と階数」(定理 2.2.1 の存在・一意性、階数の定義)
  • 1.3「行列の分割」(列ベクトルを並べた行列との積の読み方)
  • 1.2.3「行列演算の法則」(結合律など)

現在地

  • 第2章「連立1次方程式」(全10章中)
    • 2.1 基本変形
    • 2.2 簡約な行列
    • 2.3 連立1次方程式を解く
    • 2.4 正則行列(全2記事)
      • 2.4.1 正則行列と逆行列 ← いまここ
      • 2.4.2 逆行列を求める

問い

ここまでの第 2 章で、私たちは連立 1 次方程式 $A\boldsymbol{x} = \boldsymbol{b}$ の解の運命を、$A$ の 行基本変形・簡約化・階数 という装置で読み解いてきた。最終的に到達したのは、解の有無・自由度・構造のすべてが、たった三つの整数の比較で決まるという、目を見張るような結論だった。

ここで、ひときわ素直な特殊状況に立ち戻る。$A$ が正方行列($m = n$)で、しかも未知数を縛り切る $\mathrm{rank}(A) = n$ が成り立つときに、何が起きるのか?

前回 2.3.2 末尾で、私たちはこう予告した — このとき、

  • $\mathrm{rank}(A) = n$
  • $A$ の簡約化が単位行列 $I_n$
  • $A\boldsymbol{x} = \boldsymbol{b}$ が任意の右辺に対して唯一の解をもつ
  • $A\boldsymbol{x} = \boldsymbol{0}$ の解は自明な解だけ
  • $A$ には 逆行列 $A^{-1}$ が存在する

という、まったく異なる出発点から眺めたはずの五つの条件が、すべて同じことを言っている。本記事はその回収である。

問うべきは三つ。

  • そもそも 逆行列 とは何か?どう定義され、なぜそれは(あれば)一つしかないのか?
  • 上の五つの条件は、それぞれが何を述べているのか?
  • それらが本当に同じ性質を別の角度から眺めただけだ、ということは、どう示せるのか?

答えを先に言ってしまおう。これら五つを束ねるひとつの性質には名前がついている — 正則性。本記事の終わりまでに、私たちは「正則行列」というひとつの言葉が 五つの顔をもって私たちの前に立ち現れる ことを目にする。

逆行列の定義

まず逆行列の定義から。

定義(逆行列):$A$ を $n$ 次正方行列とする。$n$ 次正方行列 $B$ が

$$ AB = BA = I_n $$

を満たすとき、$B$ を $A$ の逆行列 と呼ぶ。

定義は対称的である。$A$ にとって $B$ が逆行列なら、$B$ にとって $A$ も逆行列。両者は対等の関係にある。

行列の積は一般には非可換だったが(1.2.3)、この定義では「掛ける順番に関わらず単位行列になる」を要求している。これは強い条件である。

逆行列の一意性

定義は「ある $B$」と書いたが、ここで一つ立ち止まる。そんな $B$ が二つあってはならない という保証は、果たしてあるのだろうか。

ある。

命題(一意性):$A$ に逆行列が存在するならば、それはただ一つに定まる。

証明:$B$ と $C$ がともに $A$ の逆行列だとする。すなわち $AB = BA = I_n$ かつ $AC = CA = I_n$。すると、

$$ B = B I_n = B(AC) = (BA)C = I_n C = C $$

これで $B = C$。$A$ の逆行列はあれば一意に定まる。

ここで使っているのは、行列の積の 結合律 $B(AC) = (BA)C$ と単位行列の性質 $B I_n = B,\ I_n C = C$ だけ。1.2.3 で扱った「行列の積の法則」が舞台裏で効いている。

逆行列が存在するとき、それを記号 $A^{-1}$ で表す。

定理 2.4.1 — 片側さえ確かめれば両側

定義 $AB = BA = I_n$ には、二つの等式が要求されている。これは強そうに見える。だが正方行列の場合、実は片側だけ確かめれば十分 であることが知られている。

定理 2.4.1:$A, B$ がともに $n$ 次正方行列で $AB = I_n$ ならば、$B$ は $A$ の逆行列である(すなわち $BA = I_n$ も自動的に成り立ち、$B = A^{-1}$ となる)。

この定理の本格的な証明は、線型独立性などより踏み込んだ道具を要するため、第 3 章「ベクトルの幾何」以降に持ち越す。本記事では 主張を受け入れて使う

なお、この事実は正方行列に固有のもの — 一般の長方行列だと「右逆元」と「左逆元」が別物になりうる(その話も第 3 章以降で正面から扱う)。

定理 2.4.1 のおかげで、後の証明で「$AC = I_n$ になる $C$ を構成した」と言えれば、すぐに「$C$ は $A$ の逆行列」と結論できる。便利な定理である。

正則行列

逆行列をもつ正方行列には、特別な名前がついている。

定義(正則行列):正方行列 $A$ が逆行列をもつとき、$A$ を 正則行列 あるいは 正則 であるという。

「正則(regular)」という呼び名は、$A$ の振る舞いが端正で、ねじれや潰れがない — 連立方程式に「素直に」答えてくれる行列、という雰囲気を漂わせる。実際、正則行列は線型代数の主役のひとつで、後の章でも何度も顔を出すことになる。

定理 2.4.2 — 五つの顔は同じ顔

ここで本節の山頂に立つ。

定理 2.4.2:$A$ が $n$ 次正方行列のとき、次の (1)〜(5) は すべて同値 である。

(1) $\mathrm{rank}(A) = n$

(2) $A$ の簡約化は $I_n$

(3) $A\boldsymbol{x} = \boldsymbol{b}$ は任意の $n$ 次列ベクトル $\boldsymbol{b}$ に対し、ただ一つの解をもつ

(4) $A\boldsymbol{x} = \boldsymbol{0}$ の解は自明解 $\boldsymbol{x} = \boldsymbol{0}$ に限る

(5) $A$ は正則行列

五つの条件を眺めると、出発点はじつにバラバラだ — 階数(整数)、簡約化(行列の姿)、解の存在(連立方程式の振る舞い)、自明解だけ(同次形の振る舞い)、逆行列の存在(代数的な性質)。これらが等価で結ばれる、というのが定理の主張。

証明は、循環 (1) → (2) → (3) → (4) → (1) で (1)〜(4) の同値性を確立し、その後 (3) と (5) のあいだを (3) → (5) → (4) と通すことで (5) を組み込む、という構成で進める。

(1) ⇒ (2):$\mathrm{rank}$ が $n$ なら簡約化は $I_n$

$\mathrm{rank}(A) = n$ ということは、$A$ の簡約化に 零でない行が $n$ 個ある という意味だった(2.2.2)。$A$ は $n$ 次正方行列で行も $n$ 行しかないから、簡約化のすべての行が零でない。

各非零行には主成分が一つあり、主成分の列番号は厳密に増加する(簡約な行列の条件 III)。$n$ 行ぶんの主成分が $n$ 列のうちのどこかに散らばる — 列番号の厳密増加から、第 1 行の主成分は第 1 列、第 2 行の主成分は第 2 列、…、第 $n$ 行の主成分は第 $n$ 列に並ぶ。すべての列に主成分が立つ。

各主成分は $1$(条件 II)、その列の他成分は $0$(条件 IV)だから、簡約化の対角成分は $1$、それ以外は $0$。これは単位行列 $I_n$ の定義そのもの。よって $A$ の簡約化は $I_n$。

(2) ⇒ (3):簡約化が $I_n$ なら任意の右辺で唯一解

$A$ の簡約化が $I_n$ だとする。

任意の $\boldsymbol{b}$ に対して拡大係数行列 $[A \mid \boldsymbol{b}]$ を簡約化すると、左側 $n$ 列は $A$ の簡約化が現れ、右側の $\boldsymbol{b}$ は同じ行基本変形で別の列ベクトル $\boldsymbol{b}'$ に変わる。すなわち

$$ [A \mid \boldsymbol{b}] \;\longrightarrow\; [I_n \mid \boldsymbol{b}'] $$

最右列に主成分は立たない(左側 $n$ 列に既に $n$ 個の主成分が並んでいるから、それ以上は条件 III から不可能)。よって $\mathrm{rank}(A) = \mathrm{rank}([A \mid \boldsymbol{b}]) = n$ となり、定理 2.3.2 によって、解は唯一存在する。

具体的には、簡約化された各行を読み下せば、各未知数の値が右辺 $\boldsymbol{b}'$ の対応する成分そのものとして決まる。

(3) ⇒ (4):任意右辺で唯一解 ⇒ 同次形は自明のみ

(3) は $\boldsymbol{b}$ が任意のときに唯一解を主張している。特別な場合として $\boldsymbol{b} = \boldsymbol{0}$ を選ぶ。

$A\boldsymbol{x} = \boldsymbol{0}$ は明らかに $\boldsymbol{x} = \boldsymbol{0}$ という解をもつ。(3) の唯一性により、これ以外の解はない。

(4) ⇒ (1):同次形が自明のみ ⇒ $\mathrm{rank}$ が $n$

これは前回の 定理 2.3.3 (1) そのものである。$A\boldsymbol{x} = \boldsymbol{0}$ が自明解しかもたないことと $\mathrm{rank}(A) = n$ は等価だった。

これで (1) → (2) → (3) → (4) → (1) の循環が閉じ、(1)〜(4) が同値であることが確立された。

(3) ⇒ (5):任意右辺で唯一解 ⇒ 正則

ここが今回の証明で最も技巧的な箇所であり、同時に 次回 2.4.2 の計算アルゴリズムの種 でもある。

$\mathbb{R}^n$ の標準的な単位ベクトル(第 $j$ 成分だけが $1$、ほかは $0$ の縦ベクトル)を考える。

$$ \boldsymbol{e}_1 = \begin{bmatrix} 1 \\\\ 0 \\\\ \vdots \\\\ 0 \end{bmatrix},\quad \boldsymbol{e}_2 = \begin{bmatrix} 0 \\\\ 1 \\\\ \vdots \\\\ 0 \end{bmatrix},\quad \ldots,\quad \boldsymbol{e}_n = \begin{bmatrix} 0 \\\\ 0 \\\\ \vdots \\\\ 1 \end{bmatrix} $$

仮定 (3) によれば、$n$ 本の連立方程式

$$ A\boldsymbol{x} = \boldsymbol{e}_j \quad (j = 1, 2, \ldots, n) $$

はそれぞれただ一つの解をもつ。これらの解を、

$$ A\boldsymbol{c}_j = \boldsymbol{e}_j \quad (j = 1, 2, \ldots, n) $$

と命名しておく。$n$ 本の解を列ベクトルとして横に並べると、$n$ 次正方行列

$$ C = [\,\boldsymbol{c}_1 \; \boldsymbol{c}_2 \; \cdots \; \boldsymbol{c}_n\,] $$

が定まる。

ここで $AC$ を計算する。行列の積の 列ごとの読み方(1.3 のブロック分割の見方)によって

$$ AC = A[\,\boldsymbol{c}_1 \; \cdots \; \boldsymbol{c}_n\,] = [\,A\boldsymbol{c}_1 \; \cdots \; A\boldsymbol{c}_n\,] = [\,\boldsymbol{e}_1 \; \cdots \; \boldsymbol{e}_n\,] = I_n $$

すなわち $AC = I_n$ が成立。

ここで先ほど受け入れた 定理 2.4.1(片側 $\Rightarrow$ 両側)を呼び出せば、$C$ は $A$ の逆行列であり、$A$ は正則行列だと結論できる。

観察:この証明は、逆行列の計算アルゴリズム の心臓部でもある。「単位ベクトルごとに連立方程式を解いて、得られた解を列ベクトルとして横に並べると逆行列になる」という事実は、次回 2.4.2 で「拡大行列 $[A \mid I_n]$ を簡約化すると右半分に $A^{-1}$ が現れる」という掃き出し型のアルゴリズムへと翻訳される。

(5) ⇒ (4):正則 ⇒ 同次形は自明のみ

$A$ が正則ならば逆行列 $A^{-1}$ が存在する。$A\boldsymbol{x} = \boldsymbol{0}$ の両辺に左から $A^{-1}$ を掛けると

$$ A^{-1}(A\boldsymbol{x}) = A^{-1}\boldsymbol{0} $$

となる。左辺は結合律と単位行列の性質で $\boldsymbol{x}$ に整理され、右辺は $\boldsymbol{0}$。つまり $\boldsymbol{x} = \boldsymbol{0}$ — これで (4) が示せた。

(3) と (4) は同値だったから、(5) と (1)〜(4) の同値も示された。定理 2.4.2 の証明完了

五つの顔を眺める

長い証明だったが、結論はじつに単純で美しい。$n$ 次正方行列 $A$ について、次の五つは 同じ性質を別々の角度から見ているだけ だった(各項目の冒頭の番号は、定理 2.4.2 で並べた条件 (1)〜(5) に対応する)。

  • (5) 代数の顔 — 逆行列 $A^{-1}$ が存在する
  • (3) 線型方程式の顔 — 任意の右辺に対して唯一の解がある
  • (4) 同次系の顔 — 自明な解しかない
  • (1) 整数の顔 — 階数が最大値 $n$ に達している
  • (2) 形の顔 — 簡約化が単位行列

これら五つの顔をひとつに束ねる名前が 正則 であり、それを宿す行列が 正則行列。第 2 章の最後の山頂とは、この「たった一つの性質に五つの入口がある」という風景のことだった。

直観(将来の伏線):$A$ を 線型写像 $\boldsymbol{x} \mapsto A\boldsymbol{x}$ として眺めると、正則性は「写像が 全単射 であること」と等価になる。$\mathbb{R}^n \to \mathbb{R}^n$ という同次元空間どうしの写像で、全射であること(任意の右辺に解がある = (3))、単射であること(自明解しかない = (4))、両側の逆写像が存在すること(=(5))のすべてが正則性に同居している。第 5 章「線型写像」では、これが 同型写像 という概念として正面から扱われる。

まとめ

  • 正方行列 $A$ について「両側で $A$ と掛けて単位行列になる行列」を $A$ の 逆行列 と呼び、記号 $A^{-1}$ で表す。逆行列はあれば一意に定まる(結合律と単位行列の性質から導出)
  • 逆行列をもつ正方行列を 正則行列 と呼ぶ
  • 定理 2.4.1:正方行列に対しては、$AB = I$ を片側だけ確かめれば $BA = I$ も自動的に従う(本格証明は第 3 章「ベクトルの幾何」以降へ持ち越し)
  • 定理 2.4.2:正方行列について、(1) 階数が $n$、(2) 簡約化が単位行列、(3) 任意右辺で唯一解、(4) 自明解のみ、(5) 正則 — の 五つはすべて同値
  • 正則性は「五つの顔をもつひとつの性質」だった

次回予告

次回 2.4.2「逆行列を求める」(仮題)では、定理 2.4.2 (3) ⇒ (5) の証明で構成した手筋 — 単位ベクトルごとに連立方程式を解いて、その解を列ベクトルとして横に並べれば $A^{-1}$ になる、という事実 — を、実際に手で計算できる手続き に翻訳する。

具体的には、$A$ の右に単位行列を貼りつけた

$$ [A \mid I_n] $$

という $n \times 2n$ 行列を簡約化するだけで、

$$ [A \mid I_n] \;\longrightarrow\; [I_n \mid A^{-1}] $$

と、右半分に $A^{-1}$ がそのまま現れる、という美しい(そして実用的な)アルゴリズムが見える。例題で具体的に手を動かしてみる。

これで第 2 章は完結する。

未回収の問い

  • 定理 2.4.1(片側 $\Rightarrow$ 両側)はなぜ正方行列に固有なのか?長方行列の場合は何が起きるのか?(第 3 章「ベクトルの幾何」で線型独立性を整えてから扱う)
  • 「正則性 = 線型写像の全単射性」という見方は、写像が異なる次元のあいだの場合(線型変換 $\mathbb{R}^n \to \mathbb{R}^m$、$m \neq n$)にどう拡張されるのか?(第 5 章「線型写像」で、像と核の言葉で精密化される)
  • $A^{-1}$ そのものは、$A$ が決まれば一意に決まる「$A$ の関数」とみなせる。この対応にはどんな性質があるのか — たとえば $(A^{-1})^{-1} = A$ や $(AB)^{-1} = B^{-1} A^{-1}$ といった基本恒等式が成り立つ。これらは練習問題として読者に委ねつつ、本シリーズでも必要に応じて触れる

← 前の記事:2.3.2 同次方程式と過小決定系 — 自明な解の周りに広がる方向
→ 次の記事:2.4.2 逆行列を求める — 拡大行列の右半分に現れるもの

簡約化と階数 — 終着点の存在・一意性と、そこから生まれる数

この記事でわかるようになること

  • 任意の行列を行基本変形で簡約な行列に直す アルゴリズム を、自分の手で動かせる
  • 「任意の行列が簡約化できる」「簡約化は一意」という主張(定理 2.2.1)を、その射程と限界を理解したうえで使える
  • 行列の 階数(ランク) を、簡約化を経由する形で定義できる
  • $\mathrm{rank}(A) \le m,\ \mathrm{rank}(A) \le n$ という基本不等式が、なぜ自然に出てくるかを言える

前提知識

  • 2.2.1「簡約な行列の定義」(主成分・4 条件)
  • 2.1「連立 1 次方程式の基本変形」(行基本変形)

現在地

  • 第2章「連立1次方程式」(全10章中)
    • 2.1 基本変形
    • 2.2 簡約な行列(全2記事)
      • 2.2.1 簡約な行列の定義
      • 2.2.2 簡約化と階数 ← いまここ
    • 2.3 連立1次方程式を解く
    • 2.4 正則行列

問い

前回 2.2.1 では「簡約な行列」を 4 条件で言い当てた。これで「終着点の形」が何かは分かった。だが、もう一段の問いが残っている。

  • 任意の 行列を、行基本変形だけでこの終着点まで持ち込めるのか?
  • 持ち込んだとして、その終着点は 計算の進め方によらず一つに定まる のか?それとも、選び方ごとに違う形に着地し得るのか?
  • 終着点が一意だとすれば、そこから自然に出てくる「行列の量」は何か?

本記事はこれら三つに答える。存在(終着点に必ず行ける)と 一意性(行き先はひとつしかない)、そして両者が組み合わさって生まれる新しい量 — 階数(ランク) が、本記事のゴールである。

簡約化のアルゴリズム — 具体例で歩く

まず、典型的な行列ひとつを行基本変形で簡約な行列にしてみよう。

$$ \begin{bmatrix} 0 & 0 & 2 & -6 & 8 \\\\ 0 & 1 & 1 & -4 & 6 \\\\ 0 & 2 & 1 & -5 & 8 \end{bmatrix} $$

最も左の非零列はどれかを見ると、第 1 列はすべて $0$、第 2 列に非零成分が現れる。第 2 列に主成分を持ちうる行(零でない行)のうち、主成分が最も左にある行は、第 2 行と第 3 行(主成分はいずれも第 2 列)。第 1 行は主成分が第 3 列にあって、これらより右である。

第 2 行をいまの第 1 行に移動するため、第 1 行と第 2 行を入れ替える

$$ \;\longrightarrow\; \begin{bmatrix} 0 & 1 & 1 & -4 & 6 \\\\ 0 & 0 & 2 & -6 & 8 \\\\ 0 & 2 & 1 & -5 & 8 \end{bmatrix} $$

第 1 行の主成分は第 2 列の $1$。第 1 行を使って、他の行の第 2 列を $0$ にする。第 3 行に第 1 行の $-2$ 倍を加える(第 2 行の第 2 列は既に $0$)。

$$ \;\longrightarrow\; \begin{bmatrix} 0 & 1 & 1 & -4 & 6 \\\\ 0 & 0 & 2 & -6 & 8 \\\\ 0 & 0 & -1 & 3 & -4 \end{bmatrix} $$

第 1 行は完成。次に、第 2 行以下 だけを対象にして、同じ手順を繰り返す。第 2 行・第 3 行の主成分はいずれも第 3 列にある。第 2 行を $1/2$ 倍 して主成分を $1$ に揃える。

$$ \;\longrightarrow\; \begin{bmatrix} 0 & 1 & 1 & -4 & 6 \\\\ 0 & 0 & 1 & -3 & 4 \\\\ 0 & 0 & -1 & 3 & -4 \end{bmatrix} $$

第 2 行の主成分は第 3 列の $1$。第 2 行を使って、他の行の第 3 列を $0$ にする。第 1 行に第 2 行の $-1$ 倍を、第 3 行に第 2 行の $+1$ 倍を加える。

$$ \;\longrightarrow\; \begin{bmatrix} 0 & 1 & 0 & -1 & 2 \\\\ 0 & 0 & 1 & -3 & 4 \\\\ 0 & 0 & 0 & 0 & 0 \end{bmatrix} $$

これは簡約な行列である。第 1 行・第 2 行の主成分はそれぞれ $(1, 2),\ (2, 3)$ で、列番号は $2 < 3$ と単調増加、各主成分の列の他成分は $0$、零行は最下層。第 3 行は計算の途中で零ベクトルになった。

アルゴリズムの一般化

いま行ったのは、次のような繰り返し手続きである。

  1. 行列の 零行 があれば、行入れ替えで最下層に集める。
  2. 残りの非零行のうち、主成分が最も左にある行 をひとつ選び、必要なら入れ替えて先頭(まだ確定していない一番上の行)に移す。
  3. その行の主成分を、$0$ でない倍で割って $1$ に揃える。
  4. その行の何倍かを他のすべての行に加えて、その主成分のある列の他成分を $0$ にする。
  5. 確定した先頭行の 下に残る行たち を相手に、手順 2 から再開する。

非零行の数は有限だから、この手続きは必ず止まる。止まったとき、得られた行列は簡約な行列の 4 条件をすべて満たす。

観察:この手続きは、各ステップで「次の主成分の場所」を決定的に絞り込みつつ、4 条件を一つずつ確定させていく。(I) は手順 1 が、(II) は手順 3 が、(III) は手順 2(主成分が最も左にある行を先頭に置く)と手順 4(その列の他成分を $0$ で払う)の併せ技が、(IV) は手順 4 が、それぞれ担っている。

これは、任意の行列が簡約な行列に変形できる 構成的な証拠 にもなっている。

定理 2.2.1 — 存在と一意性

以上で「存在」は言えた。だが、簡約化は一通りなのか? という疑問はまだ残っている。手順 2 で「最も左にある主成分の行」が複数あれば、どれを選んでもよい。手順 4 のあいだに行を別の順序で操作してもよい。これらの自由度は、最終的にどんな形に着地するかに影響しないのだろうか?

結論から言えば、影響しない。

定理 2.2.1:任意の行列は、行基本変形を繰り返すことによって簡約な行列に変形できる(存在)。さらに、与えられた行列の簡約な行列は一意に定まる(一意性)。

存在の方は、いま示したアルゴリズムが構成的に証明している。一意性の方は、本記事の段階では証明できない。本格的な証明は、第 4 章「ベクトル空間」で線型独立性の言葉を整えた後に与えられる。ここではいったん主張として受け入れてほしい。

なぜ証明を持ち越すかというと、一意性の心臓部は「簡約な行列のかたち(主成分の位置と、主成分でない成分の値)が、行列のもっと内在的な構造 — 線型独立な行/列の取り方 — から一意に決まる」という事実だからである。基本変形だけを道具にした初等的な議論では、なかなか手の届かないところにある。

行列の簡約化、という言葉

「簡約化できる」と何度も言ってきたが、これに正式な名前を与えておく。

定義(簡約化):行列 $A$ に行基本変形を繰り返し施して簡約な行列 $B$ を得ることを、「$A$ を簡約化する」という。得られた $B$ を $A$ の簡約化 と呼び、本記事ではしばしば $A$ の簡約化を $B$ と書く。

定理 2.2.1 によって、$A$ の簡約化 $B$ は $A$ から一意に定まる。これは「$B$ は $A$ 固有のもの」だということ — 計算の手筋が違っても、最後にたどり着く $B$ は同じである。本記事以降、単に「行列 $A$ の簡約化」と言ったら、この一意に定まった $B$ を指す。

階数 — 簡約化が連れてくる数

簡約化が一意に定まる、ということは、簡約化から読める すべての量 が「行列 $A$ 固有のもの」になる、ということでもある。最も基本的な量がこれ。

定義(階数):行列 $A$ の簡約化を $B$ とするとき、$B$ の 零でない行の個数 を $A$ の 階数 または ランク と呼び、$\mathrm{rank}(A)$ と書く。

定理 2.2.1 の一意性によって、$\mathrm{rank}(A)$ は計算の進め方によらない。$A$ から決まる量である。

階数には別の見方もある。簡約な行列の主成分は各行に高々 1 つで、零でない行の個数と主成分の個数は等しい。さらに条件 (III) によって、それぞれの主成分は 異なる列 に属する。よって

$$ \mathrm{rank}(A) = (B \text{ の主成分の個数}) = (B \text{ の主成分を含む列の個数}) $$

がいずれも成り立つ。

直観:$\mathrm{rank}(A)$ は、行列 $A$ が連立方程式に課す 独立な制約の本数 だと思える。零行は「制約として何も言っていない」行、主成分の現れる行は「新しい制約を一つ持ち込んでいる」行 — その数を数えたものが階数である。

この「独立」の意味は、第 4 章で 線型独立 として正式に定式化される。それまで、本シリーズでの階数は「簡約化後の零でない行の個数」というアルゴリズム的な定義で受け取ってほしい。

階数の基本不等式

階数の定義から、ほとんどおまけのように出てくる事実がある。

定理 2.2.2:$A$ が $m \times n$ 行列ならば

$$ \mathrm{rank}(A) \le m, \quad \mathrm{rank}(A) \le n $$

すなわち、$\mathrm{rank}(A) \le \min(m, n)$。

理由:$A$ の簡約化 $B$ もやはり $m \times n$ 行列。$\mathrm{rank}(A)$ は $B$ の零でない行の個数だから、行の総数 $m$ を超えられない。同時に、$\mathrm{rank}(A)$ は $B$ の主成分を含む列の個数でもあり、それぞれの主成分は異なる列にあるから、列の総数 $n$ も超えられない。

観察:この基本不等式は、すぐ後の 2.3「連立 1 次方程式を解く」で、解の存在・自由度を判定する道具として効いてくる。$\mathrm{rank}(A) = n$ なら未知数を縛り切る制約があり解が一意に決まる、$\mathrm{rank}(A) < n$ なら自由度が残る、というかたちで現れる。

まとめ

  • 任意の行列は、行基本変形を繰り返して簡約な行列に変形できる(簡約化)。アルゴリズムは「左の列から順に主成分を立て、その列の他成分を $0$ で払う」操作の繰り返し
  • 定理 2.2.1:任意の行列は簡約化できる(存在、本記事のアルゴリズムで構成的に示した)。さらに、その簡約化は一通りに定まる(一意性、完全証明は第 4 章へ)
  • 簡約化が一意だから、そこから読める量はすべて行列固有のものになる。最も基本的なのが 階数 $\mathrm{rank}(A)$ — 簡約化後の零でない行の個数(= 主成分の個数)
  • 定理 2.2.2:$A$ が $m \times n$ 行列なら $\mathrm{rank}(A) \le m,\ \mathrm{rank}(A) \le n$

行列を「数の長方形」として手に取り、行基本変形で整え、最後にひとつの数 — 階数 — を読み取る。長方形 → 形 → 数、という流れが見えるようになった。

次回予告

次回 2.3「連立 1 次方程式を解く」では、いよいよ拡大係数行列の階数と未知数の本数 $n$ を比較することで、連立 1 次方程式の 解の有無自由度 が判定できるようになる。具体的には次の三通りに分かれる。

  • $\mathrm{rank}(A) \neq \mathrm{rank}([A \mid \boldsymbol{b}])$ なら 解なし
  • $\mathrm{rank}(A) = \mathrm{rank}([A \mid \boldsymbol{b}]) = n$ なら 解は唯一
  • $\mathrm{rank}(A) = \mathrm{rank}([A \mid \boldsymbol{b}]) < n$ なら 無限に解がある(自由度 $n - \mathrm{rank}(A)$)

これが、第 2 章前半で積み上げてきた装置の最終的な使い道である。

未回収の問い

  • 簡約化の一意性は、なぜ成り立つのか?(第 4 章「ベクトル空間」で、線型独立な行/列の最大個数の不変性として証明される)
  • 階数が「独立な制約の本数」だ、という直観の 独立 は、厳密には何を意味するのか?(第 4 章「線型独立と線型従属」で正式化)
  • 階数は、行から見た数なのか、列から見た数なのか?(両方から見ても同じ。これも第 4 章での重要な事実)

← 前の記事:2.2.1 簡約な行列の定義 — 終着点の形を 4 条件で言い当てる
→ 次の記事:2.3.1 解の有無と一意性 — 階数で読む三通りの運命

同次方程式と過小決定系 — 自明な解の周りに広がる方向

この記事でわかるようになること

  • 同次方程式 $A\boldsymbol{x} = \boldsymbol{0}$ がいつでも 自明な解 $\boldsymbol{x} = \boldsymbol{0}$ をもつことを言える
  • 同次形では、拡大係数行列を持ち出さずに $A$ そのものを簡約化すればよい理由を説明できる
  • 自明でない解が存在するための必要十分条件 $\mathrm{rank}(A) < n$ を、定理 2.3.2 の特殊化として導ける(定理 2.3.3 (1))
  • 過小決定系($m < n$)では必ず自明でない解が存在する、という事実を階数の基本不等式から導ける(定理 2.3.3 (2))
  • $A\boldsymbol{x} = \boldsymbol{b}$ の解集合が「特解 $+$ $A\boldsymbol{x} = \boldsymbol{0}$ の解集合」というアフィン構造をもつことを示せる

前提知識

  • 2.3.1「解の有無と一意性」(定理 2.3.1, 2.3.2 と三通りの場合分け)
  • 2.2.2「簡約化と階数」(階数の基本不等式 $\mathrm{rank}(A) \le \min(m, n)$)
  • 1.2.3「行列演算の法則」(行列とベクトルの積の線型性)

現在地

  • 第2章「連立1次方程式」(全10章中)
    • 2.1 基本変形
    • 2.2 簡約な行列
    • 2.3 連立1次方程式を解く(全2記事)
      • 2.3.1 解の有無と一意性
      • 2.3.2 同次方程式と過小決定系 ← いまここ
    • 2.4 正則行列

問い

前回 2.3.1 では、連立 1 次方程式 $A\boldsymbol{x} = \boldsymbol{b}$ の解の運命が、$\mathrm{rank}(A)$、$\mathrm{rank}([A \mid \boldsymbol{b}])$、$n$ の三つを比較するだけで「解なし / 解唯一 / 無限解」の三通りに分かれることを見た。

本記事では、特別な場合 — 定数項 $\boldsymbol{b}$ が 零ベクトル であるとき — に焦点を当てる。すなわち

$$ A\boldsymbol{x} = \boldsymbol{0} $$

の形をしている連立 1 次方程式である。これを 同次方程式 あるいは 同次形 と呼ぶ。

同次形は、いつでも $\boldsymbol{x} = \boldsymbol{0}$ という解を持つ($\boldsymbol{0}$ を代入すれば左辺は $\boldsymbol{0}$、右辺も $\boldsymbol{0}$)。だから「解の有無」を問うのは無意味で、本記事の問いはひと味ちがう。

  • $\boldsymbol{x} = \boldsymbol{0}$ という、見るからに当たり前の解のほかに、解はあるのか?
  • あるのは、どんな条件のときか?未知数より方程式が少ない とき、何かが起きるのか?
  • そして — ここが本記事のひそかなクライマックスである — 一般の $A\boldsymbol{x} = \boldsymbol{b}$ の解集合と、同次形 $A\boldsymbol{x} = \boldsymbol{0}$ の解集合のあいだには、どんな関係があるのか?

自明な解と、それ以外

まず用語を整える。

定義(自明な解):同次方程式 $A\boldsymbol{x} = \boldsymbol{0}$ に対して、$\boldsymbol{x} = \boldsymbol{0}$ という解を 自明な解 あるいは 自明解 と呼ぶ。それ以外の解(成分のどれかが $0$ でないもの)を 自明でない解 または 非自明解 と呼ぶ。

「自明」は trivial の訳で、英語圏でもこの呼び方が定着している。読み下せば「言うまでもない解」。同次形をめぐる議論はすべて、この問いに集約される — 自明でない解はあるか、ないか

ここで一つ、計算上の小さな観察。同次形に対して拡大係数行列を作ると

$$ [A \mid \boldsymbol{0}] $$

となる。だが最右列がはじめから全成分 $0$ なので、行基本変形を施しても最右列は $0$ のまま動かない($0$ にいくら数を掛けても $0$、$0$ をいくら足しても変わらない)。よって最右列に主成分が立つことは絶対になく、

$$ \mathrm{rank}([A \mid \boldsymbol{0}]) = \mathrm{rank}(A) $$

がつねに成り立つ。前回の定理 2.3.1(解の有無の判定)を改めて確認しただけ — 同次形には解が必ずある、という事実の別の言い方である。

同時にこの観察は、同次形を扱うときは拡大係数行列を持ち出す必要がなく、係数行列 $A$ そのものを簡約化すればよい という、実用上の単純化も意味している。

定理 2.3.3 (1) — 自明な解だけか、それ以外もあるか

同次形 $A\boldsymbol{x} = \boldsymbol{0}$ は前回の枠組みでいえば $\boldsymbol{b} = \boldsymbol{0}$ という特別な場合だから、定理 2.3.2(解が唯一であるための必要十分条件)をそのまま当てはめれば、

定理 2.3.3 (1):$n$ 変数の同次方程式 $A\boldsymbol{x} = \boldsymbol{0}$ が 自明な解だけしかもたない 必要十分条件は、

$$ \mathrm{rank}(A) = n $$

裏返せば、$\mathrm{rank}(A) < n$ ならば必ず自明でない解が存在する。

直観的にいえば、$\mathrm{rank}(A)$ は「$A$ が課す独立な制約の本数」(2.2.2 で予感した直観)だった。未知数の個数 $n$ に対して制約が足りなければ、未知数を全方向から押さえ込むには至らない。$\boldsymbol{0}$ 以外にも自由に動ける方向が残る — それが自明でない解の正体である。

定理 2.3.3 (2) — 過小決定系の宿命

未知数の個数 $n$ に対して制約が足りない、典型的な状況がある。方程式の本数 $m$ がそもそも $n$ より少ない ときである。これを 過小決定系(under-determined system)と呼ぶ。

階数の基本不等式 $\mathrm{rank}(A) \le \min(m, n)$(2.2.2 の定理 2.2.2)を思い出そう。$m < n$ ならば

$$ \mathrm{rank}(A) \;\le\; m \;<\; n $$

よって $\mathrm{rank}(A) < n$ が無条件に成り立つ。これと定理 2.3.3 (1) を組み合わせれば、

定理 2.3.3 (2):$A$ が $m \times n$ 行列で $m < n$ ならば、同次方程式 $A\boldsymbol{x} = \boldsymbol{0}$ には 必ず自明でない解が存在する

「$m$ 個の方程式で $n$ 個の未知数を縛り切るのは原理的に不可能だ」という、ほとんど鳩ノ巣原理めいた直観の、最初の正式な定式化である。連立方程式の理論を貫く骨格のひとつ — 未知数の数が方程式より多ければ、必ず動ける方向が残る — が、ここでくっきりと姿を現す。

例題:過小決定系を解く

$2 \times 4$ の同次方程式を実際に解いてみよう。$m = 2 < 4 = n$ だから、定理 2.3.3 (2) より自明でない解が 必ず あるはずである。

$$ A = \begin{bmatrix} 1 & -1 & 0 & 2 \\\\ 2 & -1 & 1 & 5 \end{bmatrix} $$

同次形なので、$A$ だけを簡約化すればよい(右辺の $\boldsymbol{0}$ は動かない)。

第 2 行に第 1 行の $-2$ 倍を加える。

$$ \;\longrightarrow\; \begin{bmatrix} 1 & -1 & 0 & 2 \\\\ 0 & 1 & 1 & 1 \end{bmatrix} $$

第 1 行に第 2 行を加える。

$$ \;\longrightarrow\; \begin{bmatrix} 1 & 0 & 1 & 3 \\\\ 0 & 1 & 1 & 1 \end{bmatrix} $$

これで $A$ の簡約化は完了。$\mathrm{rank}(A) = 2$ で、主成分のある列は 第 1 列と第 2 列

主変数は $x_1, x_2$ である。

自由変数は $x_3, x_4$ で、値を任意に決めてよい。

簡約化された方程式は

$$ \begin{cases} x_1 + x_3 + 3 x_4 = 0 \\\\ x_2 + x_3 + x_4 = 0 \end{cases} $$

主変数について解くと

$$ \begin{cases} x_1 = - x_3 - 3 x_4 \\\\ x_2 = - x_3 - x_4 \end{cases} $$

自由変数を $x_3 = c_1,\ x_4 = c_2$ とパラメータ表示して、パラメータごとの項に分ければ

$$ \boldsymbol{x} = c_1 \begin{bmatrix} -1 \\\\ -1 \\\\ 1 \\\\ 0 \end{bmatrix} + c_2 \begin{bmatrix} -3 \\\\ -1 \\\\ 0 \\\\ 1 \end{bmatrix} \quad (c_1, c_2 \in \mathbb{R}) $$

パラメータをすべて $0$ にしたとき、解は $\boldsymbol{x} = \boldsymbol{0}$ — これが自明な解。

$(c_1, c_2)$ がそれ以外のどんな値をとっても、自明でない解が一つずつ得られる。たとえば

$$ (c_1, c_2) = (1, 0) \;\;\Longrightarrow\;\; \boldsymbol{x} = (-1, -1, 1, 0)^{\top} $$

これが、定理 2.3.3 (2) が約束する「方程式が足りない場合に必ず存在する自明でない解」の具体的な姿である。

観察:同次形では、解集合の表示に 特解の項がない(あるいは「特解は自明解 $\boldsymbol{0}$ そのもの」)。だから解集合は、純粋に 方向ベクトルだけの線型結合 として表される。これが「同次形」の本質的な単純さである。

非同次解との関係 — 2.3.1 で残した伏線の回収

ここで前回 2.3.1 の最後で残した伏線を回収しよう。

2.3.1 の例題では、非同次方程式

$$ A\boldsymbol{x} = \boldsymbol{b}, \quad A = \begin{bmatrix} 1 & 1 & 3 & 0 & 1 \\\\ 0 & 1 & 1 & 1 & 0 \\\\ 1 & 1 & 3 & 1 & -1 \end{bmatrix},\ \boldsymbol{b} = \begin{bmatrix} 4 \\\\ 6 \\\\ 9 \end{bmatrix} $$

の解として

$$ \boldsymbol{x} = \boldsymbol{p} + c_1 \boldsymbol{u} + c_2 \boldsymbol{w} $$

ただし

$$ \boldsymbol{p} = \begin{bmatrix} 3 \\\\ 1 \\\\ 0 \\\\ 5 \\\\ 0 \end{bmatrix},\quad \boldsymbol{u} = \begin{bmatrix} -2 \\\\ -1 \\\\ 1 \\\\ 0 \\\\ 0 \end{bmatrix},\quad \boldsymbol{w} = \begin{bmatrix} 1 \\\\ -2 \\\\ 0 \\\\ 2 \\\\ 1 \end{bmatrix} $$

を得た(本記事用に名前 $\boldsymbol{p}, \boldsymbol{u}, \boldsymbol{w}$ を割り当てた)。そのとき「方向ベクトル $\boldsymbol{u}$ と $\boldsymbol{w}$ は、対応する同次方程式 $A\boldsymbol{x} = \boldsymbol{0}$ の解になっている」と告げて伏線を残しておいた。

確かめてみよう。$A \boldsymbol{u}$ を計算すると

$$ A \boldsymbol{u} = \begin{bmatrix} 1 \cdot (-2) + 1 \cdot (-1) + 3 \cdot 1 + 0 \cdot 0 + 1 \cdot 0 \\\\ 0 \cdot (-2) + 1 \cdot (-1) + 1 \cdot 1 + 1 \cdot 0 + 0 \cdot 0 \\\\ 1 \cdot (-2) + 1 \cdot (-1) + 3 \cdot 1 + 1 \cdot 0 + (-1) \cdot 0 \end{bmatrix} = \begin{bmatrix} 0 \\\\ 0 \\\\ 0 \end{bmatrix} $$

確かに $A \boldsymbol{u} = \boldsymbol{0}$。同様に $A \boldsymbol{w} = \boldsymbol{0}$ も計算で確かめられる(各自で手を動かしてみてほしい)。方向ベクトルは同次方程式の解 だったのである。

これは偶然ではない。一般に次が成り立つ。

命題:$A\boldsymbol{x} = \boldsymbol{b}$ の二つの解 $\boldsymbol{y}$ と $\boldsymbol{z}$ について、その差 $\boldsymbol{y} - \boldsymbol{z}$ は 同次方程式 $A\boldsymbol{x} = \boldsymbol{0}$ の解 である。

理由は素直で、行列とベクトルの積の線型性(1.2.3)から

$$ A(\boldsymbol{y} - \boldsymbol{z}) = A\boldsymbol{y} - A\boldsymbol{z} = \boldsymbol{b} - \boldsymbol{b} = \boldsymbol{0} $$

となるから。

逆向きも成り立つ。$A\boldsymbol{x} = \boldsymbol{b}$ の特解 $\boldsymbol{p}$ と、同次解 $\boldsymbol{v}$(すなわち $A\boldsymbol{v} = \boldsymbol{0}$)をとれば

$$ A(\boldsymbol{p} + \boldsymbol{v}) = A\boldsymbol{p} + A\boldsymbol{v} = \boldsymbol{b} + \boldsymbol{0} = \boldsymbol{b} $$

なので、$\boldsymbol{p} + \boldsymbol{v}$ もまた $A\boldsymbol{x} = \boldsymbol{b}$ の解。

この二つを合わせると、解集合の構造が完全に見える。

構造定理:$A\boldsymbol{x} = \boldsymbol{b}$ が解をもつとき、その 解集合の全体 は、任意に取った特解 $\boldsymbol{p}$ と、同次方程式 $A\boldsymbol{x} = \boldsymbol{0}$ の 解集合 $\mathcal{N}$ を用いて

$$ \{ \boldsymbol{p} + \boldsymbol{v} \mid \boldsymbol{v} \in \mathcal{N} \} $$

と表される。

非同次方程式の解の集合は、同次方程式の解の集合を、特解 $\boldsymbol{p}$ だけ平行移動したもの である。これが、2.3.1 で予感した「アフィン構造」の正体である。

直観:$\mathcal{N}$ は原点 $\boldsymbol{0}$ を必ず含む(自明な解)。$\mathcal{N}$ は $\boldsymbol{0}$ を通る「平らな広がり」 — たとえば直線・平面 — のような姿をしている。非同次解集合は、この $\mathcal{N}$ をまるごと $\boldsymbol{p}$ という別の点に持ち上げた、もう一つの「平らな広がり」になる。形は同じで、位置だけがずれる — これがアフィン構造の幾何である。

「平らな広がり」「直線・平面のような姿」という言い回しの正式な意味は、第 4 章「ベクトル空間」で 部分空間 として定式化される。同次解集合 $\mathcal{N}$ はその典型例 — $A$ の 核(カーネル) と呼ばれる、線型代数の主役級の登場人物 — になる。

まとめ

  • 同次方程式:$A\boldsymbol{x} = \boldsymbol{0}$ の形。常に 自明な解 $\boldsymbol{x} = \boldsymbol{0}$ を持つ
  • 同次形では拡大係数行列を持ち出す必要がなく、$A$ そのものを簡約化すればよい($\mathrm{rank}([A \mid \boldsymbol{0}]) = \mathrm{rank}(A)$ が常に成り立つため)
  • 定理 2.3.3 (1):自明な解だけ ⟺ $\mathrm{rank}(A) = n$
  • 定理 2.3.3 (2):$m < n$ の 過小決定系 には必ず自明でない解がある
  • $A\boldsymbol{x} = \boldsymbol{b}$ の解集合 $=$ 任意の特解 $+$ $A\boldsymbol{x} = \boldsymbol{0}$ の解集合 — 非同次解の集合は同次解の集合を 平行移動した 姿(アフィン構造)

第 2 章 §2.3 の旅はこれで一段落。「行基本変形 → 簡約化 → 階数」という装置が、解の有無・自由度・構造のすべてを支配することを、私たちは目にした。

次回予告

次回 2.4「正則行列」では、これまで一般の $m \times n$ 行列で語ってきた話を、正方行列($m = n$)に絞り込む。

このとき、定理 2.3.3 (1) の条件 $\mathrm{rank}(A) = n$ は、正方行列にとって極めて特別な意味をもつ。$A$ が「逆行列をもつ」という、$A$ の素性に深く関わる性質と等価になるのである。

具体的には、正方行列 $A$ について

  • $\mathrm{rank}(A) = n$
  • $A\boldsymbol{x} = \boldsymbol{b}$ が任意の $\boldsymbol{b}$ に対して唯一の解を持つ
  • $A\boldsymbol{x} = \boldsymbol{0}$ の解は自明な解だけ
  • $A$ の簡約化は単位行列 $I_n$
  • $A$ には逆行列 $A^{-1}$ が存在する

という、まったく異なる出発点から眺めたはずの五つの条件が、すべて同じことを言っている という美しい等価関係が現れる。線型代数の風景が一段と立体的になる地点である。

未回収の問い — そして、最後の最大の問い

第 2 章の最後に置く未回収の問いは、表向き三つあるが、その奥で 一つの大きな問い に統合される。

  • $A\boldsymbol{x} = \boldsymbol{0}$ の解集合 $\mathcal{N}$ は「平らな広がり」と書いたが、その正式な意味は?(第 4 章「ベクトル空間」で 部分空間 として定式化される)
  • $\mathrm{rank}(A)$ や自由度 $n - \mathrm{rank}(A)$ は、何の量を測っているのか?(後述のとおり、それぞれ「像の大きさ」「核の大きさ」)
  • 行列 $A$ の階数は「行から見た独立な情報の本数」とも「列から見た独立な情報の本数」とも解釈できるが、両者は同じか?(同じ。これも第 4 章での重要な事実)

奥にある大きな問いとは、こうである。

行列 $A$ は、見た目は数の長方形だが、その実 $\boldsymbol{x} \mapsto A\boldsymbol{x}$ という 線型写像($\mathbb{R}^n$ から $\mathbb{R}^m$ への写像)を定めている(その気配は 1.4 で既に見えていた)。$A$ を線型写像として眺め直したとき、本記事と前記事 2.3.1 で扱ったすべての量が、写像論の言葉で一斉に読み直せる。

  • $\mathrm{rank}(A)$ は、写像の $\mathrm{Im}(A) = \{A\boldsymbol{x} \mid \boldsymbol{x} \in \mathbb{R}^n\}$ の「大きさ」(後で 次元)
  • $\mathcal{N}$ は、写像の $\ker(A) = \{\boldsymbol{x} \mid A\boldsymbol{x} = \boldsymbol{0}\}$ そのもの。自由度 $n - \mathrm{rank}(A)$ はその「大きさ」(次元)
  • 解の存在条件 $\mathrm{rank}(A) = \mathrm{rank}([A \mid \boldsymbol{b}])$ は、写像論の言葉では「$\boldsymbol{b}$ が像 $\mathrm{Im}(A)$ に入っているか」を問うこと
  • 構造定理「$A\boldsymbol{x} = \boldsymbol{b}$ の解集合 $=$ 特解 $+$ $\mathcal{N}$」は、写像論では「ファイバーは核を平行移動した姿」と言い換えられる

そして、像と核の二つの「大きさ」は、

$$ \dim \mathrm{Im}(A) + \dim \ker(A) = n $$

という一行 — 次元定理(別名 階数・退化次数定理) — に結ばれる。本記事と 2.3.1 で繰り返し書いた「$\mathrm{rank}(A) + (\text{自由度}) = n$」は、その次元定理が線型写像の言葉になる前の、行列のかたちでの先取り だったのである。

掃き出し法という素朴なアルゴリズムから出てきた数が、線型写像という抽象の舞台に上がったとき、写像の 構造そのもの を露わにする量に化ける — その全貌が開けるのは、第 4 章「ベクトル空間」と第 5 章「線型写像」を経たあとである。第 2 章はその風景の 入口 だった、と言い直してよい。


← 前の記事:2.3.1 解の有無と一意性 — 階数で読む三通りの運命
→ 次の記事:2.4.1 正則行列と逆行列 — 五つの顔をもつひとつの性質

解の有無と一意性 — 階数で読む三通りの運命

この記事でわかるようになること

  • 連立 1 次方程式 $A\boldsymbol{x}=\boldsymbol{b}$ の解の有無を、$\mathrm{rank}(A)$ と $\mathrm{rank}([A \mid \boldsymbol{b}])$ の比較だけで判定できる(定理 2.3.1)
  • 解があるとき、自由パラメータの個数が $n - \mathrm{rank}(A)$ 個で決まることを言える
  • 解が 唯一 であるための必要十分条件を、階数と未知数の個数の言葉で書き下せる(定理 2.3.2)
  • 三通りの場合分け(解なし / 解唯一 / 無限解)を、拡大係数行列の簡約化を経由して具体例で実演できる
  • パラメータ表示された解を、特解 $+$ 方向ベクトルの線型結合 という構造に書き換えられる

前提知識

  • 2.2.2「簡約化と階数」(階数の定義、定理 2.2.1 の存在・一意性)
  • 2.1「連立 1 次方程式の基本変形」(行基本変形と解集合の不変性)
  • 1.4.2「線型結合の視点」(列ベクトルの線型結合という見方)

現在地

  • 第2章「連立1次方程式」(全10章中)
    • 2.1 基本変形
    • 2.2 簡約な行列
    • 2.3 連立1次方程式を解く(全2記事)
      • 2.3.1 解の有無と一意性 ← いまここ
      • 2.3.2 同次方程式と過小決定系
    • 2.4 正則行列

問い

2.2 まで、私たちは「行列の側」の話だけをしてきた。簡約な行列を定義し、任意の行列を行基本変形で簡約化できることを示し、そこから階数 $\mathrm{rank}(A)$ という量を取り出した。

ここで第 2 章の出発点に立ち戻ろう。私たちが本当に解きたかったのは、連立 1 次方程式 $A\boldsymbol{x} = \boldsymbol{b}$ である。階数という量は、この問題に対していったい何を教えてくれるのか。

具体的に問うべきことは三つ。

  • 連立 1 次方程式に 解はあるのか、ないのか?何を見れば判定できる?
  • 解があったとして、それは 唯一 なのか、それとも 自由度 を持つのか?
  • どちらの問いも、簡単な計算 だけで決着がつくのか?

本記事は、これらの問いに対する答えがすべて「$\mathrm{rank}(A)$、$\mathrm{rank}([A \mid \boldsymbol{b}])$、未知数の個数 $n$ — この三つの数を比べるだけで決まる」という、目を見張るほど切れ味の鋭い結論にたどり着く。

拡大係数行列の階数が、まず何を測れるのか

連立 1 次方程式 $A\boldsymbol{x} = \boldsymbol{b}$ に対して、$A$ を $m \times n$ 行列(方程式の本数 $m$、未知数の個数 $n$)とする。これに対応する 拡大係数行列

$$ [A \mid \boldsymbol{b}] $$

という $m \times (n+1)$ 行列だった(1.4.1)。$A$ に右から $\boldsymbol{b}$ を 1 列足したもの — それが拡大係数行列である。

拡大係数行列に行基本変形を施しても、対応する連立方程式の 解集合は変わらない(2.1)。だから私たちは安心して $[A \mid \boldsymbol{b}]$ を簡約化し、その姿から解の運命を読み取ってよい。

ここで素朴な観察を一つ。

観察:$[A \mid \boldsymbol{b}]$ は $A$ にちょうど 1 列を加えただけの行列だから、その階数は $A$ の階数に対して 高々 1 だけ大きい。すなわち

$$ \mathrm{rank}(A) \;\le\; \mathrm{rank}([A \mid \boldsymbol{b}]) \;\le\; \mathrm{rank}(A) + 1 $$

理由は素直である。$[A \mid \boldsymbol{b}]$ を簡約化したとき、その左側 $n$ 列だけを見れば $A$ の簡約化が現れる(行基本変形は 列同士を混ぜない から、$[A \mid \boldsymbol{b}]$ に施した操作を左側 $n$ 列に限って眺めれば、それは $A$ に同じ操作を施したのと等価)。よって $A$ の主成分はそのまま $[A \mid \boldsymbol{b}]$ の主成分として残る。これで $\mathrm{rank}(A) \le \mathrm{rank}([A \mid \boldsymbol{b}])$。一方、新たに増えうる主成分は 最右列(第 $n+1$ 列)に立つもの だけ。簡約な行列の同じ列に主成分が二つ並ぶことはないから、増えても 1 個まで。これで $\mathrm{rank}([A \mid \boldsymbol{b}]) \le \mathrm{rank}(A) + 1$。

つまり起こりうるシナリオは 二つしかない

  • シナリオ A:$\mathrm{rank}([A \mid \boldsymbol{b}]) = \mathrm{rank}(A) + 1$ — 最右列に新しい主成分が立つ
  • シナリオ B:$\mathrm{rank}([A \mid \boldsymbol{b}]) = \mathrm{rank}(A)$ — 最右列には主成分が立たない

この二つのシナリオが、そのまま「解なし」と「解あり」の境目に対応する。

シナリオ A — 解なし

最右列に新たな主成分が立つというのは、簡約化のどこかにこんな形の行が現れるということ。

$$ \begin{bmatrix} 0 & 0 & \cdots & 0 & \mid & 1 \end{bmatrix} $$

(主成分は $1$ に揃えるのが簡約な行列の条件 (II) だった。)

この行に対応する方程式は

$$ 0 \cdot x_1 + 0 \cdot x_2 + \cdots + 0 \cdot x_n = 1 $$

である。左辺は $x_1, \ldots, x_n$ にどんな値を代入しても $0$ にしかならない。それが右辺の $1$ に等しくなることはない。この方程式を満たす $\boldsymbol{x}$ は存在しない。

行基本変形は解集合を保つから、もとの $A\boldsymbol{x} = \boldsymbol{b}$ にも解はない。

これで一つ、結論が出た。

定理 2.3.1:$n$ 変数の連立 1 次方程式 $A\boldsymbol{x} = \boldsymbol{b}$ が解をもつ必要十分条件は、

$$ \mathrm{rank}(A) = \mathrm{rank}([A \mid \boldsymbol{b}]) $$

「必要」の側はいま見たとおり($\mathrm{rank}([A \mid \boldsymbol{b}]) = \mathrm{rank}(A) + 1$ なら矛盾する方程式が現れる)。「十分」の側は、次節「シナリオ B」で実際に解を構成して示す。

例題:解なしの実演

具体的な行列で確かめよう。

$$ A = \begin{bmatrix} 1 & 2 & -1 \\\\ 2 & 5 & -1 \\\\ 1 & 3 & 0 \end{bmatrix}, \quad \boldsymbol{b} = \begin{bmatrix} 1 \\\\ 4 \\\\ 5 \end{bmatrix} $$

拡大係数行列を簡約化する。

$$ [A \mid \boldsymbol{b}] = \begin{bmatrix} 1 & 2 & -1 & \mid & 1 \\\\ 2 & 5 & -1 & \mid & 4 \\\\ 1 & 3 & 0 & \mid & 5 \end{bmatrix} $$

第 2 行に第 1 行の $-2$ 倍を、第 3 行に第 1 行の $-1$ 倍を加える。

$$ \;\longrightarrow\; \begin{bmatrix} 1 & 2 & -1 & \mid & 1 \\\\ 0 & 1 & 1 & \mid & 2 \\\\ 0 & 1 & 1 & \mid & 4 \end{bmatrix} $$

第 3 行から第 2 行を引く。

$$ \;\longrightarrow\; \begin{bmatrix} 1 & 2 & -1 & \mid & 1 \\\\ 0 & 1 & 1 & \mid & 2 \\\\ 0 & 0 & 0 & \mid & 2 \end{bmatrix} $$

ここで第 3 行が告げているのは

$$ 0 \cdot x_1 + 0 \cdot x_2 + 0 \cdot x_3 = 2 $$

という、いかなる $x_1, x_2, x_3$ をもってしても満たせない式である。

簡約化を最後まで進めれば、この $2$ は $1$ に正規化されて第 4 列の主成分となるが、解の有無の判定はここで既についている。$\mathrm{rank}(A) = 2$、$\mathrm{rank}([A \mid \boldsymbol{b}]) = 3$ で、両者が一致しないから 解なし

観察:この例のように、矛盾する行が見つかった時点で「解なし」は確定する。簡約な行列まで完全に持っていく必要はない。

シナリオ B — 解はある、では何個か?

階数が一致するとき — $\mathrm{rank}(A) = \mathrm{rank}([A \mid \boldsymbol{b}]) = r$ とおこう — 拡大係数行列の簡約化は、最右列に主成分をもたない。すなわち、すべての主成分が左側 $n$ 列のうちのどこかに収まっている。

主成分のある列に対応する変数たちと、ない列に対応する変数たちで、ふるまいが分かれる。

  • 主成分のある列に対応する変数(以下「主変数」と呼ぶ):その方程式の左辺の先頭で $1$ という係数を独占している
  • 主成分のない列に対応する変数(以下「自由変数」と呼ぶ):どの方程式の主成分にもなっていないので、値を任意に決めてよい

自由変数の値を任意に決めてしまえば、各方程式は「主変数 $=$(右辺)$-$(自由変数の式)」という形で主変数の値を一意に与える。

主変数の個数は $r$ 個、自由変数の個数は $n - r$ 個。これで 解は存在し、しかも 自由度は $n - r$ である。

例題:自由度ありの実演

具体例を見よう($3$ 本の方程式に未知数 $5$ 個の系である)。

$$ A = \begin{bmatrix} 1 & 1 & 3 & 0 & 1 \\\\ 0 & 1 & 1 & 1 & 0 \\\\ 1 & 1 & 3 & 1 & -1 \end{bmatrix}, \quad \boldsymbol{b} = \begin{bmatrix} 4 \\\\ 6 \\\\ 9 \end{bmatrix} $$

拡大係数行列を簡約化する。

$$ [A \mid \boldsymbol{b}] = \begin{bmatrix} 1 & 1 & 3 & 0 & 1 & \mid & 4 \\\\ 0 & 1 & 1 & 1 & 0 & \mid & 6 \\\\ 1 & 1 & 3 & 1 & -1 & \mid & 9 \end{bmatrix} $$

第 3 行に第 1 行の $-1$ 倍を加えて、第 1 列を整える。

$$ \;\longrightarrow\; \begin{bmatrix} 1 & 1 & 3 & 0 & 1 & \mid & 4 \\\\ 0 & 1 & 1 & 1 & 0 & \mid & 6 \\\\ 0 & 0 & 0 & 1 & -2 & \mid & 5 \end{bmatrix} $$

第 1 行に第 2 行の $-1$ 倍を加えて、第 2 列を整える。

$$ \;\longrightarrow\; \begin{bmatrix} 1 & 0 & 2 & -1 & 1 & \mid & -2 \\\\ 0 & 1 & 1 & 1 & 0 & \mid & 6 \\\\ 0 & 0 & 0 & 1 & -2 & \mid & 5 \end{bmatrix} $$

第 1 行に第 3 行を加え、さらに第 2 行に第 3 行の $-1$ 倍を加えて、第 4 列を整える。

$$ \;\longrightarrow\; \begin{bmatrix} 1 & 0 & 2 & 0 & -1 & \mid & 3 \\\\ 0 & 1 & 1 & 0 & 2 & \mid & 1 \\\\ 0 & 0 & 0 & 1 & -2 & \mid & 5 \end{bmatrix} $$

これで簡約化は完了。最右列には主成分がないから、$\mathrm{rank}(A) = \mathrm{rank}([A \mid \boldsymbol{b}]) = 3$ で、解は存在する。未知数の個数は $n = 5$ なので、自由度は $5 - 3 = 2$ になるはず。確かめよう。

主成分のある列は 第 1 列、第 2 列、第 4 列 で、これに対応する変数 $x_1, x_2, x_4$ が主変数となる。

残る変数 $x_3, x_5$ が自由変数で、値を任意に決めてよい。

簡約化の各行に対応する方程式を読むと

$$ \begin{cases} x_1 + 2 x_3 - x_5 = 3 \\\\ x_2 + x_3 + 2 x_5 = 1 \\\\ x_4 - 2 x_5 = 5 \end{cases} $$

主変数について解けば

$$ \begin{cases} x_1 = 3 - 2 x_3 + x_5 \\\\ x_2 = 1 - x_3 - 2 x_5 \\\\ x_4 = 5 + 2 x_5 \end{cases} $$

自由変数を $x_3 = c_1,\ x_5 = c_2$ とパラメータ表示すれば

$$ \boldsymbol{x} = \begin{bmatrix} x_1 \\\\ x_2 \\\\ x_3 \\\\ x_4 \\\\ x_5 \end{bmatrix} = \begin{bmatrix} 3 - 2 c_1 + c_2 \\\\ 1 - c_1 - 2 c_2 \\\\ c_1 \\\\ 5 + 2 c_2 \\\\ c_2 \end{bmatrix} \quad (c_1, c_2 \in \mathbb{R}) $$

これが解のすべて。$c_1, c_2$ を実数全体にわたって動かしたとき、上の右辺がたどる集合がそのまま解集合である。

解を「特解 + 方向ベクトルの線型結合」で読む

上の解は、もう一段読みやすい姿に書き換えられる。$c_1, c_2$ で展開して、定数項とパラメータごとの項に分けると

$$ \boldsymbol{x} = \begin{bmatrix} 3 \\\\ 1 \\\\ 0 \\\\ 5 \\\\ 0 \end{bmatrix} + c_1 \begin{bmatrix} -2 \\\\ -1 \\\\ 1 \\\\ 0 \\\\ 0 \end{bmatrix} + c_2 \begin{bmatrix} 1 \\\\ -2 \\\\ 0 \\\\ 2 \\\\ 1 \end{bmatrix} \quad (c_1, c_2 \in \mathbb{R}) $$

となる。これは「特解 $+$ 方向ベクトルの線型結合」という構造を持っている。

第 1 項は、パラメータをすべて $0$ にしたときに得られる、$A\boldsymbol{x} = \boldsymbol{b}$ の代表的な解の一つ。これを 特解 と呼ぶ。

第 2、3 項は、$c_1, c_2$ を動かすと「解と解のあいだ」を移動する方向を与える。これらの方向ベクトルそのものは、後で見るとおり 同次方程式 $A\boldsymbol{x} = \boldsymbol{0}$ の解 になっている(次回 2.3.2 で扱う)。

直観的には、解集合は「ある一点を通り、いくつかの方向に広がる平らな広がり」のような姿をしている。$n - \mathrm{rank}(A)$ 本の方向ベクトルが「広がり」を張っている、というかたちである。

補足:アフィン部分空間とは:本記事の本論には必要ないが、線型代数を読み進めるとよく出会う言葉なので、ここで通しておく。

ベクトル空間内で、原点 $\boldsymbol{0}$ を通る「平らな広がり」(和とスカラー倍について閉じたもの)を 部分空間 という。直線・平面などが具体例。これに対して アフィン部分空間 とは、部分空間をまるごと平行移動して、原点ではない別の点を起点に据え直したものを指す。原点を含むかどうかが両者の分かれ目で、原点を含むアフィン部分空間が部分空間そのもの(平行移動量が $\boldsymbol{0}$)になる。

上の解集合は、まさに アフィン部分空間 の典型例。「特解という起点 $+$ 方向ベクトルが張る広がり」という姿が、それに当たる。正式な定義は第 4 章「ベクトル空間」で扱う。

解は何個ある? — 一意性の判定

シナリオ B では、自由変数の個数 $n - r$ が解の自由度を与えた。だから

  • $n - r > 0$ なら、自由パラメータがあって 解は無限個
  • $n - r = 0$、すなわち $r = n$ なら、自由パラメータがなくて 解はちょうど 1 個

これと定理 2.3.1 を組み合わせれば、一意性の必要十分条件が得られる。

定理 2.3.2:$n$ 変数の連立 1 次方程式 $A\boldsymbol{x} = \boldsymbol{b}$ が解を 唯一 もつ必要十分条件は、

$$ \mathrm{rank}(A) = \mathrm{rank}([A \mid \boldsymbol{b}]) = n $$

三通りの運命に整理する

これで第 2 章の最初の山頂が見える。連立 1 次方程式 $A\boldsymbol{x} = \boldsymbol{b}$ の解の運命は、$\mathrm{rank}(A)$、$\mathrm{rank}([A \mid \boldsymbol{b}])$、$n$ の三つの整数の比較だけで、次の三通りに完全に分かれる。

場合 階数の関係 解の様相
(i) $\mathrm{rank}(A) \neq \mathrm{rank}([A \mid \boldsymbol{b}])$ 解なし
(ii) $\mathrm{rank}(A) = \mathrm{rank}([A \mid \boldsymbol{b}]) = n$ 解はちょうど 1 個
(iii) $\mathrm{rank}(A) = \mathrm{rank}([A \mid \boldsymbol{b}]) < n$ 無限個の解(自由度 $n - \mathrm{rank}(A)$)

第 2 章の前半でひたすら準備してきた「行基本変形」「簡約化」「階数」という装置は、すべてこの一覧表のためにあったと言ってよい。係数を眺めるだけでは見えない解の運命が、たった三つの整数の比較から決まる — これが線型代数の最初のクライマックスである。

観察:基本不等式 $\mathrm{rank}(A) \le \min(m, n)$(2.2.2 の定理 2.2.2)を思い出すと、$\mathrm{rank}(A) = n$ が成立するためには $m \ge n$(方程式の本数が未知数の個数以上)が必要だとわかる。直観に合う:未知数より少ない方程式では、未知数を縛り切れない。

特に $m < n$(方程式が足りない、いわゆる過小決定系)では、解があれば必ず無限個ある。これを「過小決定系の宿命」として、次回 2.3.2 で同次形 $A\boldsymbol{x} = \boldsymbol{0}$ の文脈で深掘りする。

一段引いて — 階数は何の量だったのか

ここで一度立ち止まる。本記事の例題で、簡約化された拡大係数行列をじっと眺めてみると、そこには 三種類の情報 が同時に詰まっていた。

  • 解の有無の判定($\mathrm{rank}$ どうしの比較)
  • 解の自由度($n - \mathrm{rank}(A)$)
  • 具体解そのもの(主変数を自由変数で表したパラメータ表示、さらにその特解 $+$ 方向ベクトル展開)

階数を見出すことに、どういう意味があるのか?」 — まずは目に見える層から答えよう。同じ簡約化が、判定・自由度・具体解の三つを同時に手渡している。階数を読み取ることと、解そのものを構成することは、別作業ではなく、同じ一つの計算の別の側面 に過ぎない。

それより、もう一段奥がある。階数 $\mathrm{rank}(A)$、自由度 $n - \mathrm{rank}(A)$、そして方向ベクトル — これらはどれも 行列 $A$ そのものに内在する性質 であって、簡約化という計算の副産物ではない。簡約化のやり方は無数にあるが、そのどれを選んでも同じ値・同じ姿に着地する(2.2.2 の定理 2.2.1 の一意性が、これを保証していた)。$\boldsymbol{b}$ に依存して変わるのは 特解 だけで、それも「解集合という平らな広がりを、空間のどこに置くか」を決めているに過ぎない。

掃き出し法は、計算の道具に見えて、その実 $A$ にもとから備わっている量を目に見える座標で表に出す観察手段である。「$\mathrm{rank}(A)$ は掃き出し法を一回やってみないとわからないもの」という短絡的な見方は、本当は逆 — $\mathrm{rank}(A)$ は $A$ から最初から決まっていて、掃き出し法はそれを視認可能にする道具にすぎない

直観(将来の伏線):$A$ は単なる数の長方形ではなく、$\boldsymbol{x} \mapsto A\boldsymbol{x}$ という 線型写像 を定めている(その気配は 1.4 の段階で既に見えていた)。第 4 章「ベクトル空間」と第 5 章「線型写像」では、本記事で扱った $\mathrm{rank}(A)$ と自由度 $n - \mathrm{rank}(A)$ が、それぞれ写像の の「大きさ」(次元)として再登場し、両者は

$$ \dim \mathrm{Im}(A) + \dim \ker(A) = n $$

という一行(次元定理、または 階数・退化次数定理)に結ばれることになる。本記事で書いた「$\mathrm{rank}(A) + (\text{自由度}) = n$」は、その線型写像の言葉になる前の、行列のかたちでの先取りである。

まとめ

  • $A\boldsymbol{x} = \boldsymbol{b}$ の 解の有無と自由度 は、$\mathrm{rank}(A)$ と $\mathrm{rank}([A \mid \boldsymbol{b}])$ と未知数の個数 $n$ の比較だけで決まる
  • 定理 2.3.1:解をもつ ⟺ $\mathrm{rank}(A) = \mathrm{rank}([A \mid \boldsymbol{b}])$
  • 定理 2.3.2:解が唯一 ⟺ $\mathrm{rank}(A) = \mathrm{rank}([A \mid \boldsymbol{b}]) = n$
  • 解の運命は 三通り — 解なし / 解唯一 / 無限解(自由度 $n - r$)
  • 解集合は、特解 $+$ 方向ベクトルの線型結合という アフィン構造 をもつ

行列を $m \times n$ の数の長方形として手にとり、行基本変形で整え、簡約化から階数を読み、それを $n$ と比べる — この一連の流れが、連立方程式の解の姿を完全に決定する。視点の高さがいきなり一段上がったのが、お分かりだろうか。

次回予告

次回 2.3.2「同次形と過小決定系」(仮題)では、定数項が $\boldsymbol{0}$ である特別な連立方程式

$$ A\boldsymbol{x} = \boldsymbol{0} $$

を扱う。この 同次形 には常に「自明な解」$\boldsymbol{x} = \boldsymbol{0}$ が含まれるので、解の有無は問題ではない。問うべきは「自明でない解 はあるか」である。

そしてこの記事の末尾で予告した 過小決定系($m < n$、すなわち方程式の本数が未知数の個数より少ないとき)に焦点を当て、

$$ m < n \;\Longrightarrow\; A\boldsymbol{x} = \boldsymbol{0} \text{ には自明でない解が必ずある} $$

という強烈な事実(定理 2.3.3)を確かめる。鳩ノ巣的な「未知数が多すぎれば縛り切れない」という直観の、最初の正式な定式化である。

未回収の問い

  • 解集合が「特解 $+$ 線型結合」で書けるのはなぜか?この アフィン構造 は同次形の解集合とどう関係するのか?(次回 2.3.2 で部分的に回収)
  • 「自由変数」と「主変数」の役割分担は、本質的なものなのか、それとも変数の番号付けに依存するのか?(主成分の 位置 は階数の議論で一意に決まるが、変数そのものの解釈は番号付けに依る。第 4 章「ベクトル空間」での座標の議論で再訪)
  • 階数 $\mathrm{rank}(A) = n$ という条件は、特に $A$ が 正方行列($m = n$)のとき何を意味するのか?(節を改めた 2.4「正則行列」のテーマ)

← 前の記事:2.2.2 簡約化と階数 — 終着点の存在・一意性と、そこから生まれる数
→ 次の記事:2.3.2 同次方程式と過小決定系 — 自明な解の周りに広がる方向

簡約な行列の定義 — 終着点の形を 4 条件で言い当てる

この記事でわかるようになること

  • 任意の行列を行基本変形で簡約な行列に直す アルゴリズム を、自分の手で動かせる
  • 「任意の行列が簡約化できる」「簡約化は一意」という主張(定理 2.2.1)を、その射程と限界を理解したうえで使える
  • 行列の 階数(ランク) を、簡約化を経由する形で定義できる
  • $\mathrm{rank}(A) \le m,\ \mathrm{rank}(A) \le n$ という基本不等式が、なぜ自然に出てくるかを言える

前提知識

  • 2.2.1「簡約な行列の定義」(主成分・4 条件)
  • 2.1「連立 1 次方程式の基本変形」(行基本変形)

現在地

  • 第2章「連立1次方程式」(全10章中)
    • 2.1 基本変形
    • 2.2 簡約な行列(全2記事)
      • 2.2.1 簡約な行列の定義
      • 2.2.2 簡約化と階数 ← いまここ
    • 2.3 連立1次方程式を解く
    • 2.4 正則行列

問い

前回 2.2.1 では「簡約な行列」を 4 条件で言い当てた。これで「終着点の形」が何かは分かった。だが、もう一段の問いが残っている。

  • 任意の 行列を、行基本変形だけでこの終着点まで持ち込めるのか?
  • 持ち込んだとして、その終着点は 計算の進め方によらず一つに定まる のか?それとも、選び方ごとに違う形に着地し得るのか?
  • 終着点が一意だとすれば、そこから自然に出てくる「行列の量」は何か?

本記事はこれら三つに答える。存在(終着点に必ず行ける)と 一意性(行き先はひとつしかない)、そして両者が組み合わさって生まれる新しい量 — 階数(ランク) が、本記事のゴールである。

簡約化のアルゴリズム — 具体例で歩く

まず、典型的な行列ひとつを行基本変形で簡約な行列にしてみよう。

$$ \begin{bmatrix} 0 & 0 & 2 & -6 & 8 \\\\ 0 & 1 & 1 & -4 & 6 \\\\ 0 & 2 & 1 & -5 & 8 \end{bmatrix} $$

最も左の非零列はどれかを見ると、第 1 列はすべて $0$、第 2 列に非零成分が現れる。第 2 列に主成分を持ちうる行(零でない行)のうち、主成分が最も左にある行は、第 2 行と第 3 行(主成分はいずれも第 2 列)。第 1 行は主成分が第 3 列にあって、これらより右である。

第 2 行をいまの第 1 行に移動するため、第 1 行と第 2 行を入れ替える

$$ \;\longrightarrow\; \begin{bmatrix} 0 & 1 & 1 & -4 & 6 \\\\ 0 & 0 & 2 & -6 & 8 \\\\ 0 & 2 & 1 & -5 & 8 \end{bmatrix} $$

第 1 行の主成分は第 2 列の $1$。第 1 行を使って、他の行の第 2 列を $0$ にする。第 3 行に第 1 行の $-2$ 倍を加える(第 2 行の第 2 列は既に $0$)。

$$ \;\longrightarrow\; \begin{bmatrix} 0 & 1 & 1 & -4 & 6 \\\\ 0 & 0 & 2 & -6 & 8 \\\\ 0 & 0 & -1 & 3 & -4 \end{bmatrix} $$

第 1 行は完成。次に、第 2 行以下 だけを対象にして、同じ手順を繰り返す。第 2 行・第 3 行の主成分はいずれも第 3 列にある。第 2 行を $1/2$ 倍 して主成分を $1$ に揃える。

$$ \;\longrightarrow\; \begin{bmatrix} 0 & 1 & 1 & -4 & 6 \\\\ 0 & 0 & 1 & -3 & 4 \\\\ 0 & 0 & -1 & 3 & -4 \end{bmatrix} $$

第 2 行の主成分は第 3 列の $1$。第 2 行を使って、他の行の第 3 列を $0$ にする。第 1 行に第 2 行の $-1$ 倍を、第 3 行に第 2 行の $+1$ 倍を加える。

$$ \;\longrightarrow\; \begin{bmatrix} 0 & 1 & 0 & -1 & 2 \\\\ 0 & 0 & 1 & -3 & 4 \\\\ 0 & 0 & 0 & 0 & 0 \end{bmatrix} $$

これは簡約な行列である。第 1 行・第 2 行の主成分はそれぞれ $(1, 2),\ (2, 3)$ で、列番号は $2 < 3$ と単調増加、各主成分の列の他成分は $0$、零行は最下層。第 3 行は計算の途中で零ベクトルになった。

アルゴリズムの一般化

いま行ったのは、次のような繰り返し手続きである。

  1. 行列の 零行 があれば、行入れ替えで最下層に集める。
  2. 残りの非零行のうち、主成分が最も左にある行 をひとつ選び、必要なら入れ替えて先頭(まだ確定していない一番上の行)に移す。
  3. その行の主成分を、$0$ でない倍で割って $1$ に揃える。
  4. その行の何倍かを他のすべての行に加えて、その主成分のある列の他成分を $0$ にする。
  5. 確定した先頭行の 下に残る行たち を相手に、手順 2 から再開する。

非零行の数は有限だから、この手続きは必ず止まる。止まったとき、得られた行列は簡約な行列の 4 条件をすべて満たす。

観察:この手続きは、各ステップで「次の主成分の場所」を決定的に絞り込みつつ、4 条件を一つずつ確定させていく。(I) は手順 1 が、(II) は手順 3 が、(III) は手順 2(主成分が最も左にある行を先頭に置く)と手順 4(その列の他成分を $0$ で払う)の併せ技が、(IV) は手順 4 が、それぞれ担っている。

これは、任意の行列が簡約な行列に変形できる 構成的な証拠 にもなっている。

定理 2.2.1 — 存在と一意性

以上で「存在」は言えた。だが、簡約化は一通りなのか? という疑問はまだ残っている。手順 2 で「最も左にある主成分の行」が複数あれば、どれを選んでもよい。手順 4 のあいだに行を別の順序で操作してもよい。これらの自由度は、最終的にどんな形に着地するかに影響しないのだろうか?

結論から言えば、影響しない。

定理 2.2.1:任意の行列は、行基本変形を繰り返すことによって簡約な行列に変形できる(存在)。さらに、与えられた行列の簡約な行列は一意に定まる(一意性)。

存在の方は、いま示したアルゴリズムが構成的に証明している。一意性の方は、本記事の段階では証明できない。本格的な証明は、第 4 章「ベクトル空間」で線型独立性の言葉を整えた後に与えられる。ここではいったん主張として受け入れてほしい。

なぜ証明を持ち越すかというと、一意性の心臓部は「簡約な行列のかたち(主成分の位置と、主成分でない成分の値)が、行列のもっと内在的な構造 — 線型独立な行/列の取り方 — から一意に決まる」という事実だからである。基本変形だけを道具にした初等的な議論では、なかなか手の届かないところにある。

行列の簡約化、という言葉

「簡約化できる」と何度も言ってきたが、これに正式な名前を与えておく。

定義(簡約化):行列 $A$ に行基本変形を繰り返し施して簡約な行列 $B$ を得ることを、「$A$ を簡約化する」という。得られた $B$ を $A$ の簡約化 と呼び、本記事ではしばしば $A$ の簡約化を $B$ と書く。

定理 2.2.1 によって、$A$ の簡約化 $B$ は $A$ から一意に定まる。これは「$B$ は $A$ 固有のもの」だということ — 計算の手筋が違っても、最後にたどり着く $B$ は同じである。本記事以降、単に「行列 $A$ の簡約化」と言ったら、この一意に定まった $B$ を指す。

階数 — 簡約化が連れてくる数

簡約化が一意に定まる、ということは、簡約化から読める すべての量 が「行列 $A$ 固有のもの」になる、ということでもある。最も基本的な量がこれ。

定義(階数):行列 $A$ の簡約化を $B$ とするとき、$B$ の 零でない行の個数 を $A$ の 階数 または ランク と呼び、$\mathrm{rank}(A)$ と書く。

定理 2.2.1 の一意性によって、$\mathrm{rank}(A)$ は計算の進め方によらない。$A$ から決まる量である。

階数には別の見方もある。簡約な行列の主成分は各行に高々 1 つで、零でない行の個数と主成分の個数は等しい。さらに条件 (III) によって、それぞれの主成分は 異なる列 に属する。よって

$$ \mathrm{rank}(A) = (B \text{ の主成分の個数}) = (B \text{ の主成分を含む列の個数}) $$

がいずれも成り立つ。

直観:$\mathrm{rank}(A)$ は、行列 $A$ が連立方程式に課す 独立な制約の本数 だと思える。零行は「制約として何も言っていない」行、主成分の現れる行は「新しい制約を一つ持ち込んでいる」行 — その数を数えたものが階数である。

この「独立」の意味は、第 4 章で 線型独立 として正式に定式化される。それまで、本シリーズでの階数は「簡約化後の零でない行の個数」というアルゴリズム的な定義で受け取ってほしい。

階数の基本不等式

階数の定義から、ほとんどおまけのように出てくる事実がある。

定理 2.2.2:$A$ が $m \times n$ 行列ならば

$$ \mathrm{rank}(A) \le m, \quad \mathrm{rank}(A) \le n $$

すなわち、$\mathrm{rank}(A) \le \min(m, n)$。

理由:$A$ の簡約化 $B$ もやはり $m \times n$ 行列。$\mathrm{rank}(A)$ は $B$ の零でない行の個数だから、行の総数 $m$ を超えられない。同時に、$\mathrm{rank}(A)$ は $B$ の主成分を含む列の個数でもあり、それぞれの主成分は異なる列にあるから、列の総数 $n$ も超えられない。

観察:この基本不等式は、すぐ後の 2.3「連立 1 次方程式を解く」で、解の存在・自由度を判定する道具として効いてくる。$\mathrm{rank}(A) = n$ なら未知数を縛り切る制約があり解が一意に決まる、$\mathrm{rank}(A) < n$ なら自由度が残る、というかたちで現れる。

まとめ

  • 任意の行列は、行基本変形を繰り返して簡約な行列に変形できる(簡約化)。アルゴリズムは「左の列から順に主成分を立て、その列の他成分を $0$ で払う」操作の繰り返し
  • 定理 2.2.1:任意の行列は簡約化できる(存在、本記事のアルゴリズムで構成的に示した)。さらに、その簡約化は一通りに定まる(一意性、完全証明は第 4 章へ)
  • 簡約化が一意だから、そこから読める量はすべて行列固有のものになる。最も基本的なのが 階数 $\mathrm{rank}(A)$ — 簡約化後の零でない行の個数(= 主成分の個数)
  • 定理 2.2.2:$A$ が $m \times n$ 行列なら $\mathrm{rank}(A) \le m,\ \mathrm{rank}(A) \le n$

行列を「数の長方形」として手に取り、行基本変形で整え、最後にひとつの数 — 階数 — を読み取る。長方形 → 形 → 数、という流れが見えるようになった。

次回予告

次回 2.3「連立 1 次方程式を解く」では、いよいよ拡大係数行列の階数と未知数の本数 $n$ を比較することで、連立 1 次方程式の 解の有無自由度 が判定できるようになる。具体的には次の三通りに分かれる。

  • $\mathrm{rank}(A) \neq \mathrm{rank}([A \mid \boldsymbol{b}])$ なら 解なし
  • $\mathrm{rank}(A) = \mathrm{rank}([A \mid \boldsymbol{b}]) = n$ なら 解は唯一
  • $\mathrm{rank}(A) = \mathrm{rank}([A \mid \boldsymbol{b}]) < n$ なら 無限に解がある(自由度 $n - \mathrm{rank}(A)$)

これが、第 2 章前半で積み上げてきた装置の最終的な使い道である。

未回収の問い

  • 簡約化の一意性は、なぜ成り立つのか?(第 4 章「ベクトル空間」で、線型独立な行/列の最大個数の不変性として証明される)
  • 階数が「独立な制約の本数」だ、という直観の 独立 は、厳密には何を意味するのか?(第 4 章「線型独立と線型従属」で正式化)
  • 階数は、行から見た数なのか、列から見た数なのか?(両方から見ても同じ。これも第 4 章での重要な事実)

← 前の記事:2.2.1 簡約な行列の定義 — 終着点の形を 4 条件で言い当てる
→ 次の記事:2.3.1 解の有無と一意性 — 階数で読む三通りの運命

連立 1 次方程式の基本変形 — 解集合を保ったまま、行列の操作へ

この記事でわかるようになること

  • 連立 1 次方程式に対する 3 種の基本変形 を、自分の言葉で書き下せる
  • なぜ基本変形が「解集合を保つ」のか、可逆性の言葉で説明できる
  • 掃き出し法 という呼び名の由来が言える
  • 拡大係数行列に対する 行基本変形 が、方程式側の基本変形とぴったり対応していることを言える
  • 拡大係数行列の行基本変形だけで、3 元連立 1 次方程式を実際に解ける

前提知識

  • 1.4.1「連立 1 次方程式の行列表現」(係数行列・拡大係数行列)
  • 1.2.2「行列の積」

現在地

  • 第2章「連立1次方程式」(全10章中)
    • 2.1 基本変形 ← いまここ
    • 2.2 簡約な行列
    • 2.3 連立1次方程式を解く
    • 2.4 正則行列

問い

前章 1.4.2 で、連立 1 次方程式 $A\boldsymbol{x} = \boldsymbol{b}$ は「$\boldsymbol{b}$ を $A$ の列ベクトルの線型結合で表す問題」だと読み替えた。視点は変わったが、実際にどう解くか にはまだ手をつけていない。

中学・高校では、連立方程式を「式を何倍かする」「式を入れ替える」「他の式の何倍かを加える」といった操作で解いてきた。手は動くが、次の問いは残ったままだ。

  • 何種類の操作で十分なのか?
  • これらの操作は、いったい 何を保ち、何を変えている のか?
  • 操作を「方程式」ではなく「行列」の側で行うことはできるのか?できるなら、どう対応するのか?

ここで 解集合 という言葉を一度断っておく。連立方程式の解集合とは、その連立方程式の式すべてを同時に満たす未知数の組のすべて からなる集合のことである。$(x, y)$ や $(x, y, z)$ など、未知数の組をひとつの「解」とみなし、その解を集めた集合だと思えばよい。解集合は 1 組だけのこともあれば、空(=解なし)のことも、無限個の組からなることもある。連立方程式を「解く」とは、最終的にこの解集合を読み取れる形まで姿を整えてやることに他ならない。

本記事は、冒頭の三つの問いに正面から答える。終わったとき、私たちの手元には 解集合を一切変えずに連立方程式の姿を整える、機械的な道具立て が残る。

加減で解いてみる

具体例で始めよう。

$$ (\mathrm{I})\quad \begin{cases} 3x + 2y = 12 \\\\ x + y = 5 \end{cases} $$

ふだん中学・高校でやるとおりに、機械的な代入は使わず、式の加減と入れ替えだけで解いてみる。

(I) → (II):第 1 式に第 2 式の $-3$ 倍を加える。

$$ (\mathrm{II})\quad \begin{cases} -y = -3 \\\\ x + y = 5 \end{cases} $$

これで第 1 式から $x$ が消えた。

(II) → (III):第 2 式に第 1 式を加える。

$$ (\mathrm{III})\quad \begin{cases} -y = -3 \\\\ x = 2 \end{cases} $$

第 2 式から $y$ が消え、$x = 2$ が確定した。

(III) → (IV):体裁を整えるために、第 1 式と第 2 式を入れ替える。

$$ (\mathrm{IV})\quad \begin{cases} x = 2 \\\\ -y = -3 \end{cases} $$

(IV) → (V):第 2 式の両辺に $-1$ を掛ける。

$$ (\mathrm{V})\quad \begin{cases} x = 2 \\\\ y = 3 \end{cases} $$

$(x, y) = (2, 3)$ が解である。もとの (I) に代入すれば、たしかに両辺が成り立つ。

ここで一度立ち止まる。やったことをよく見てみよう。(I) → (V) のあいだで使った操作は、つきつめると 3 種類しかない

  1. 1 つの式を、$0$ でない数で 何倍かする — 本文では (IV) → (V) で第 2 式に $-1$ を掛けた
  2. 2 つの式を 入れ替える — 本文では (III) → (IV)
  3. 1 つの式に、別の式の 何倍かを加える — 本文では (I) → (II) と (II) → (III)

これだけで、連立方程式の解が手元に出てきた。

連立 1 次方程式の基本変形

いま使った 3 つの操作に名前を与える。

定義(基本変形):連立 1 次方程式に対する次の 3 種の操作を 基本変形 という。

  1. 1 つの式を $0$ でない数で何倍かする
  2. 2 つの式を入れ替える
  3. 1 つの式に、別の式の何倍かを加える

「3 種で十分」というのは、いまは天下りに見えるかもしれない。だが、後で行列の言葉に翻訳すると、この 3 操作だけで 連立方程式の係数を「ぱっと解が読める形」にまで整理できる ことがはっきり見えてくる。整理の終着点は、次の節 2.2「簡約な行列」で正式化する。

解集合は不動 — 掃き出し法

基本変形は、解集合をいじっていない。これが本記事の心臓部である。

主張:基本変形を施した連立方程式と、もとの連立方程式は、同じ解集合をもつ(=同値である)。

理由:鍵になるのは 可逆性 である。3 種の基本変形には、それぞれ「逆向きの基本変形」が存在し、もとに戻せる。

操作 逆向きの操作
第 $i$ 式を $c \neq 0$ 倍する 第 $i$ 式を $1/c$ 倍する
第 $i$ 式と第 $j$ 式を入れ替える もう一度、第 $i$ 式と第 $j$ 式を入れ替える
第 $i$ 式に第 $j$ 式の $c$ 倍を加える 第 $i$ 式に第 $j$ 式の $-c$ 倍を加える

この可逆性から、次の事実が出る。連立方程式 $S$ に基本変形を施して $S'$ を得たとする。

  • もし $\boldsymbol{x}$ が $S$ の解なら、$\boldsymbol{x}$ は $S'$ の解でもある。なぜなら、$S'$ の各式は $S$ の式の倍数や和としてできているから、$S$ を満たすものは $S'$ を自動的に満たす。
  • 逆に、$\boldsymbol{x}$ が $S'$ の解なら、$\boldsymbol{x}$ は $S$ の解でもある。基本変形が可逆だから、$S'$ から $S$ への基本変形が存在し、上の議論を逆向きに適用できる。

ゆえに $S$ と $S'$ の解集合は完全に一致する。これを繰り返せば、何度基本変形を重ねても解集合は不動だ、と言える。

観察:基本変形は、連立方程式の 服を着替える だけで、本人(=解集合)は変わらない。私たちが操っているのは式の見え方であって、解そのものではない。

この事実が分かれば、次の戦略が成り立つ。

基本変形を繰り返して、連立方程式を「ぱっと解が読める形」にまで整える。読み取った解は、もとの連立方程式の解でもある。

これが、次の名前で呼ばれる解法の正体である。

定義(掃き出し法):連立 1 次方程式に基本変形を繰り返し施して解を求める方法を、掃き出し法 という。

「掃き出し」というのは、式の中の不要な変数を 箒で掃き出すように 一つずつ消していくイメージから来ている。先ほどの (I) → (V) の流れも、まさに変数を順番に追い出していった作業だった。掃き出し法の正当化は、いま示した「基本変形は解集合を保つ」という事実そのものである。安心して操作してよい

行列の言葉に翻訳する

ここまでは「連立方程式」の側で操作してきた。だが 1.4.1 で見たとおり、連立方程式は拡大係数行列という形に圧縮できた。同じ操作を、行列の側で行えないだろうか?

先ほどの (I) → (V) を、拡大係数行列の側に翻訳してみる。出発点 (I) の拡大係数行列は

$$ \begin{bmatrix} 3 & 2 & 12 \\\\ 1 & 1 & 5 \end{bmatrix} $$

である。第 1 式に第 2 式の $-3$ 倍を加える 操作は、そのまま 第 1 行に第 2 行の $-3$ 倍を加える 操作に翻訳される。

$$ \begin{bmatrix} 3 & 2 & 12 \\\\ 1 & 1 & 5 \end{bmatrix} \;\longrightarrow\; \begin{bmatrix} 0 & -1 & -3 \\\\ 1 & 1 & 5 \end{bmatrix} $$

同じ要領で、(II) → (III) → (IV) → (V) を行列の側で行うと、次の流れになる。

$$ \begin{bmatrix} 0 & -1 & -3 \\\\ 1 & 1 & 5 \end{bmatrix} \;\longrightarrow\; \begin{bmatrix} 0 & -1 & -3 \\\\ 1 & 0 & 2 \end{bmatrix} \;\longrightarrow\; \begin{bmatrix} 1 & 0 & 2 \\\\ 0 & -1 & -3 \end{bmatrix} \;\longrightarrow\; \begin{bmatrix} 1 & 0 & 2 \\\\ 0 & 1 & 3 \end{bmatrix} $$

最後の行列は、連立方程式 ${x = 2,\ y = 3}$ にそのまま対応する。行を眺めるだけで解が読める 形まで整理されている。

ここで重要な観察がある。式の側の 3 操作と、行列の側の 3 操作はぴったり対応している

式の側の操作 行列の側の操作
1 つの式を $0$ でない数で何倍かする 1 つの行を $0$ でない数で何倍かする
2 つの式を入れ替える 2 つの行を入れ替える
1 つの式に別の式の何倍かを加える 1 つの行に別の行の何倍かを加える

行列の側のこの 3 操作にも、独立に名前を与える。

定義(行基本変形):行列に対する次の 3 種の操作を 行基本変形 という。

  1. 1 つの行を $0$ でない数で何倍かする
  2. 2 つの行を入れ替える
  3. 1 つの行に別の行の何倍かを加える

連立方程式の基本変形と、拡大係数行列の行基本変形は、まったく同じ操作の二つの言い方 である。式の側で「解集合は変わらない」と言ったことは、行列の側では「対応する連立方程式の解集合は変わらない」と言っていることになる。

観察:私たちは連立方程式を、係数の並び(=行列)だけ取り出して操作してよい。未知数 $x, y$ や等号 $=$ は、計算のあいだ書き続けなくてよい荷物だった。

これで、連立方程式を機械的に解くための 操作の土台 が整った。

例題 — 3 元連立を拡大係数行列で解く

具体的に手を動かしてみよう。

問題:連立 1 次方程式

$$ \begin{cases} x + y + z = 2 \\\\ 2x - y + 3z = 0 \\\\ x + 2y - z = 5 \end{cases} $$

を、拡大係数行列の行基本変形で解け。

解答:出発点の拡大係数行列は

$$ \begin{bmatrix} 1 & 1 & 1 & 2 \\\\ 2 & -1 & 3 & 0 \\\\ 1 & 2 & -1 & 5 \end{bmatrix} $$

である。第 1 列を「第 1 行だけが $1$、ほかは $0$」の形にすべく、第 2 行に第 1 行の $-2$ 倍を、第 3 行に第 1 行の $-1$ 倍を加える。

$$ \begin{bmatrix} 1 & 1 & 1 & 2 \\\\ 0 & -3 & 1 & -4 \\\\ 0 & 1 & -2 & 3 \end{bmatrix} $$

第 2 行と第 3 行を入れ替える(第 2 行の先頭非零成分を $1$ にしておくと、以後の計算が軽くなる)。

$$ \begin{bmatrix} 1 & 1 & 1 & 2 \\\\ 0 & 1 & -2 & 3 \\\\ 0 & -3 & 1 & -4 \end{bmatrix} $$

第 3 行に第 2 行の $3$ 倍を加える。

$$ \begin{bmatrix} 1 & 1 & 1 & 2 \\\\ 0 & 1 & -2 & 3 \\\\ 0 & 0 & -5 & 5 \end{bmatrix} $$

第 3 行を $-1/5$ 倍する。

$$ \begin{bmatrix} 1 & 1 & 1 & 2 \\\\ 0 & 1 & -2 & 3 \\\\ 0 & 0 & 1 & -1 \end{bmatrix} $$

ここまでで、係数部分(左 3 列)の対角線より下が掃き終わった。次は対角線より上を掃き出す。第 2 行に第 3 行の $2$ 倍を、第 1 行に第 3 行の $-1$ 倍を加える。

$$ \begin{bmatrix} 1 & 1 & 0 & 3 \\\\ 0 & 1 & 0 & 1 \\\\ 0 & 0 & 1 & -1 \end{bmatrix} $$

最後に、第 1 行に第 2 行の $-1$ 倍を加える。

$$ \begin{bmatrix} 1 & 0 & 0 & 2 \\\\ 0 & 1 & 0 & 1 \\\\ 0 & 0 & 1 & -1 \end{bmatrix} $$

ここまで来れば、連立方程式に戻して

$$ \begin{cases} x = 2 \\\\ y = 1 \\\\ z = -1 \end{cases} $$

を得る。検算は省くが、もとの式に代入すれば確かに成り立つ。

途中で「下を掃いてから上を掃く」という順序で進めたが、順序自体は本質ではない。基本変形は解集合を保つ操作なので、どの順序で進めても、最終的にぱっと読める形にたどり着けば勝ちである。とはいえ、順序にはコツがあり、そのコツの背後には次節以降で正式化される構造がある。

まとめ

  • 連立 1 次方程式の 基本変形 とは、(1) $0$ でない倍、(2) 入れ替え、(3) 他式の何倍かを加える、の 3 操作である
  • 基本変形は 可逆 であり、解集合を保つ。基本変形を繰り返して連立方程式を解く方法を 掃き出し法 という
  • 拡大係数行列に対する 行基本変形 は、方程式側の基本変形と完全に対応する。私たちは行列の側だけで操作してよい
  • 行基本変形だけで、連立方程式の解は「そのまま読み取れる形」まで整理できる

行列を「数の並び」として手に取り、その上で機械的に手を動かすだけで解が出てくる、という風景が初めて見えた。

次回予告

次回 2.2「簡約な行列」では、「もう基本変形では動かしようがない」終着点の形 を厳密に定める。今回の例題で最終的に得た

$$ \begin{bmatrix} 1 & 0 & 0 & 2 \\\\ 0 & 1 & 0 & 1 \\\\ 0 & 0 & 1 & -1 \end{bmatrix} $$

のような形は、いったいどういう特徴で他から区別されるのか?この問いに答える名前が 簡約な行列 である。

未回収の問い

  • 連立方程式に解があるか/ないかは、いつ判明するのか?(2.2 簡約な行列 → 2.3 連立 1 次方程式を解く で計算的に答える)
  • 解の自由度(=解の個数)は何で決まるのか?(同上、第 4 章「ベクトル空間」で構造的にも回収)
  • 行基本変形の終着点は、計算の順序によらず一意に決まるのか?(2.2 で答える。簡約な行列の 一意性 が鍵となる)

← 前の記事:1.4.2 連立 1 次方程式を線型結合で読む — 重ね合わせの着地
→ 次の記事:2.2.1 簡約な行列の定義 — 終着点の形を 4 条件で言い当てる