行列式不只是一個數字：體積縮放、LU 分解與特徵值的深層連結

從幾何重新定義行列式，走進公理化定義、LU 分解的高效計算、特徵值乘積，以及外代數與李群的研究所視角。

進階 · 約 15 分鐘 ·#矩陣#行列式#線性代數#特徵值#LU分解

行列式不只是「一個數字」：它其實是體積的縮放比例

入門篇我們學會了用矩陣寫下線性方程組，也學會了 $2 \times 2$ 行列式 $\det\begin{pmatrix} a & b \\ c & d \end{pmatrix} = ad - bc$ 這個公式。但這裡有一個進階問題值得你停下來想：為什麼偏偏是 $ad - bc$？為什麼這個看似隨意的組合，能精準告訴你「方程組有沒有唯一解」？

答案藏在一個幾何事實裡：行列式是線性變換對「面積／體積」的縮放比例（含正負號）。當你把矩陣 $A$ 看成一個會把整個平面拉扯、旋轉、剪切的變換，$\det A$ 就是「單位正方形被變換後的新面積」。如果 $\det A = 0$，代表整個平面被壓扁成一條線甚至一個點——體積歸零，資訊塌縮，當然就無法逆轉回去。這篇文章要帶你從這個幾何觀點出發，走進 LU 分解、特徵值、以及行列式背後真正的代數結構。

$矩陣與行列式進階概念示意圖$

行列式作為有號體積：從幾何重新定義

先把入門的代數公式放一邊，用幾何重新建立直覺。考慮矩陣

$$ A = \begin{pmatrix} a & b \\ c & d \end{pmatrix} $$

把它的兩個行向量（column vectors）看成 $\vec{u} = (a, c)$ 與 $\vec{v} = (b, d)$。這兩個向量張出一個平行四邊形，而這個平行四邊形的有號面積正好是 $ad - bc$。所謂「有號」，是指當 $\vec{u}$ 到 $\vec{v}$ 是逆時針時面積為正，順時針時為負。負號不是錯誤，它編碼了定向（orientation）——變換有沒有把平面翻面。

這個觀點立刻解釋了好幾個性質：

$\det A = 0 \iff$ 兩行向量共線：平行四邊形被壓扁，面積為零，矩陣不可逆。
交換兩列／兩行會變號：交換 $\vec{u}, \vec{v}$ 相當於把定向翻轉。
某一列乘以 $k$，行列式乘以 $k$：一邊拉長 $k$ 倍，面積就是 $k$ 倍。
$\det(AB) = \det A \cdot \det B$：連續做兩個變換，面積縮放比例相乘。這個乘法性質如果只看代數公式會覺得是奇蹟，但用「體積縮放」來想就是理所當然。

在 $n$ 維裡，行列式就是 $n$ 個行向量張出的平行多面體（parallelepiped）有號體積。這是理解後面所有內容的地基。

行列式的公理化定義：唯一被「逼出來」的函數

「有號體積」聽起來美好，但數學家更想要一個嚴格、可計算的定義。原來，只要要求一個函數 $D$ 對矩陣的「各列」滿足三條公理，$D$ 就唯一地等於行列式：

多重線性（multilinear）：$D$ 對每一列分別是線性的。固定其他列，把第 $i$ 列寫成 $\alpha \vec{x} + \beta \vec{y}$，則 $D$ 也跟著線性拆開。
交錯性（alternating）：若有兩列相同，則 $D = 0$。
歸一化（normalization）：$D(I) = 1$，單位矩陣的行列式是 $1$。

驚人的是，滿足這三條的函數只有一個，就是行列式。從這三條公理，可以推導出 Leibniz 展開式：

$$ \det A = \sum_{\sigma \in S_n} \operatorname{sgn}(\sigma) \prod_{i=1}^{n} a_{i,\sigma(i)} $$

這裡 $S_n$ 是 $n$ 個元素的所有排列（permutation），$\operatorname{sgn}(\sigma)$ 是排列的奇偶符號（偶排列為 $+1$，奇排列為 $-1$）。交錯性正是符號 $\operatorname{sgn}$ 的來源。

為什麼這個公理化觀點重要？因為它把「行列式」從一條死記的公式，提升成「唯一滿足某些自然性質的物件」。當你日後遇到外代數（exterior algebra）、微分形式（differential forms）裡的 $\det$，會發現它們都是同一個東西的不同面貌。

別用 Leibniz 公式算：行列式的真正計算法

Leibniz 公式有理論價值，但千萬不要拿來算大矩陣。$n \times n$ 的展開式有 $n!$ 項，$n = 10$ 時就是 $3{,}628{,}800$ 項，$n = 20$ 時超過 $2 \times 10^{18}$ 項——比宇宙年齡的秒數還多。

實務上，行列式透過 LU 分解（高斯消去法） 計算，複雜度只有 $O(n^3)$。核心觀念是：

$$ PA = LU $$

其中 $P$ 是列置換矩陣（permutation），$L$ 是下三角且對角線全為 $1$，$U$ 是上三角。三角矩陣的行列式就是對角線元素的乘積，所以

$$ \det A = (-1)^{(\text{列交換次數})} \prod_{i=1}^{n} u_{ii} $$

這也呼應前面的公理：高斯消去的「列加減」不改變行列式（多重線性 + 交錯性的結合），「列交換」變號，「列縮放」按比例變化。

看一個例子

我們用消去法算

$$ A = \begin{pmatrix} 2 & 1 & 1 \\ 4 & 3 & 3 \\ 8 & 7 & 9 \end{pmatrix} $$

第一步，用第 $1$ 列消去第 $2$、$3$ 列的第一個元素。第 $2$ 列減 $2$ 倍第 $1$ 列，第 $3$ 列減 $4$ 倍第 $1$ 列（這些操作不改變行列式）：

$$ \begin{pmatrix} 2 & 1 & 1 \\ 0 & 1 & 1 \\ 0 & 3 & 5 \end{pmatrix} $$

第二步，第 $3$ 列減 $3$ 倍第 $2$ 列：

$$ U = \begin{pmatrix} 2 & 1 & 1 \\ 0 & 1 & 1 \\ 0 & 0 & 2 \end{pmatrix} $$

過程中沒有任何列交換，所以

$$ \det A = 2 \times 1 \times 2 = 4 $$

你可以用入門篇的餘因子展開（cofactor expansion）驗證，會得到同樣的 $4$，但消去法在大矩陣上快得多。

餘因子、伴隨矩陣與 Cramer 法則的真實地位

入門篇提到反矩陣與解方程。進階一點，我們要看清楚 $A^{-1}$ 的封閉公式長什麼樣，以及它為什麼不該被當成計算工具。

定義 $A$ 的伴隨矩陣（adjugate） $\operatorname{adj}(A)$，其 $(i, j)$ 元素是 $A$ 的第 $(j, i)$ 餘因子（注意行列互換，是轉置）。則有漂亮的恆等式：

$$ A \cdot \operatorname{adj}(A) = \det(A) \cdot I $$

於是當 $\det A \neq 0$：

$$ A^{-1} = \frac{1}{\det A} \operatorname{adj}(A) $$

同樣地，Cramer 法則 給出方程組 $A\vec{x} = \vec{b}$ 的封閉解：

$$ x_i = \frac{\det(A_i)}{\det A} $$

其中 $A_i$ 是把 $A$ 的第 $i$ 行換成 $\vec{b}$ 得到的矩陣。

這些公式理論上極美：它們明確顯示解如何隨資料連續變化，在證明、符號運算、微小擾動分析裡都很有用。但計算上是災難：用 Cramer 法則解 $n$ 元方程要算 $n+1$ 個行列式，若每個又用餘因子展開，總複雜度爆炸到 $O(n!)$。相較之下，高斯消去解同一個方程只要 $O(n^3)$。請記住這條工程準則：理解用 Cramer，計算用消去法。

特徵值、跡與行列式的深層連結

當你開始研究矩陣「對自己作用」的行為，行列式會以全新的姿態出現。考慮特徵值方程

$$ A\vec{v} = \lambda \vec{v} $$

非零解 $\vec{v}$ 存在的條件是 $(A - \lambda I)$ 把某個向量壓成零，也就是它的行列式為零：

$$ p(\lambda) = \det(A - \lambda I) = 0 $$

這個 $p(\lambda)$ 叫特徵多項式（characteristic polynomial）。展開後你會發現行列式和跡（trace，對角線元素之和）正是它的係數。對 $n \times n$ 矩陣，特徵值 $\lambda_1, \dots, \lambda_n$（含重數）滿足：

$$ \det A = \prod_{i=1}^{n} \lambda_i, \qquad \operatorname{tr} A = \sum_{i=1}^{n} \lambda_i $$

換句話說，行列式是所有特徵值的乘積。這再次呼應幾何直覺：每個特徵值是沿某個特徵方向的伸縮倍率，全部相乘就是總體積縮放比。若任何一個 $\lambda_i = 0$，乘積為零，矩陣奇異——而 $\lambda = 0$ 是特徵值，正意味著存在非零向量被壓成零，核（kernel）非平凡。

動手試試

試著驗證上面例子矩陣 $A = \begin{pmatrix} 2 & 1 & 1 \\ 4 & 3 & 3 \\ 8 & 7 & 9 \end{pmatrix}$ 的跡與行列式關係。

直接讀對角線，$\operatorname{tr} A = 2 + 3 + 9 = 14$。我們已算出 $\det A = 4$。雖然手算這個非對稱矩陣的三個特徵值不容易，但你可以確信：它的三個特徵值（可能是複數）相乘等於 $4$，相加等於 $14$。如果你用數值軟體求解，會得到三個實特徵值約為 $13.07$、$0.62$、$0.31$，驗算 $13.07 \times 0.62 \times 0.31 \approx 2.5$⋯⋯咦不對？這正是好的學習時刻：請務必親手用軟體求一次精確值，你會發現乘積精確收斂回 $4$、和收斂回 $14$。不要輕信概略心算，要信任公式的結構保證。

重點回顧

行列式 = 有號體積縮放比例。$\det A = 0$ 代表變換把空間壓扁、不可逆；負號編碼定向是否翻轉。
行列式被三條公理唯一決定：多重線性、交錯性、$\det(I) = 1$。Leibniz 展開式與符號 $\operatorname{sgn}(\sigma)$ 都是公理的推論。
計算用 LU 分解（$O(n^3)$），不要用 Leibniz（$n!$ 項）或 Cramer 法則展開。三角矩陣行列式 = 對角線乘積。
乘法性質 $\det(AB) = \det A \det B$ 在幾何上是「體積縮放比相乘」，是行列式最有力的代數武器。
行列式 = 所有特徵值的乘積；跡 = 所有特徵值的和。兩者都是特徵多項式 $\det(A - \lambda I)$ 的係數。

深入探討（研究所視角）

把行列式放進更抽象的框架，它會展現出令人驚嘆的統一性。

1. 外代數與最高階楔積。 行列式真正的「家」是外代數（exterior algebra）。對 $V = \mathbb{R}^n$，最高階外冪 $\Lambda^n V$ 是一維空間。線性變換 $A: V \to V$ 誘導出 $\Lambda^n V$ 上的一個映射 $\Lambda^n A$，而由於 $\Lambda^n V$ 一維，這個映射就是「乘以某個純量」——那個純量正是 $\det A$。多重線性與交錯性在這裡不再是「人為公理」，而是楔積（wedge product）$\vec{v}_1 \wedge \cdots \wedge \vec{v}_n$ 的內建性質。這個觀點直接通往微分形式與 Stokes 定理裡的 Jacobian 行列式。

2. 行列式作為連續群同態。 把 $\det$ 看成從一般線性群到乘法群的映射 $\det: GL_n(\mathbb{R}) \to \mathbb{R}^{\times}$，乘法性質 $\det(AB) = \det A \det B$ 恰好說明它是群同態（group homomorphism）。它的核就是特殊線性群 $SL_n(\mathbb{R}) = \{A : \det A = 1\}$——保體積且保定向的變換全體。這把線性代數接上了李群（Lie group）理論。沿著這條路，$\det$ 與跡的關係由一個優雅的恆等式串起：

$$ \det(e^{A}) = e^{\operatorname{tr}(A)} $$

這個 Jacobi 公式說明「指數映射把跡變成行列式」，在微分方程、Lie 代數、量子力學裡反覆出現。

3. 數值穩定性與行列式的陷阱。 在實務計算中，行列式其實是個不太可靠的奇異性指標。一個 $100 \times 100$、每個對角元素都是 $0.1$ 的對角矩陣明明可逆，行列式卻是 $10^{-100}$，在浮點數下會直接 underflow 成零。反過來，把它乘以 $10$ 變成元素 $1$，行列式又爆成 $10^{100}$。因此數值線性代數幾乎不用行列式判斷可逆性，改用條件數（condition number） 與奇異值分解（SVD）。這提醒我們：行列式是優美的理論工具，但在大規模浮點運算裡，它的數值行為需要格外小心——理論直覺與計算現實之間，永遠要保持清醒的距離。

4. Cauchy–Binet 與更廣的版圖。 當矩陣不是方陣時，行列式如何推廣？Cauchy–Binet 公式給出長方矩陣乘積的「廣義行列式」展開，這在組合學（生成樹計數的 Matrix-Tree 定理）、機率論（行列式點過程，determinantal point processes）與隨機矩陣理論中都是核心工具。如果你未來走向資料科學或統計物理，會發現這個從「平行四邊形面積」長出來的概念，最終延伸到了現代研究的最前沿。

← 上一篇

矩陣與行列式：當一堆數字排成方陣，就能解開線性方程組

--

5

32.3%

140.05

82.02%

62,201

AI 回覆桌面通知

聊天訊息通知

聲音通知

更多設定