能旋轉的多項式:伽羅瓦理論與五次方程的不可解
從體擴張、正規子群到伽羅瓦對應,看一個關於數字的問題如何被群的內部結構決定
一個能旋轉的多項式:為什麼五次方程沒有公式解?
你已經知道群(group)、環(ring)、體(field)各自是什麼,也看過「對稱性就是群」的直覺。現在我們問一個更尖銳的問題:人類花了三百年尋找五次方程的根式解(radical solution),最後阿貝爾(Abel)與伽羅瓦(Galois)證明它不存在。這個「不存在」不是「我們還沒找到」,而是一個可以嚴格證明的數學事實。
關鍵在於:方程的可解性,竟然被一個群的內部結構決定。一個關於數字的問題,答案藏在對稱性的層次裡。本文要帶你走進這條把體、群、與「可解性」綁在一起的橋梁——伽羅瓦理論(Galois theory)的核心機制,並順帶釐清入門篇沒空細談的幾個結構:商群、正規子群、與體擴張(field extension)。
體擴張:把體當成向量空間

入門篇告訴你體是「加減乘除都能做」的結構,例如 $\mathbb{Q}$、$\mathbb{R}$、$\mathbb{C}$。進階的第一步,是學會把一個體看成「另一個體上的向量空間」。
考慮 $\mathbb{Q}$ 與 $\mathbb{Q}(\sqrt{2})$。後者的定義是
$$\mathbb{Q}(\sqrt{2}) = \{\, a + b\sqrt{2} : a, b \in \mathbb{Q} \,\}.$$
注意一件事:$\mathbb{Q}(\sqrt{2})$ 裡的每個元素都能寫成 $a \cdot 1 + b \cdot \sqrt{2}$,也就是用 $\{1, \sqrt{2}\}$ 這兩個「基底」加上 $\mathbb{Q}$ 的係數線性組合而成。換句話說,$\mathbb{Q}(\sqrt{2})$ 是 $\mathbb{Q}$ 上的一個二維向量空間。
我們把這個維度稱為擴張次數(degree of extension),記作
$$[\mathbb{Q}(\sqrt{2}) : \mathbb{Q}] = 2.$$
這個觀點威力驚人,因為它讓我們能用線性代數的工具研究體。一個立刻的結果是塔法則(tower law):若 $K \subseteq L \subseteq M$ 是一連串體擴張,則
$$[M : K] = [M : L] \cdot [L : K].$$
維度可以相乘,就像 $\dim$ 在向量空間裡的行為。
看一個例子:$\sqrt[3]{2}$ 為什麼不能尺規作圖
古希臘三大難題之一是「倍立方」:給定一個立方體,用尺規作出體積兩倍的立方體。這要求作出長度 $\sqrt[3]{2}$。
尺規作圖的代數本質是:從 $\mathbb{Q}$ 出發,每一步「取交點」最多解一個二次方程,所以每作出一個新數,擴張次數最多乘以 $2$。因此所有尺規可作的數,其在 $\mathbb{Q}$ 上的擴張次數必為 $2$ 的某次方 $2^n$。
但 $\sqrt[3]{2}$ 是不可約多項式 $x^3 - 2$ 的根(用艾森斯坦判別法 Eisenstein's criterion,取 $p=2$ 即知不可約),所以
$$[\mathbb{Q}(\sqrt[3]{2}) : \mathbb{Q}] = 3.$$
$3$ 不是 $2$ 的次方。塔法則告訴我們:若 $\sqrt[3]{2}$ 在某個尺規可作體 $L$ 中,則 $3 = [\mathbb{Q}(\sqrt[3]{2}):\mathbb{Q}]$ 必須整除 $[L:\mathbb{Q}] = 2^n$,矛盾。倍立方不可能。
請體會這個論證的美:一個關於圓規直尺的幾何問題,被一個整除性論證($3 \nmid 2^n$)終結。這正是抽象代數的力量——把問題搬到對的結構上,難題就變顯然。
正規子群與商群:群也能「除法」
要談伽羅瓦理論的群這一側,必須先補上入門篇通常略過的兩個概念。
給定群 $G$ 與子群 $H$,左陪集(left coset)是 $gH = \{ gh : h \in H \}$。這些陪集把 $G$ 切成大小相等的碎片(拉格朗日定理 Lagrange's theorem 的來源)。但我們想做的更多:能不能把這些碎片本身當成一個新群的元素?
只有當 $H$ 是正規子群(normal subgroup)時才行。正規的定義是:對所有 $g \in G$,
$$gHg^{-1} = H,$$
記作 $H \trianglelefteq G$。此時左陪集等於右陪集,我們可以良好地定義陪集的乘法 $(g_1 H)(g_2 H) = (g_1 g_2) H$,得到商群(quotient group) $G/H$。
直覺上,$G/H$ 是「把 $H$ 壓縮成單位元」之後剩下的對稱性。例如 $\mathbb{Z}/n\mathbb{Z}$ 就是把整數加法群裡「$n$ 的倍數」全部當成 $0$,得到時鐘算術(modular arithmetic)。
為什麼非正規不行?若 $gHg^{-1} \neq H$,那麼乘法 $(g_1 H)(g_2 H)$ 的結果會依你選哪個代表元而改變——運算不是良定義(well-defined)的。這是初學者最常踩的雷:以為任何子群都能取商。不行,只有正規子群可以。
伽羅瓦對應:體的塔,群的塔,上下顛倒
現在把兩側接起來。給定一個體擴張 $L/K$(讀作「$L$ 在 $K$ 上」),定義它的伽羅瓦群(Galois group)
$$\mathrm{Gal}(L/K) = \{\, \sigma : L \to L \text{ 為體自同構,且 } \sigma|_K = \mathrm{id} \,\}.$$
白話:所有「攪動 $L$、但完全不動 $K$ 裡元素」的對稱變換。這些 $\sigma$ 在合成下構成一個群。
看一個例子:$\mathbb{Q}(\sqrt{2}, \sqrt{3})$ 的伽羅瓦群
考慮 $L = \mathbb{Q}(\sqrt{2}, \sqrt{3})$,$K = \mathbb{Q}$。由塔法則,
$$[L : \mathbb{Q}] = [\mathbb{Q}(\sqrt 2, \sqrt 3) : \mathbb{Q}(\sqrt 2)] \cdot [\mathbb{Q}(\sqrt 2):\mathbb{Q}] = 2 \cdot 2 = 4.$$
任何 $\sigma \in \mathrm{Gal}(L/\mathbb{Q})$ 必須把 $\sqrt 2$ 送到 $x^2 - 2$ 的某個根($\pm\sqrt 2$),把 $\sqrt 3$ 送到 $\pm\sqrt 3$。四種獨立選擇:
$$\sigma : \sqrt 2 \mapsto \pm\sqrt 2, \quad \sqrt 3 \mapsto \pm\sqrt 3.$$
於是 $|\mathrm{Gal}(L/\mathbb{Q})| = 4$,且每個非單位元的平方都是單位元,所以
$$\mathrm{Gal}(L/\mathbb{Q}) \cong \mathbb{Z}/2\mathbb{Z} \times \mathbb{Z}/2\mathbb{Z}$$
(克萊因四元群 Klein four-group)。注意 $|\mathrm{Gal}(L/\mathbb{Q})| = 4 = [L:\mathbb{Q}]$——這個「群階等於擴張次數」的相等,正是 $L/\mathbb{Q}$ 是伽羅瓦擴張的標誌。
伽羅瓦理論基本定理(Fundamental Theorem of Galois Theory) 說:在伽羅瓦擴張 $L/K$ 中,「介於 $K$ 與 $L$ 之間的中間體(intermediate field)」與「$\mathrm{Gal}(L/K)$ 的子群」之間,存在一個一一對應,而且是反序的(inclusion-reversing)。
對 $\mathbb{Q}(\sqrt 2, \sqrt 3)$ 而言:
- 最大的體 $L$ ↔ 最小的群 $\{e\}$;
- 最小的體 $\mathbb{Q}$ ↔ 整個群 $\mathbb{Z}/2 \times \mathbb{Z}/2$;
- 三個中間體 $\mathbb{Q}(\sqrt 2)$、$\mathbb{Q}(\sqrt 3)$、$\mathbb{Q}(\sqrt 6)$ ↔ 三個階為 $2$ 的子群。
體的塔和群的塔,像照鏡子一樣彼此對應,只是上下顛倒。問體的結構,等於問群的結構——而群通常好處理太多了。
動手試試:用群結構判斷可解性
伽羅瓦理論最壯觀的應用,是把「方程可否用根式解」翻譯成群論的語言。
一個多項式 $f$ 可用根式解 $\iff$ 它的伽羅瓦群是可解群(solvable group)。可解群的定義是:存在一串正規子群
$$\{e\} = G_0 \trianglelefteq G_1 \trianglelefteq \cdots \trianglelefteq G_n = G,$$
使得每一段的商群 $G_{i+1}/G_i$ 都是交換群(abelian)。
直覺上,「開根號」這個動作對應一個交換的對稱性(循環群),所以「能用一連串開根號解出」就對應「群能被拆成一連串交換的商群」。
現在來算一般五次方程的情況。一般五次多項式(係數視為獨立變元)的伽羅瓦群是對稱群 $S_5$($5$ 個根的所有排列)。它包含正規子群——交錯群 $A_5$:
$$\{e\} \subseteq A_5 \subseteq S_5.$$
$S_5/A_5 \cong \mathbb{Z}/2$ 是交換的,這一段沒問題。但 $A_5$ 自己呢?關鍵事實是:
$$A_5 \text{ 是單群(simple group):除了 } \{e\} \text{ 和自身外沒有正規子群,且非交換。}$$
既然 $A_5$ 非交換又無法再被正規子群分割,它無法被拆成交換商群的塔。因此 $S_5$ 不可解,一般五次方程沒有根式解。
把這個論證和 $n \leq 4$ 對照:$S_2, S_3, S_4$ 都是可解群($S_4$ 有 $\{e\} \trianglelefteq V_4 \trianglelefteq A_4 \trianglelefteq S_4$ 這條全交換商的鏈),所以二、三、四次方程都有公式解。分水嶺恰好出現在 $n = 5$,因為 $A_5$ 是最小的非交換單群。三百年的謎題,答案是一個群的單性。
重點回顧
- 體擴張是向量空間:$[L:K]$ 是 $L$ 視為 $K$-向量空間的維度,塔法則讓維度可相乘,是攻克尺規作圖三大難題的關鍵工具。
- 只有正規子群能取商:$gHg^{-1} = H$ 是商群運算良定義的充要條件;非正規子群取商會破壞良定義性,這是常見迷思。
- 伽羅瓦對應是反序雙射:中間體 ↔ 伽羅瓦群的子群,上下顛倒。體的問題被翻譯成群的問題。
- 可解性 = 群可解:方程有根式解 $\iff$ 伽羅瓦群是可解群(商群鏈全為交換)。
- 五次方程的關卡是 $A_5$:$A_5$ 是非交換單群,使 $S_5$ 不可解,故一般五次方程無根式解。
深入探討(研究所視角)
把上面的故事放回現代代數的版圖,有幾條值得繼續走的路徑。
1. 分裂體與正規/可分性的精確條件。 我們略過了「伽羅瓦擴張」的嚴格定義。完整地說,有限擴張 $L/K$ 是伽羅瓦的,當且僅當它同時是正規(normal)($L$ 是某組多項式的分裂體 splitting field)且可分(separable)(極小多項式無重根)的。在特徵 $0$ 或有限體上可分性自動成立,但在特徵 $p$ 的體(如 $\mathbb{F}_p(t)$)會出現不可分擴張,例如 $x^p - t$,這時 $|\mathrm{Gal}(L/K)| < [L:K]$,伽羅瓦對應會失效。研究所的代數課會用可分度與不可分度把塔法則細分。
2. 無限伽羅瓦理論與 profinite 群。 當 $L/K$ 是無限擴張(例如 $\overline{\mathbb{Q}}/\mathbb{Q}$,代數數體的絕對伽羅瓦群 absolute Galois group),子群與中間體的樸素雙射會崩潰——必須在 $\mathrm{Gal}(L/K)$ 上裝克魯爾拓撲(Krull topology),雙射只對閉子群成立。$\mathrm{Gal}(\overline{\mathbb{Q}}/\mathbb{Q})$ 是當代數論的聖杯級對象,它的表現論連結到朗蘭茲綱領(Langlands program)。
3. 從伽羅瓦理論到上同調。 群作用於體會誘導出伽羅瓦上同調(Galois cohomology) $H^n(\mathrm{Gal}(L/K), M)$。希爾伯特定理 90(Hilbert's Theorem 90)可重述為 $H^1(\mathrm{Gal}(L/K), L^\times) = 0$,它是類體論(class field theory)與 Brauer 群理論的基石,也解釋了某些 Diophantine 方程的局部-整體原則(local-global principle)何時成立。
4. 反伽羅瓦問題(Inverse Galois Problem)。 我們從擴張求群,反過來問:給定一個有限群 $G$,是否一定存在 $\mathbb{Q}$ 上的伽羅瓦擴張使 $\mathrm{Gal}(L/\mathbb{Q}) \cong G$?這個問題對所有有限群是否成立至今未解,是代數數論的著名開放問題。已知所有可解群都能實現(Shafarevich 定理),許多單群也已被構造,但一般情形仍懸而未決。
5. 環論視角的回望。 別忘了體只是環的特例。中間體對應到的,其實是 $L$ 在某些子群作用下的不變環/不變體;把這個想法推廣到一般環與群作用,就進入不變量理論(invariant theory) 與幾何不變理論(GIT),是代數幾何處理「商空間」的核心。當你下次看到 $G/H$ 這個商群符號,可以想:它和代數幾何裡的商簇 $X /\!/ G$,本質上是同一種「用對稱性化約結構」的衝動。
從一個「五次方程有沒有公式」的問句出發,我們穿過體擴張、商群、伽羅瓦對應,最後抵達當代數論與代數幾何的門口。這正是抽象代數作為一門「結構之學」的承諾:學會看出結構,看似無關的問題就會在同一個框架下彼此映照。