為何需要治理:能力與規範的落差
當 AI 進入招募、醫療、司法、金融等高風險領域,「做得到」與「該不該做」之間需要制度把關。AI 治理 用法律、標準與制度,引導 AI 朝安全、公平、可問責發展。它面對一個結構性難題——步調問題(pacing problem):技術迭代以月計,立法以年計,規範永遠在追趕。
主流框架一:基於風險分級(EU AI Act)
歐盟《人工智慧法》是全球首部全面性 AI 法規,採風險分級的比例原則:
| 風險等級 | 例子 | 監管 |
|---|---|---|
| 不可接受 | 社會評分、潛意識操弄 | 原則上禁止 |
| 高風險 | 招募、醫療、關鍵基礎設施 | 嚴格義務:風險管理、資料治理、紀錄、人為監督、合格評定 |
| 有限風險 | 聊天機器人、生成內容 | 透明義務:須揭露正在與 AI 互動、標示 AI 生成 |
| 最小風險 | 多數一般應用 | 幾乎不額外規範 |
對通用/基礎模型另立分層義務(技術文件、訓練資料摘要、對「系統性風險」模型加做評估與紅隊)。
主流框架二:基於流程的風險管理(NIST AI RMF)
美國 NIST 的 AI 風險管理框架採自願、流程導向的進路,以「治理(Govern)—映射(Map)—量測(Measure)—管理(Manage)」四功能,讓組織把可信賴 AI 的屬性(有效、安全、公平、可問責、可解釋、隱私)落實到生命週期。與 EU 的「硬法分級」互補,代表兩種治理哲學。
算力治理:一個新興槓桿
前沿模型的訓練需巨量算力,使算力成為可觀測、可管制的治理抓手——例如以訓練浮點運算量門檻(如 $10^{25}$–$10^{26}$ FLOP)界定須加強監管的「前沿模型」,並透過晶片出口管制影響能力擴散。這把 AI 治理與半導體供應鏈、地緣政治直接綁定(見〈優半導體〉與本專區〈AI 大事記與治理時間軸〉)。算力治理也引發爭議:門檻是否合理、是否扼殺開源與學術。
全球競合與張力
- 歐盟:法規先行、重視基本權利(布魯塞爾效應外溢全球)。
- 美國:創新優先,行政命令+自願承諾+部門監管。
- 其他法域:在「鼓勵創新」與「控制風險」間各自拿捏,政策快速演變、甚至年內反覆。
核心張力恆在:創新 vs. 安全、開源 vs. 管制、國家競爭 vs. 國際協調。
不變的核心原則
框架會變,但多數回到共識:透明、可問責、公平、安全、隱私、人為監督。對學習者而言,培養「用這些原則判斷一個 AI 應用是否負責任」的能力,比背誦任何單一條文更重要——因為你將是與 AI 共處一生、並可能參與制定其規則的世代。
深入探討(研究所視角)
從規範文本到可驗證保證:風險分級的形式化困境
AI 治理框架(如歐盟 AI Act)採取「風險分級」(risk-based tiering)的核心策略,但其法律語意與機器學習系統的可驗證屬性之間存在根本鴻溝。當法規要求「高風險系統」須滿足準確性、穩健性與非歧視性時,這些要求必須被翻譯成可數學檢驗的性質。以演算法公平性為例,已有的不可能性定理(impossibility results,Kleinberg–Mullainathan–Raghavan 與 Chouldechova 各自獨立提出)指出:除非基準率(base rate)相等或預測為完美,否則校準性(calibration)、預測值同等(predictive parity)與均等勝算(equalized odds)三者無法同時成立。形式化地,令 $\hat{Y}$ 為分數、$Y$ 為真實標籤、$A$ 為受保護屬性,校準要求 $\Pr(Y=1 \mid \hat{Y}=s, A=a)=s$,而均等勝算要求 $\Pr(\hat{Y}=1 \mid Y=y, A=a)$ 與 $A$ 無關。此二者的張力意味著任何「不得歧視」的法律條款都隱含了治理者必須做出的價值權衡,而非可一體達成的技術目標。
穩健性、可稽核性與差分隱私的理論連結
法規對「穩健性」的要求可連結到對抗式機器學習與認證防禦(certified defense)。給定擾動半徑 $\epsilon$,認證穩健性要求對所有 $\|\delta\|_p \le \epsilon$ 皆有 $f(x+\delta)=f(x)$;隨機平滑(randomized smoothing)給出機率性的 $\ell_2$ 認證半徑
$$ R = \frac{\sigma}{2}\left(\Phi^{-1}(\underline{p_A}) - \Phi^{-1}(\overline{p_B})\right), $$
其中 $\Phi^{-1}$ 為標準常態分位函數,$\sigma$ 為平滑雜訊強度。這說明法規所謂的「可量測穩健性」在理論上是可提供保證的,但保證強度與計算成本、準確率呈權衡關係。同理,隱私保護條款可錨定於差分隱私:機制 $\mathcal{M}$ 滿足 $(\varepsilon,\delta)$-DP 當且僅當對任意相鄰資料集與輸出集合 $S$,$\Pr[\mathcal{M}(D)\in S]\le e^{\varepsilon}\Pr[\mathcal{M}(D')\in S]+\delta$。此處的關鍵研究方向是隱私損失的合成(composition)——進階合成定理(advanced composition)與 Rényi-DP 提供比基本合成更緊的界,這對治理多次查詢或持續學習系統的累積風險至關重要。
開放問題與 SOTA 方向
當前前沿在於「治理可稽核性」(governance auditability):如何在不揭露模型權重的前提下,對第三方稽核者證明模型滿足某項法規屬性。這引向零知識證明與機器學習的交叉(zkML),以及對基礎模型的能力評估(evaluations)標準化。一個尚未解決的核心張力是規格博弈(specification gaming)與古德哈特定律(Goodhart's law):當某指標 $M$ 被當作監管目標,最佳化 $M$ 將使其與真實意圖的相關性退化,形式上即 $\arg\max_\theta M(\theta)$ 未必落在意圖目標 $V$ 的高值區。這對「以基準測試作為合規門檻」的治理設計構成根本挑戰。最後,跨國治理的競合可建模為非合作賽局:各國在「監管嚴格度」與「產業競爭力」間的策略選擇,可能導致逐底競爭(race to the bottom)的納許均衡,凸顯國際協調機制(如互認框架)在理論上的必要性。