偏誤不是 bug,是學習目標的忠實反映
AI 沒有惡意,但它忠實地擬合資料——包括資料中的歷史不平等。經驗風險最小化只要求逼近 $p_{\text{data}}$,若資料本身就帶有社會偏見,模型便會複製、甚至放大它,再以「客觀演算法」之名輸出。Buolamwini 與 Gebru 的 Gender Shades 即實證:商用人臉系統對深膚色女性的錯誤率遠高於淺膚色男性。
偏誤的來源鏈
| 來源 | 機制 |
|---|---|
| 歷史/資料偏誤 | 樣本不具代表性、反映既有不平等 |
| 標註偏誤 | 標註者主觀判斷滲入標籤 |
| 目標偏誤 | 用易測的代理目標(如「點擊」)替代真正想要的(如「品質」) |
| 聚合偏誤 | 對異質群體用單一模型,犧牲少數群體 |
| 反饋迴圈 | 偏誤決策改變未來資料,惡性循環(見〈AI 就在你身邊〉) |
公平性的形式化定義
「公平」不是單一概念。以二元決策、敏感屬性 $A$(如性別)、真實標籤 $Y$、預測 $\hat{Y}$ 為例,至少三種互斥的定義:
- 人口均等(demographic parity):$P(\hat{Y}{=}1\mid A{=}a)$ 跨群體相等。
- 機會均等(equal opportunity):真陽性率相等,$P(\hat{Y}{=}1\mid Y{=}1,A{=}a)$ 跨群體相等。
- 校準(calibration):給定預測分數,實際正例比例跨群體相等。
不可能定理:公平之間會衝突
關鍵且常被忽略的結果(Chouldechova、Kleinberg 等):當各群體的基準率不同時,校準與誤差率均等無法同時滿足。這意味著「公平」沒有技術上的萬靈解——選擇哪個公平準則是價值判斷與政策抉擇,不能甩鍋給演算法。COMPAS 累犯預測的爭議正源於此:同一系統,依不同公平定義可得出相反的「是否歧視」結論。
緩解:技術之外還需制度
- 資料層:更具代表性的取樣、重加權、去偏。
- 演算法層:加公平性約束、對抗式去偏。
- 後處理層:依群體調整決策閾值。
- 制度層:明確選定公平準則、跨群體分別評估(而非只看整體準確率)、可解釋性、人在迴圈審查高風險決策、可問責機制。
對使用者與決策者的素養
當 AI 參與影響人的決策(貸款、錄取、醫療、司法),「演算法說的」不等於「公正的」。要求透明、要求分群評估、追問「用了哪個公平定義」,是 AI 時代的公民素養——也是 Uedu Educational Omics 框架中 Ethicomics 維度的核心關切。
深入探討(研究所視角)
公平性準則的不可能定理
入門主體已介紹了人口統計均等(demographic parity)、機會均等(equal opportunity)與校準(calibration)等個別準則,但更深層的問題在於它們彼此衝突。Kleinberg、Mullainathan 與 Raghavan(2016)以及 Chouldechova 的工作證明了一個結構性的「不可能定理」:當不同群體的基底率(base rate)$P(Y=1\mid A=a)$ 不相等時,分類器無法同時滿足校準、相等的偽陽率與相等的偽陰率。其根源可由混淆矩陣的代數恆等式導出——給定盛行率 $p$、陽性預測值 $\text{PPV}$、真陽率 $\text{TPR}$ 與偽陽率 $\text{FPR}$,三者被一條約束綁死:
$$\text{FPR} = \frac{p}{1-p}\cdot\frac{1-\text{PPV}}{\text{PPV}}\cdot \text{TPR}.$$
當 $p$ 隨群體變動時,固定其中兩個量必然使第三個分歧。換言之,「公平」不是單一可優化目標,而是一組互斥約束下的政策選擇,必須由領域脈絡決定要犧牲哪一個。
因果視角與反事實公平
統計關聯式準則無法區分「歧視」與「合理的解釋變項」。Kusner 等人提出的反事實公平(counterfactual fairness)將問題搬到結構因果模型(SCM)$\mathcal{M}=\langle U, V, F\rangle$ 上:一個預測 $\hat{Y}$ 對受保護屬性 $A$ 是反事實公平的,若對所有 $x, a, a'$,
$$P(\hat{Y}_{A\leftarrow a}=y\mid X=x, A=a) = P(\hat{Y}_{A\leftarrow a'}=y\mid X=x, A=a).$$
此處 $A\leftarrow a'$ 是 do-operator 下的介入。這把焦點從「相關」轉向「沿哪些因果路徑傳遞影響是不可接受的」——path-specific fairness 允許保留合法路徑(如資歷影響薪資),同時阻斷經由代理變項(proxy)的歧視路徑。代價是 SCM 通常不可由觀測資料唯一識別,需要強假設或敏感度分析。
開放問題與理論連結
進階研究方向包括:(一)子群體與交叉性公平,Hébert-Johnson 等人的 multicalibration 與 multiaccuracy 要求對一個豐富的子群體族 $\mathcal{C}$ 同時近似校準,與運算學習理論中的 boosting/弱不可知學習有深刻對應;(二)公平性與隱私的張力,差分隱私的雜訊在小群體上放大誤差,與公平目標可能直接衝突;(三)長期動態,靜態約束在回饋迴路下可能反而惡化不平等(Liu 等人的 delayed impact 分析),需以序列決策與強化學習框架重新表述。最後,從泛化理論看,群體間表現落差常源於少數群體樣本稀少導致的估計變異,這把公平問題與分布外泛化(distribution shift)、重加權與 distributionally robust optimization(DRO)連成同一個統計學習主題——公平不只是倫理附加條款,而是穩健學習的核心面向。