AI 偏誤與公平性：演算法為什麼會「歧視」

偏誤不是 bug，是學習目標的忠實反映

AI 沒有惡意，但它忠實地擬合資料——包括資料中的歷史不平等。經驗風險最小化只要求逼近 $p_{\text{data}}$，若資料本身就帶有社會偏見，模型便會複製、甚至放大它，再以「客觀演算法」之名輸出。Buolamwini 與 Gebru 的 Gender Shades 即實證：商用人臉系統對深膚色女性的錯誤率遠高於淺膚色男性。

偏誤的來源鏈

來源	機制
歷史／資料偏誤	樣本不具代表性、反映既有不平等
標註偏誤	標註者主觀判斷滲入標籤
目標偏誤	用易測的代理目標（如「點擊」）替代真正想要的（如「品質」）
聚合偏誤	對異質群體用單一模型，犧牲少數群體
反饋迴圈	偏誤決策改變未來資料，惡性循環（見〈AI 就在你身邊〉）

公平性的形式化定義

「公平」不是單一概念。以二元決策、敏感屬性 $A$（如性別）、真實標籤 $Y$、預測 $\hat{Y}$ 為例，至少三種互斥的定義：

人口均等（demographic parity）：$P(\hat{Y}{=}1\mid A{=}a)$ 跨群體相等。
機會均等（equal opportunity）：真陽性率相等，$P(\hat{Y}{=}1\mid Y{=}1,A{=}a)$ 跨群體相等。
校準（calibration）：給定預測分數，實際正例比例跨群體相等。

不可能定理：公平之間會衝突

關鍵且常被忽略的結果（Chouldechova、Kleinberg 等）：當各群體的基準率不同時，校準與誤差率均等無法同時滿足。這意味著「公平」沒有技術上的萬靈解——選擇哪個公平準則是價值判斷與政策抉擇，不能甩鍋給演算法。COMPAS 累犯預測的爭議正源於此：同一系統，依不同公平定義可得出相反的「是否歧視」結論。

緩解：技術之外還需制度

資料層：更具代表性的取樣、重加權、去偏。
演算法層：加公平性約束、對抗式去偏。
後處理層：依群體調整決策閾值。
制度層：明確選定公平準則、跨群體分別評估（而非只看整體準確率）、可解釋性、人在迴圈審查高風險決策、可問責機制。

對使用者與決策者的素養

當 AI 參與影響人的決策（貸款、錄取、醫療、司法），「演算法說的」不等於「公正的」。要求透明、要求分群評估、追問「用了哪個公平定義」，是 AI 時代的公民素養——也是 Uedu Educational Omics 框架中 Ethicomics 維度的核心關切。

深入探討（研究所視角）

公平性準則的不可能定理

入門主體已介紹了人口統計均等（demographic parity）、機會均等（equal opportunity）與校準（calibration）等個別準則，但更深層的問題在於它們彼此衝突。Kleinberg、Mullainathan 與 Raghavan（2016）以及 Chouldechova 的工作證明了一個結構性的「不可能定理」：當不同群體的基底率（base rate）$P(Y=1\mid A=a)$ 不相等時，分類器無法同時滿足校準、相等的偽陽率與相等的偽陰率。其根源可由混淆矩陣的代數恆等式導出——給定盛行率 $p$、陽性預測值 $\text{PPV}$、真陽率 $\text{TPR}$ 與偽陽率 $\text{FPR}$，三者被一條約束綁死：

$$\text{FPR} = \frac{p}{1-p}\cdot\frac{1-\text{PPV}}{\text{PPV}}\cdot \text{TPR}.$$

當 $p$ 隨群體變動時，固定其中兩個量必然使第三個分歧。換言之，「公平」不是單一可優化目標，而是一組互斥約束下的政策選擇，必須由領域脈絡決定要犧牲哪一個。

因果視角與反事實公平

統計關聯式準則無法區分「歧視」與「合理的解釋變項」。Kusner 等人提出的反事實公平（counterfactual fairness）將問題搬到結構因果模型（SCM）$\mathcal{M}=\langle U, V, F\rangle$ 上：一個預測 $\hat{Y}$ 對受保護屬性 $A$ 是反事實公平的，若對所有 $x, a, a'$，

$$P(\hat{Y}_{A\leftarrow a}=y\mid X=x, A=a) = P(\hat{Y}_{A\leftarrow a'}=y\mid X=x, A=a).$$

此處 $A\leftarrow a'$ 是 do-operator 下的介入。這把焦點從「相關」轉向「沿哪些因果路徑傳遞影響是不可接受的」——path-specific fairness 允許保留合法路徑（如資歷影響薪資），同時阻斷經由代理變項（proxy）的歧視路徑。代價是 SCM 通常不可由觀測資料唯一識別，需要強假設或敏感度分析。

開放問題與理論連結

進階研究方向包括：（一）子群體與交叉性公平，Hébert-Johnson 等人的 multicalibration 與 multiaccuracy 要求對一個豐富的子群體族 $\mathcal{C}$ 同時近似校準，與運算學習理論中的 boosting／弱不可知學習有深刻對應；（二）公平性與隱私的張力，差分隱私的雜訊在小群體上放大誤差，與公平目標可能直接衝突；（三）長期動態，靜態約束在回饋迴路下可能反而惡化不平等（Liu 等人的 delayed impact 分析），需以序列決策與強化學習框架重新表述。最後，從泛化理論看，群體間表現落差常源於少數群體樣本稀少導致的估計變異，這把公平問題與分布外泛化（distribution shift）、重加權與 distributionally robust optimization（DRO）連成同一個統計學習主題——公平不只是倫理附加條款，而是穩健學習的核心面向。

--

0

--

32.3%

140.05

82.02%

62,201

AI Reply Desktop Notifications

Chat Message Notifications

Sound notification

More settings