Home
探索 Uedu
學生控制台
註冊會員/登入
研究知情同意中心
教師控制台
課程設定
支援與訊息
Uptime 數據

UeduGPTs

--

Jupyters

2

UG26 CISOSE26
臺北 AQI 48 · 臺中 AQI 34 · 臺南 AQI 31 · 高雄 AQI 29

AI 回覆桌面通知

AI 助教回覆完成時顯示桌面通知

聊天訊息通知

同學在討論區發送訊息時通知

聲音通知

每當有新通知時播放提示音

AI 倫理與治理
AI 倫理與治理

AI 偏誤與公平性:演算法為什麼會「歧視」

AI 不會憑空產生偏見——它從我們的資料裡學來。

AI 偏誤與公平性:演算法為什麼會「歧視」 概念插圖
概念示意插圖(AI 生成,僅作輔助理解)
研究  ·  約 13 分鐘  ·  倫理偏誤公平性研究

偏誤不是 bug,是學習目標的忠實反映

AI 沒有惡意,但它忠實地擬合資料——包括資料中的歷史不平等。經驗風險最小化只要求逼近 $p_{\text{data}}$,若資料本身就帶有社會偏見,模型便會複製、甚至放大它,再以「客觀演算法」之名輸出。Buolamwini 與 Gebru 的 Gender Shades 即實證:商用人臉系統對深膚色女性的錯誤率遠高於淺膚色男性。

偏誤的來源鏈

來源 機制
歷史/資料偏誤 樣本不具代表性、反映既有不平等
標註偏誤 標註者主觀判斷滲入標籤
目標偏誤 用易測的代理目標(如「點擊」)替代真正想要的(如「品質」)
聚合偏誤 對異質群體用單一模型,犧牲少數群體
反饋迴圈 偏誤決策改變未來資料,惡性循環(見〈AI 就在你身邊〉)

公平性的形式化定義

「公平」不是單一概念。以二元決策、敏感屬性 $A$(如性別)、真實標籤 $Y$、預測 $\hat{Y}$ 為例,至少三種互斥的定義:

  • 人口均等(demographic parity):$P(\hat{Y}{=}1\mid A{=}a)$ 跨群體相等。
  • 機會均等(equal opportunity):真陽性率相等,$P(\hat{Y}{=}1\mid Y{=}1,A{=}a)$ 跨群體相等。
  • 校準(calibration):給定預測分數,實際正例比例跨群體相等。

不可能定理:公平之間會衝突

關鍵且常被忽略的結果(Chouldechova、Kleinberg 等):當各群體的基準率不同時,校準與誤差率均等無法同時滿足。這意味著「公平」沒有技術上的萬靈解——選擇哪個公平準則是價值判斷與政策抉擇,不能甩鍋給演算法。COMPAS 累犯預測的爭議正源於此:同一系統,依不同公平定義可得出相反的「是否歧視」結論。

緩解:技術之外還需制度

  • 資料層:更具代表性的取樣、重加權、去偏。
  • 演算法層:加公平性約束、對抗式去偏。
  • 後處理層:依群體調整決策閾值。
  • 制度層:明確選定公平準則、跨群體分別評估(而非只看整體準確率)、可解釋性、人在迴圈審查高風險決策、可問責機制。

對使用者與決策者的素養

當 AI 參與影響人的決策(貸款、錄取、醫療、司法),「演算法說的」不等於「公正的」。要求透明、要求分群評估、追問「用了哪個公平定義」,是 AI 時代的公民素養——也是 Uedu Educational Omics 框架中 Ethicomics 維度的核心關切。

深入探討(研究所視角)

公平性準則的不可能定理

入門主體已介紹了人口統計均等(demographic parity)、機會均等(equal opportunity)與校準(calibration)等個別準則,但更深層的問題在於它們彼此衝突。Kleinberg、Mullainathan 與 Raghavan(2016)以及 Chouldechova 的工作證明了一個結構性的「不可能定理」:當不同群體的基底率(base rate)$P(Y=1\mid A=a)$ 不相等時,分類器無法同時滿足校準、相等的偽陽率與相等的偽陰率。其根源可由混淆矩陣的代數恆等式導出——給定盛行率 $p$、陽性預測值 $\text{PPV}$、真陽率 $\text{TPR}$ 與偽陽率 $\text{FPR}$,三者被一條約束綁死:

$$\text{FPR} = \frac{p}{1-p}\cdot\frac{1-\text{PPV}}{\text{PPV}}\cdot \text{TPR}.$$

當 $p$ 隨群體變動時,固定其中兩個量必然使第三個分歧。換言之,「公平」不是單一可優化目標,而是一組互斥約束下的政策選擇,必須由領域脈絡決定要犧牲哪一個。

因果視角與反事實公平

統計關聯式準則無法區分「歧視」與「合理的解釋變項」。Kusner 等人提出的反事實公平(counterfactual fairness)將問題搬到結構因果模型(SCM)$\mathcal{M}=\langle U, V, F\rangle$ 上:一個預測 $\hat{Y}$ 對受保護屬性 $A$ 是反事實公平的,若對所有 $x, a, a'$,

$$P(\hat{Y}_{A\leftarrow a}=y\mid X=x, A=a) = P(\hat{Y}_{A\leftarrow a'}=y\mid X=x, A=a).$$

此處 $A\leftarrow a'$ 是 do-operator 下的介入。這把焦點從「相關」轉向「沿哪些因果路徑傳遞影響是不可接受的」——path-specific fairness 允許保留合法路徑(如資歷影響薪資),同時阻斷經由代理變項(proxy)的歧視路徑。代價是 SCM 通常不可由觀測資料唯一識別,需要強假設或敏感度分析。

開放問題與理論連結

進階研究方向包括:(一)子群體與交叉性公平,Hébert-Johnson 等人的 multicalibration 與 multiaccuracy 要求對一個豐富的子群體族 $\mathcal{C}$ 同時近似校準,與運算學習理論中的 boosting/弱不可知學習有深刻對應;(二)公平性與隱私的張力,差分隱私的雜訊在小群體上放大誤差,與公平目標可能直接衝突;(三)長期動態,靜態約束在回饋迴路下可能反而惡化不平等(Liu 等人的 delayed impact 分析),需以序列決策與強化學習框架重新表述。最後,從泛化理論看,群體間表現落差常源於少數群體樣本稀少導致的估計變異,這把公平問題與分布外泛化(distribution shift)、重加權與 distributionally robust optimization(DRO)連成同一個統計學習主題——公平不只是倫理附加條款,而是穩健學習的核心面向。

接著問 AI 助教

點一下複製提問,到 ClassroomGPT、優學伴(AIDA)或你的 UeduGPTs 頻道貼上,AI 會引用本專區內容回答。

AI 共讀助教正在陪你讀:AI 偏誤與公平性:演算法為什麼會「歧視」
嗨!我是這篇文章的共讀助教,只根據〈AI 偏誤與公平性:演算法為什麼會「歧視」〉的內容回答。可以問我「解釋某段」「舉個例子」「出題考我」,或反白文中段落後點下方「解釋選取段落」。