漲價之後，人們真的買得比較少嗎？用資料檢驗經濟理論

從需求彈性到因果推論，計量經濟學如何把抽象理論逼到資料面前接受檢驗

intermediate · 約 14 分鐘 ·#計量經濟學#因果推論#需求彈性#迴歸分析#應用經濟

漲價之後，人們真的買得比較少嗎？

2011 年，台北捷運曾經討論一個問題：如果票價調漲一成，搭乘人次會掉多少？有人直覺地說「漲價當然沒人搭」，也有人反駁「上班還是得搭，差別不大」。這兩種說法聽起來都有道理，但它們其實是互相矛盾的經濟學主張——一個說需求對價格很敏感，一個說很不敏感。

問題是：到底誰對？

光靠直覺、辯論或舉幾個身邊的例子，我們永遠分不出勝負。經濟學之所以是一門社會科學，而不是咖啡廳裡的口水戰，關鍵就在於我們可以用資料把理論逼到牆角：把「需求法則」這種抽象命題，翻譯成一個可以被數字證實或推翻的具體預測，然後拿真實世界的觀測值去檢驗它。

這篇文章要談的，就是這座連接「理論」與「資料」的橋——計量經濟學（Econometrics）。

第一步：把理論翻譯成可檢驗的命題

經濟數據與計量概念示意圖

需求法則說：「在其他條件不變下，價格上升，需求量下降。」這句話很優雅，但它有兩個地方無法直接拿去比對資料。

第一，它是定性的（qualitative）——只告訴你方向（下降），沒告訴你幅度。漲一成掉 2% 還是掉 20%，對捷運公司的營收是天差地別。第二，它藏了一個「其他條件不變」（ceteris paribus）的但書，而真實世界裡其他條件從來不會幫你保持不變。

計量經濟學的第一個工作，就是把這句話寫成一條可以估計的式子：

$$ \ln Q_t = \alpha + \beta \ln P_t + \varepsilon_t $$

這裡 $Q_t$ 是某期的需求量、$P_t$ 是價格。取對數（log）之後，係數 $\beta$ 有一個很漂亮的解讀：它就是需求的價格彈性（price elasticity of demand）。

$$ \beta = \frac{\partial \ln Q}{\partial \ln P} = \frac{\% \Delta Q}{\% \Delta P} $$

也就是「價格變動 1%，需求量變動百分之幾」。需求法則預測 $\beta < 0$；若 $|\beta| > 1$ 稱為富有彈性（elastic，漲價總收入反而減少），$|\beta| < 1$ 稱為缺乏彈性（inelastic，漲價總收入增加）。

最後那一項 $\varepsilon_t$ 叫誤差項（error term），它裝著所有我們沒放進模型、卻會影響需求量的因素：天氣、油價、節慶、隨機波動。它不是「我們犯的錯」，而是「世界本來就有的雜訊」。整個計量分析的成敗，幾乎都取決於我們有沒有把這個誤差項處理好。

第二步：相關不等於因果

假設我們真的蒐集了 60 個月的票價與搭乘人次，跑了一條迴歸線，得到 $\hat{\beta} = 0.3$——正的。難道漲價反而讓人更想搭？

當然不是。這是計量經濟學裡最經典的陷阱之一。

問題出在：價格不是上天隨機灑下來的。捷運公司通常在運量上升、需求旺盛時才敢調漲票價。於是「高價」和「高運量」會同時出現，但這不是價格造成運量，而是背後共同的需求榮景同時推高了兩者。資料裡看到的正相關，是一種假象。

這就是「相關不等於因果」（correlation is not causation）的具體面貌。用計量的語言說，是價格 $P_t$ 與誤差項 $\varepsilon_t$ 相關了——景氣好（藏在 $\varepsilon$ 裡）同時影響了價格和運量——這叫內生性（endogeneity）。一旦發生內生性，普通最小平方法（OLS, Ordinary Least Squares）估出來的 $\hat{\beta}$ 就會有偏誤，不能解讀成因果效果。

辨識這個陷阱，比會算迴歸更重要。一個只會按按鈕跑迴歸、卻不問「這個係數能不能解讀成因果」的人，很容易把假象當成發現。

看一個例子：冰淇淋與溺水

每年夏天，冰淇淋銷量上升，溺水人數也上升，兩者資料的相關係數高得嚇人。如果有人據此宣稱「吃冰淇淋會增加溺水風險」，你會覺得荒謬。

荒謬在哪裡？因為有一個共同原因（confounder，干擾因子）：氣溫。天氣熱，大家既買更多冰、又更常去玩水。氣溫同時推高了兩個結果，它們之間卻沒有任何因果關係。

把氣溫這個變數放進迴歸「控制住」之後，冰淇淋和溺水之間的關聯就會消失。這正是多元迴歸（multiple regression）的核心價值：

$$ \text{溺水}_t = \alpha + \beta_1 \cdot \text{冰淇淋}_t + \beta_2 \cdot \text{氣溫}_t + \varepsilon_t $$

當我們把氣溫放進來，$\beta_1$ 衡量的就是「在氣溫相同的日子之間，冰淇淋多賣對溺水的關聯」，這時 $\beta_1$ 會趨近於零。捷運的例子也一樣：只要能把「需求榮景」用某些變數控制住，價格係數才有機會逼近真實的彈性。

第三步：怎麼讓「其他條件不變」成真

實驗科學家很幸運：他們可以隨機分組、操弄變因，硬是把「其他條件」控制成不變。但經濟學家大多不能把全國經濟拆成兩半做對照實驗。我們手上的多半是觀察資料（observational data），其他條件總是亂跑。於是計量經濟學發展出一整套工具，去模擬「其他條件不變」的理想狀態。

控制變數（control variables）：像冰淇淋例子那樣，把你想得到的干擾因子全放進迴歸。缺點是你永遠不確定有沒有漏掉看不見的因子。

自然實驗（natural experiment）：尋找現實中「接近隨機」的事件。例如某條捷運線因故障停駛一週，這不是公司故意設計的，卻提供了一個觀察「沒有這條線時人們怎麼移動」的難得機會。

工具變數（instrumental variable, IV）：找一個「只透過價格影響需求、不透過其他途徑」的外生變數，用它把價格中「乾淨的、外生的變動」抽出來,藉此繞過內生性。例如用「燃油稅調整」當作影響票價、但不直接影響搭乘偏好的工具。

雙重差分（difference-in-differences, DiD）：比較「政策實施地區」與「未實施地區」在政策前後的變化之差。它的巧妙在於，只要兩地在沒有政策時的趨勢是平行的，就能把所有不隨時間改變的地區差異消掉。

這些方法的共同精神都一樣：想盡辦法逼近一場做不出來的實驗。計量經濟學在過去三十年最大的進展，與其說是統計技術，不如說是這套「因果推論的設計思維」。

第四步：估出來的數字，是真的嗎？

就算我們小心處理了因果，跑出 $\hat{\beta} = -0.4$，還有最後一關：這個 $-0.4$ 會不會只是運氣？換一批樣本會不會變成 $-0.1$ 甚至 $+0.2$？

這正是上一篇〈優統計〉裡假設檢定的用武之地。我們設定虛無假設（null hypothesis）$H_0: \beta = 0$（價格對需求沒有效果），然後問：「如果真相是 $\beta=0$，我們純粹因為抽樣運氣而看到 $-0.4$ 或更極端的機率有多大？」這個機率就是 p 值（p-value）。

如果 p 值很小（慣例上小於 0.05），代表「真相是零、卻剛好抽到這麼明顯的負值」非常不可能，於是我們有信心拒絕 $H_0$，說這個負效果是「統計顯著」的。

但這裡有兩個必須講清楚、否則會誤導人的觀念：

第一，統計顯著 ≠ 重要。 樣本夠大時，連 $\hat\beta=-0.001$ 這種小到沒有政策意義的數字都可能「顯著」。顯著只回答「不是零嗎」，不回答「夠大到值得在意嗎」。後者要看經濟顯著性（economic significance）——這個彈性大到足以改變捷運的訂價決策嗎？

第二，不顯著 ≠ 證明沒效果。 p 值大，可能是真的沒效果，也可能只是你的資料太少、雜訊太大，沒有足夠的力量偵測到它。「沒找到證據」和「證明不存在」是兩回事。

動手試試：自己算一個彈性

不必跑軟體，用兩個觀測點就能體會彈性的算法。假設某商品：

價格從 100 元漲到 110 元（上漲 10%）
銷量從 500 個掉到 460 個（下跌 8%）

代入彈性定義：

$$ \beta \approx \frac{\% \Delta Q}{\% \Delta P} = \frac{-8\%}{+10\%} = -0.8 $$

$|\beta| = 0.8 < 1$，屬於缺乏彈性。這意味著什麼？算一下總收入（價格 × 銷量）：

漲價前：$100 \times 500 = 50{,}000$ 元
漲價後：$110 \times 460 = 50{,}600$ 元

漲價後總收入反而增加了。這就是為什麼民生必需品、上癮性商品（菸、油、通勤）常被課重稅或敢於漲價——因為它們缺乏彈性，漲價的收入損失被「量減得不多」補了回來。反過來說，若是富有彈性的奢侈品（$|\beta|>1$），同樣漲一成可能讓總收入直接掉一塊。

當然，真實研究不會只用兩個點。我們會用幾十、幾百個觀測值跑迴歸，得到一個有信賴區間（confidence interval）的估計，那個區間才能告訴我們這個 $-0.8$ 到底有多可靠。

第五步：資料會說謊，要先質問它

最後一個常被新手忽略的環節：資料本身的品質，往往比模型選哪一種更關鍵。

留意這幾種常見陷阱：

選擇偏誤（selection bias）：只調查還在搭捷運的人，自然問不到那些被漲價趕走、改騎機車的人。樣本系統性地漏掉了一群人，結論就會偏。
遺漏變數（omitted variable）：忘了放氣溫、油價、疫情，係數就會把這些影響全揹到自己身上。
衡量誤差（measurement error）：問卷自陳的「每月搭乘次數」常被高估或記錯，雜訊會稀釋掉真實關聯。
倖存者偏誤（survivorship bias）：研究「成功創業者的特質」時，那些用了同樣方法卻失敗、早已退場的人不在你的資料裡。

一個成熟的經濟學使用者，看到任何「研究顯示 A 導致 B」的標題，第一反應不是相信或反駁，而是問三個問題：資料怎麼來的？有沒有可能的共同原因？這是相關還是因果？ 這三問，就是計量素養的底色。

重點回顧

計量經濟學是理論與資料之間的橋：它把「漲價需求減少」這類定性命題，翻成可估計的方程式，讓抽象理論能被數字檢驗。
彈性把方向變成幅度：$\beta = \%\Delta Q / \%\Delta P$。$|\beta|>1$ 富有彈性（漲價總收入降），$|\beta|<1$ 缺乏彈性（漲價總收入升）。
相關不等於因果：內生性、共同原因會讓資料呈現假象。控制變數、工具變數、雙重差分等方法，都是為了逼近「其他條件不變」的理想實驗。
顯著與否要分清兩件事：統計顯著只說「不是零」，不說「夠重要」；不顯著也不等於「證明沒效果」。
先質問資料，再相信結論：選擇偏誤、遺漏變數、衡量誤差會讓再漂亮的模型也得出錯誤答案。

深入探討（研究所視角）

在大學階段，我們把迴歸當成「一條最配適的線」。到了研究所，視角會整個翻轉：迴歸的核心不是配線，而是因果識別（identification）——在什麼假設下，估計值才能被賦予因果解讀。

現代計量的主流框架是 Rubin 的潛在結果模型（potential outcomes framework）。對每個個體 $i$，我們設想兩個平行世界的結果：接受處理時的 $Y_i(1)$ 與未接受時的 $Y_i(0)$。個體因果效果是 $Y_i(1)-Y_i(0)$，但我們永遠只觀測到其中一個，另一個是反事實（counterfactual）——這就是 Holland 所稱的「因果推論的根本問題」。所有計量方法，本質上都是在用各種假設去填補那個看不見的反事實。

這也解釋了為何 2021 年諾貝爾經濟學獎頒給 Card、Angrist 與 Imbens：他們的貢獻不是更炫的數學，而是設計思維。Angrist 與 Imbens 釐清了工具變數估出的其實是「局部平均處理效果」（LATE, Local Average Treatment Effect）——只對「因工具而改變行為的那群人」（compliers）成立，不能隨意外推到全體。這個謙遜而精確的洞見，重塑了整個實證經濟學對「我們到底估到了誰的效果」的自覺。

幾個值得繼續探索的方向：

斷點迴歸（regression discontinuity, RDD）：當某個處理由一條明確門檻決定（如分數剛好過錄取線），門檻兩側近乎隨機，可逼近實驗。
合成控制法（synthetic control）：當「處理組」只有一個（如某一州實施新政策），用其他州的加權組合「人工合成」出一個反事實對照。
因果機器學習（causal ML）：把 double machine learning、causal forest 等方法結合高維資料，在控制大量干擾因子的同時估計異質性處理效果。

跨領域地看，這套因果推論語言早已不只屬於經濟學：流行病學用它評估疫苗、資料科學用它做 A/B 測試與政策評估、公共衛生用它衡量介入成效。換句話說，你在「優經濟」裡學到的「如何用資料檢驗一個因果主張」，是一張通往所有實證社會科學與資料科學的通行證。下次再看到「研究顯示」四個字時，你已經有能力追問：這座橋，搭得穩不穩？

漲價導致買得少，還是「買得少的時段剛好漲價」？破解計量的內生性陷阱

--

8

32.3%

140.05

82.02%

62,201

AI 回覆桌面通知

聊天訊息通知

聲音通知

更多設定

漲價之後，人們真的買得比較少嗎？用資料檢驗經濟理論