漲價之後,人們真的買得比較少嗎?用資料檢驗經濟理論
從需求彈性到因果推論,計量經濟學如何把抽象理論逼到資料面前接受檢驗
漲價之後,人們真的買得比較少嗎?
2011 年,台北捷運曾經討論一個問題:如果票價調漲一成,搭乘人次會掉多少?有人直覺地說「漲價當然沒人搭」,也有人反駁「上班還是得搭,差別不大」。這兩種說法聽起來都有道理,但它們其實是互相矛盾的經濟學主張——一個說需求對價格很敏感,一個說很不敏感。
問題是:到底誰對?
光靠直覺、辯論或舉幾個身邊的例子,我們永遠分不出勝負。經濟學之所以是一門社會科學,而不是咖啡廳裡的口水戰,關鍵就在於我們可以用資料把理論逼到牆角:把「需求法則」這種抽象命題,翻譯成一個可以被數字證實或推翻的具體預測,然後拿真實世界的觀測值去檢驗它。
這篇文章要談的,就是這座連接「理論」與「資料」的橋——計量經濟學(Econometrics)。
第一步:把理論翻譯成可檢驗的命題

需求法則說:「在其他條件不變下,價格上升,需求量下降。」這句話很優雅,但它有兩個地方無法直接拿去比對資料。
第一,它是定性的(qualitative)——只告訴你方向(下降),沒告訴你幅度。漲一成掉 2% 還是掉 20%,對捷運公司的營收是天差地別。第二,它藏了一個「其他條件不變」(ceteris paribus)的但書,而真實世界裡其他條件從來不會幫你保持不變。
計量經濟學的第一個工作,就是把這句話寫成一條可以估計的式子:
$$ \ln Q_t = \alpha + \beta \ln P_t + \varepsilon_t $$
這裡 $Q_t$ 是某期的需求量、$P_t$ 是價格。取對數(log)之後,係數 $\beta$ 有一個很漂亮的解讀:它就是需求的價格彈性(price elasticity of demand)。
$$ \beta = \frac{\partial \ln Q}{\partial \ln P} = \frac{\% \Delta Q}{\% \Delta P} $$
也就是「價格變動 1%,需求量變動百分之幾」。需求法則預測 $\beta < 0$;若 $|\beta| > 1$ 稱為富有彈性(elastic,漲價總收入反而減少),$|\beta| < 1$ 稱為缺乏彈性(inelastic,漲價總收入增加)。
最後那一項 $\varepsilon_t$ 叫誤差項(error term),它裝著所有我們沒放進模型、卻會影響需求量的因素:天氣、油價、節慶、隨機波動。它不是「我們犯的錯」,而是「世界本來就有的雜訊」。整個計量分析的成敗,幾乎都取決於我們有沒有把這個誤差項處理好。
第二步:相關不等於因果
假設我們真的蒐集了 60 個月的票價與搭乘人次,跑了一條迴歸線,得到 $\hat{\beta} = 0.3$——正的。難道漲價反而讓人更想搭?
當然不是。這是計量經濟學裡最經典的陷阱之一。
問題出在:價格不是上天隨機灑下來的。捷運公司通常在運量上升、需求旺盛時才敢調漲票價。於是「高價」和「高運量」會同時出現,但這不是價格造成運量,而是背後共同的需求榮景同時推高了兩者。資料裡看到的正相關,是一種假象。
這就是「相關不等於因果」(correlation is not causation)的具體面貌。用計量的語言說,是價格 $P_t$ 與誤差項 $\varepsilon_t$ 相關了——景氣好(藏在 $\varepsilon$ 裡)同時影響了價格和運量——這叫內生性(endogeneity)。一旦發生內生性,普通最小平方法(OLS, Ordinary Least Squares)估出來的 $\hat{\beta}$ 就會有偏誤,不能解讀成因果效果。
辨識這個陷阱,比會算迴歸更重要。一個只會按按鈕跑迴歸、卻不問「這個係數能不能解讀成因果」的人,很容易把假象當成發現。
看一個例子:冰淇淋與溺水
每年夏天,冰淇淋銷量上升,溺水人數也上升,兩者資料的相關係數高得嚇人。如果有人據此宣稱「吃冰淇淋會增加溺水風險」,你會覺得荒謬。
荒謬在哪裡?因為有一個共同原因(confounder,干擾因子):氣溫。天氣熱,大家既買更多冰、又更常去玩水。氣溫同時推高了兩個結果,它們之間卻沒有任何因果關係。
把氣溫這個變數放進迴歸「控制住」之後,冰淇淋和溺水之間的關聯就會消失。這正是多元迴歸(multiple regression)的核心價值:
$$ \text{溺水}_t = \alpha + \beta_1 \cdot \text{冰淇淋}_t + \beta_2 \cdot \text{氣溫}_t + \varepsilon_t $$
當我們把氣溫放進來,$\beta_1$ 衡量的就是「在氣溫相同的日子之間,冰淇淋多賣對溺水的關聯」,這時 $\beta_1$ 會趨近於零。捷運的例子也一樣:只要能把「需求榮景」用某些變數控制住,價格係數才有機會逼近真實的彈性。
第三步:怎麼讓「其他條件不變」成真
實驗科學家很幸運:他們可以隨機分組、操弄變因,硬是把「其他條件」控制成不變。但經濟學家大多不能把全國經濟拆成兩半做對照實驗。我們手上的多半是觀察資料(observational data),其他條件總是亂跑。於是計量經濟學發展出一整套工具,去模擬「其他條件不變」的理想狀態。
控制變數(control variables):像冰淇淋例子那樣,把你想得到的干擾因子全放進迴歸。缺點是你永遠不確定有沒有漏掉看不見的因子。
自然實驗(natural experiment):尋找現實中「接近隨機」的事件。例如某條捷運線因故障停駛一週,這不是公司故意設計的,卻提供了一個觀察「沒有這條線時人們怎麼移動」的難得機會。
工具變數(instrumental variable, IV):找一個「只透過價格影響需求、不透過其他途徑」的外生變數,用它把價格中「乾淨的、外生的變動」抽出來,藉此繞過內生性。例如用「燃油稅調整」當作影響票價、但不直接影響搭乘偏好的工具。
雙重差分(difference-in-differences, DiD):比較「政策實施地區」與「未實施地區」在政策前後的變化之差。它的巧妙在於,只要兩地在沒有政策時的趨勢是平行的,就能把所有不隨時間改變的地區差異消掉。
這些方法的共同精神都一樣:想盡辦法逼近一場做不出來的實驗。計量經濟學在過去三十年最大的進展,與其說是統計技術,不如說是這套「因果推論的設計思維」。
第四步:估出來的數字,是真的嗎?
就算我們小心處理了因果,跑出 $\hat{\beta} = -0.4$,還有最後一關:這個 $-0.4$ 會不會只是運氣?換一批樣本會不會變成 $-0.1$ 甚至 $+0.2$?
這正是上一篇〈優統計〉裡假設檢定的用武之地。我們設定虛無假設(null hypothesis)$H_0: \beta = 0$(價格對需求沒有效果),然後問:「如果真相是 $\beta=0$,我們純粹因為抽樣運氣而看到 $-0.4$ 或更極端的機率有多大?」這個機率就是 p 值(p-value)。
如果 p 值很小(慣例上小於 0.05),代表「真相是零、卻剛好抽到這麼明顯的負值」非常不可能,於是我們有信心拒絕 $H_0$,說這個負效果是「統計顯著」的。
但這裡有兩個必須講清楚、否則會誤導人的觀念:
第一,統計顯著 ≠ 重要。 樣本夠大時,連 $\hat\beta=-0.001$ 這種小到沒有政策意義的數字都可能「顯著」。顯著只回答「不是零嗎」,不回答「夠大到值得在意嗎」。後者要看經濟顯著性(economic significance)——這個彈性大到足以改變捷運的訂價決策嗎?
第二,不顯著 ≠ 證明沒效果。 p 值大,可能是真的沒效果,也可能只是你的資料太少、雜訊太大,沒有足夠的力量偵測到它。「沒找到證據」和「證明不存在」是兩回事。
動手試試:自己算一個彈性
不必跑軟體,用兩個觀測點就能體會彈性的算法。假設某商品:
- 價格從 100 元漲到 110 元(上漲 10%)
- 銷量從 500 個掉到 460 個(下跌 8%)
代入彈性定義:
$$ \beta \approx \frac{\% \Delta Q}{\% \Delta P} = \frac{-8\%}{+10\%} = -0.8 $$
$|\beta| = 0.8 < 1$,屬於缺乏彈性。這意味著什麼?算一下總收入(價格 × 銷量):
- 漲價前:$100 \times 500 = 50{,}000$ 元
- 漲價後:$110 \times 460 = 50{,}600$ 元
漲價後總收入反而增加了。這就是為什麼民生必需品、上癮性商品(菸、油、通勤)常被課重稅或敢於漲價——因為它們缺乏彈性,漲價的收入損失被「量減得不多」補了回來。反過來說,若是富有彈性的奢侈品($|\beta|>1$),同樣漲一成可能讓總收入直接掉一塊。
當然,真實研究不會只用兩個點。我們會用幾十、幾百個觀測值跑迴歸,得到一個有信賴區間(confidence interval)的估計,那個區間才能告訴我們這個 $-0.8$ 到底有多可靠。
第五步:資料會說謊,要先質問它
最後一個常被新手忽略的環節:資料本身的品質,往往比模型選哪一種更關鍵。
留意這幾種常見陷阱:
- 選擇偏誤(selection bias):只調查還在搭捷運的人,自然問不到那些被漲價趕走、改騎機車的人。樣本系統性地漏掉了一群人,結論就會偏。
- 遺漏變數(omitted variable):忘了放氣溫、油價、疫情,係數就會把這些影響全揹到自己身上。
- 衡量誤差(measurement error):問卷自陳的「每月搭乘次數」常被高估或記錯,雜訊會稀釋掉真實關聯。
- 倖存者偏誤(survivorship bias):研究「成功創業者的特質」時,那些用了同樣方法卻失敗、早已退場的人不在你的資料裡。
一個成熟的經濟學使用者,看到任何「研究顯示 A 導致 B」的標題,第一反應不是相信或反駁,而是問三個問題:資料怎麼來的?有沒有可能的共同原因?這是相關還是因果? 這三問,就是計量素養的底色。
重點回顧
- 計量經濟學是理論與資料之間的橋:它把「漲價需求減少」這類定性命題,翻成可估計的方程式,讓抽象理論能被數字檢驗。
- 彈性把方向變成幅度:$\beta = \%\Delta Q / \%\Delta P$。$|\beta|>1$ 富有彈性(漲價總收入降),$|\beta|<1$ 缺乏彈性(漲價總收入升)。
- 相關不等於因果:內生性、共同原因會讓資料呈現假象。控制變數、工具變數、雙重差分等方法,都是為了逼近「其他條件不變」的理想實驗。
- 顯著與否要分清兩件事:統計顯著只說「不是零」,不說「夠重要」;不顯著也不等於「證明沒效果」。
- 先質問資料,再相信結論:選擇偏誤、遺漏變數、衡量誤差會讓再漂亮的模型也得出錯誤答案。
深入探討(研究所視角)
在大學階段,我們把迴歸當成「一條最配適的線」。到了研究所,視角會整個翻轉:迴歸的核心不是配線,而是因果識別(identification)——在什麼假設下,估計值才能被賦予因果解讀。
現代計量的主流框架是 Rubin 的潛在結果模型(potential outcomes framework)。對每個個體 $i$,我們設想兩個平行世界的結果:接受處理時的 $Y_i(1)$ 與未接受時的 $Y_i(0)$。個體因果效果是 $Y_i(1)-Y_i(0)$,但我們永遠只觀測到其中一個,另一個是反事實(counterfactual)——這就是 Holland 所稱的「因果推論的根本問題」。所有計量方法,本質上都是在用各種假設去填補那個看不見的反事實。
這也解釋了為何 2021 年諾貝爾經濟學獎頒給 Card、Angrist 與 Imbens:他們的貢獻不是更炫的數學,而是設計思維。Angrist 與 Imbens 釐清了工具變數估出的其實是「局部平均處理效果」(LATE, Local Average Treatment Effect)——只對「因工具而改變行為的那群人」(compliers)成立,不能隨意外推到全體。這個謙遜而精確的洞見,重塑了整個實證經濟學對「我們到底估到了誰的效果」的自覺。
幾個值得繼續探索的方向:
- 斷點迴歸(regression discontinuity, RDD):當某個處理由一條明確門檻決定(如分數剛好過錄取線),門檻兩側近乎隨機,可逼近實驗。
- 合成控制法(synthetic control):當「處理組」只有一個(如某一州實施新政策),用其他州的加權組合「人工合成」出一個反事實對照。
- 因果機器學習(causal ML):把 double machine learning、causal forest 等方法結合高維資料,在控制大量干擾因子的同時估計異質性處理效果。
跨領域地看,這套因果推論語言早已不只屬於經濟學:流行病學用它評估疫苗、資料科學用它做 A/B 測試與政策評估、公共衛生用它衡量介入成效。換句話說,你在「優經濟」裡學到的「如何用資料檢驗一個因果主張」,是一張通往所有實證社會科學與資料科學的通行證。下次再看到「研究顯示」四個字時,你已經有能力追問:這座橋,搭得穩不穩?