當實質 GDP 自己也會吵架:鏈式加權、指數理論與 GDP 衡量的方法論前沿
為什麼成長率取決於你用哪一年當基準?從 Laspeyres、Paasche 到 Fisher 理想指數,再到 GDP 平減指數、折舊鏈與福祉測度的爭論。
當「實質 GDP」自己也會吵架:為什麼成長率取決於你用哪一年當基準?
你已經知道實質 GDP(real GDP)是把名目 GDP(nominal GDP)剝掉物價變動後得到的「真實產量」。但這裡藏著一個讓統計學家睡不著的問題:要剝掉物價,得先選一組價格當作「不變的尺」。問題是——用哪一年的價格?
假設我們要比較 2015 年和 2024 年的台灣產量。如果用 2015 年的價格來評價兩年的產量,會得到一個成長率;如果改用 2024 年的價格,會得到另一個成長率。兩個答案通常不一樣,有時甚至差到一個百分點以上。這不是計算錯誤,而是指數理論(index number theory)的核心難題:當不同商品的相對價格在改變、消費者又會替代(substitute)較便宜的商品時,「總產量成長了多少」這個問題本身就沒有唯一答案。
這篇文章要帶你走進入門篇刻意略過的機房:實質 GDP 究竟怎麼算出來、為什麼現代統計局改用「鏈式加權」(chain-weighting)、GDP 平減指數和 CPI 為何系統性地不一致,以及當我們把 GDP 當成福祉指標時,到底踩到哪些方法論的地雷。

固定基期的陷阱:Laspeyres 與 Paasche 之爭
實質 GDP 的本質是一個「數量指數」(quantity index):它要在價格不斷變動的世界裡,衡量產量這個「量」變了多少。指數理論告訴我們,至少有兩種自然的算法。
設第 $0$ 期(基期)與第 $t$ 期,商品 $i$ 的價格與數量分別為 $p_i^0, q_i^0$ 與 $p_i^t, q_i^t$。
Laspeyres 數量指數用基期價格 $p^0$ 當權重:
$$ Q_L = \frac{\sum_i p_i^0 \, q_i^t}{\sum_i p_i^0 \, q_i^0} $$
Paasche 數量指數改用當期價格 $p^t$ 當權重:
$$ Q_P = \frac{\sum_i p_i^t \, q_i^t}{\sum_i p_i^t \, q_i^0} $$
關鍵事實是:當消費者會替代時,$Q_L \geq Q_P$ 幾乎總是成立。為什麼?因為相對價格下跌的商品(例如運算能力越來越便宜的電腦),其數量通常成長最快。Laspeyres 用「舊的、較高的」價格去評價這些快速成長的商品,等於給了它們過大的權重,把成長率高估;Paasche 用「新的、較低的」價格評價,則傾向低估。
這就是著名的「替代偏誤」(substitution bias)。用固定基期算實質 GDP,本質上是一個 Laspeyres 指數:基期離現在越遠,高估就越嚴重。美國 1990 年代曾發生過經典案例——以 1987 年為固定基期時,1990 年代後期的電腦產業(價格暴跌、數量暴增)讓實質 GDP 成長率被顯著高估。基期一過時,整段歷史的成長率就得回頭修正,這在政策上是無法接受的。
鏈式加權:用 Fisher 指數讓基期「自己滑動」
現代多數國家(美國 BEA 自 1996 年、台灣主計總處亦採用類似做法)的解法是鏈式加權。核心想法是:不要固定一個遙遠的基期,而是每兩個相鄰年份之間都重新計算一次成長率,再把這些「一年期成長率」像鎖鏈一樣串接起來。
而每一個相鄰年份的成長率,採用的是 Fisher 理想指數(Fisher ideal index)——Laspeyres 與 Paasche 的幾何平均:
$$ Q_F = \sqrt{Q_L \times Q_P} $$
Fisher 指數之所以被稱為「理想」,有兩個深刻理由。第一,它取兩個有偏估計的幾何平均,把一個系統性高估、一個系統性低估的偏誤大致對消掉。第二,它是少數同時滿足多項「指數公理」(如時間反轉檢定 time-reversal test、因子反轉檢定 factor-reversal test)的指數。更厲害的是,Diewert(1976)證明 Fisher 指數是一個「上界指數」(superlative index):它能精確對應到一個具有彈性替代結構的生產函數,因此被視為對「真實」數量變動的二階近似。
鏈式加權的代價是:鏈式實質 GDP 的各支出成分不再能直接相加。固定基期下,消費 + 投資 + 政府支出 + 淨出口 = GDP 是恆等式;但鏈式加權因為每年權重都在滑動,各成分加總會出現一個小小的「鏈式殘差」(chain residual)。這就是為什麼官方統計表上常有一欄叫「殘差項」或「統計差異」,初學者常誤以為是計算錯誤,其實是鏈式加權的必然產物。
看一個例子:兩種基準,兩個成長率
我們用一個只有兩種商品的迷你經濟,把替代偏誤算到底。
| 2015 價格 | 2015 數量 | 2024 價格 | 2024 數量 | |
|---|---|---|---|---|
| 電腦 | 100 | 10 | 40 | 30 |
| 稻米 | 20 | 50 | 30 | 55 |
注意電腦相對變便宜(價格 100→40),數量大增(10→30);稻米相對變貴,數量微增。
用 Laspeyres(2015 價格當權重):
$$ Q_L = \frac{100\times 30 + 20 \times 55}{100 \times 10 + 20 \times 50} = \frac{3000 + 1100}{1000 + 1000} = \frac{4100}{2000} = 2.05 $$
成長 105%。
用 Paasche(2024 價格當權重):
$$ Q_P = \frac{40 \times 30 + 30 \times 55}{40 \times 10 + 30 \times 50} = \frac{1200 + 1650}{400 + 1500} = \frac{2850}{1900} = 1.50 $$
成長 50%。
兩個答案差了 55 個百分點!這不是極端虛構——只要相對價格大幅變動(科技業就是如此),差距就會很大。
Fisher 理想指數:
$$ Q_F = \sqrt{2.05 \times 1.50} = \sqrt{3.075} \approx 1.754 $$
成長約 75.4%,落在兩者之間。這個 75.4% 才是現代統計局會採用的「實質產量成長」。你親手算過一次,就會永遠記得:實質 GDP 的成長率不是天上掉下來的數字,而是一個方法論選擇的結果。
GDP 平減指數 vs CPI:為什麼兩個物價指數會打架
物價漲了多少?台灣每個月新聞講的是 CPI(消費者物價指數,Consumer Price Index),但總體經濟學課本算實質 GDP 用的是 GDP 平減指數(GDP deflator)。兩者經常給出不同的通膨率,這不是矛盾,而是它們在量不同的東西。
GDP 平減指數的定義非常直接:
$$ \text{GDP deflator} = \frac{\text{名目 GDP}}{\text{實質 GDP}} \times 100 $$
它涵蓋的是「國內生產的所有最終商品與服務」的價格。三個系統性差異值得記住:
-
籃子內容不同。CPI 衡量一籃「典型消費者購買的商品」,包含進口品(如進口原油、外國手機);GDP 平減指數只涵蓋國內生產的東西,不含進口品,但包含消費者不直接買的資本財、政府服務與出口品。所以油價飆漲會立刻推高 CPI,卻不一定推高 GDP 平減指數(因為石油是進口的,不算進國內生產)。
-
權重機制不同。傳統 CPI 是 Laspeyres 型(固定籃子,存在替代偏誤、傾向高估通膨);鏈式 GDP 平減指數是 Paasche / Fisher 型(權重隨當期變動)。
-
用途不同。CPI 用於調整薪資、退休金、計算實質購買力;GDP 平減指數用於把整體生產的名目值轉成實質值。
一個經典政策含義:美國社會安全給付長期綁定 CPI,而 CPI 的替代偏誤估計每年約高估通膨 0.5–1 個百分點(1996 年 Boskin 委員會的著名結論),意味著數十年累積下來,政府多支付了可觀金額。這也是各國後來推出「鏈式 CPI」(chained CPI)的政策動機。
從 GDP 到 NNP 到國民所得:被折舊吃掉的成長
入門篇談的是「衡量產量」,進階篇要追問:產出之後,這些價值如何分配與消耗?這牽涉到國民所得會計(national income accounting)一條常被忽略的折舊鏈。
GDP 是「毛額」(gross),它沒有扣除生產過程中資本財的耗損(depreciation,固定資本消耗 consumption of fixed capital)。一個國家每年的機器、廠房、道路都在老化,必須有一部分產出拿去「替換」這些耗損,才能維持原有的生產能力。扣掉折舊後得到:
$$ \text{NDP(國內生產淨額)} = \text{GDP} - \text{折舊} $$
NDP 才是真正「可以拿來消費或淨增加資本」的部分。為什麼官方主推 GDP 而非 NDP?因為折舊極難精確衡量(要對全國資本存量的經濟壽命做假設),GDP 反而更「客觀」。但這帶來一個常被忽視的批判:當一國靠拼命消耗資本(或自然資源)換取高 GDP 成長時,GDP 看起來很亮眼,NDP 卻可能停滯。這正是「綠色 GDP」想修正的方向——把自然資本的折耗也算進去。
接著從生產面走到所得面。GDP 是「國內」(domestic,看地理疆界內的生產),GNI(國民總所得,Gross National Income,舊稱 GNP)是「國民」(national,看本國居民賺到的所得,無論在哪裡賺):
$$ \text{GNI} = \text{GDP} + \text{來自國外的要素所得淨額} $$
對台灣這種有大量海外投資與台商獲利匯回的經濟體,GNI 通常高於 GDP;對愛爾蘭這種充滿外資企業(利潤匯出國外)的經濟體,GDP 則會被外企的帳面產出灌水,GNI 明顯低於 GDP。2015 年愛爾蘭因為跨國企業把智財權「搬家」進來,單季 GDP 暴增 26%,被經濟學家 Paul Krugman 嘲諷為「妖精經濟學」(leprechaun economics)——這是 GDP 作為國家經濟規模指標會被跨國資本扭曲的最著名案例。
看不見的 GDP:非市場活動與估算的藝術
GDP 原則上只算「有市場交易」的活動,但現實中統計局必須對大量沒有市場價格的東西做估算(imputation),否則 GDP 會嚴重失真。三個重要例子:
-
自有住宅的設算租金(imputed rent)。如果你租房,房租算進 GDP;但你若自己買房自住,並沒有付租金給別人,這部分服務就「消失」了。為避免「全民買房會讓 GDP 縮水」這種荒謬結果,統計局會設算自住者「等於付給自己」的租金,算進 GDP。這一項在多數國家佔 GDP 約 6–10%,是最大的設算項目之一。
-
政府服務以成本計價。國防、公立教育、警消等沒有市場售價,GDP 用「投入成本」(主要是公務員薪資)來衡量其產出。這帶來一個弔詭:政府生產力若提升(同樣成本做更多事),在 GDP 帳上反而看不出來,因為產出永遠等於投入。
-
地下經濟與無酬家務。毒品、走私等地下經濟,部分國家(如歐盟自 2014 年起)會設法估算納入;而無酬家務勞動(家庭照顧、煮飯)則一律不計入 GDP——這正是女性主義經濟學長期的批判,因為它系統性地低估了主要由女性承擔的勞動價值。
動手試試:當 GDP 上升卻代表福祉下降
請判斷以下情境會讓 GDP 上升、下降,還是不變,並思考它是否反映福祉的真實變化:
- 一場颱風摧毀大量房屋,隨後展開大規模重建。
- 兩個原本各自做家務的單身者結婚,從此自己煮飯、互相照顧(原本若請鐘點工,現在不請了)。
- 空氣污染加重,民眾大量購買空氣清淨機與就醫。
參考思路:情境 1 的重建活動會推升 GDP,但社會福祉其實是下降的(資產被毀),這就是經濟學家所說 GDP 無法區分「進步」與「修復破壞」——所謂「破窗謬誤」(broken window fallacy)的會計版本。情境 2 會讓 GDP 下降(市場服務轉為無酬家務),但生活品質未必變差。情境 3 的清淨機與醫療支出會推升 GDP,但這是在為污染這個「壞東西」付費,福祉明顯下降。三個例子都指向同一個結論:GDP 衡量的是「市場交易的流量」,不是「福祉」。
重點回顧
- 實質 GDP 沒有唯一算法:用基期價格(Laspeyres)會高估成長、用當期價格(Paasche)會低估,差距源於消費者的替代行為(substitution bias)。
- 現代統計採用鏈式加權,以 Fisher 理想指數(Laspeyres 與 Paasche 的幾何平均)逐年串接,代價是各支出成分不再能完美相加,出現「鏈式殘差」。
- GDP 平減指數與 CPI 量的是不同籃子:CPI 含進口、不含資本財,是 Laspeyres 型;GDP 平減指數只算國內生產、權重隨期變動。兩者通膨率不一致是正常的。
- GDP 是毛額,沒扣折舊;扣掉得 NDP。GDP 看地理疆界、GNI 看本國居民所得——愛爾蘭「妖精經濟學」顯示跨國資本如何扭曲 GDP。
- GDP 靠大量設算(自住設算租金、政府成本計價)撐起,且系統性遺漏無酬家務與環境成本,因此不能等同於福祉指標。
深入探討(研究所視角)
指數理論的經濟基礎。 Fisher 指數被稱為「superlative」並非美學偏好,而有嚴格的對偶理論(duality theory)支撐。Diewert(1976, Journal of Econometrics)證明:若真實的生產(或效用)函數屬於「彈性二次型」(flexible functional form,如 translog 或可由二次式精確表示的形式),則 Fisher 指數能精確(exactly)追蹤其數量變動,誤差僅為三階小量。這把指數選擇從「會計慣例」提升為「對未知生產技術做二階泰勒近似」的計量問題。相對地,Törnqvist 指數(對數變動的加權平均)對應 translog 函數,同屬 superlative family,在實務上與 Fisher 幾乎無差異。
Penn World Table 與跨國比較。 把各國 GDP 換成共同單位以做跨國比較,不能用市場匯率(會被資本流動與非貿易財價格扭曲),必須用購買力平價(PPP, Purchasing Power Parity)。但 PPP 本身又是一個指數難題:不同國家的消費結構差異巨大,該用哪國的價格當權重?這引出 Gerschenkron 效應與多邊指數方法(如 Geary-Khamis、EKS 法)。Penn World Table(Feenstra, Inklaar & Timmer, 2015, AER)是這方面的標竿資料庫,研究經濟成長的實證文獻幾乎都建立在它之上,而其版本更迭(PWT 7→8→9→10)對應的方法論調整,曾讓「某國何時超越某國」這類結論發生反轉。
福祉測度的前沿。 對 GDP 作為福祉指標的批判已制度化。Stiglitz-Sen-Fitoussi 委員會(2009)系統性提出改用「家戶可支配所得 + 分配 + 永續性」的多維框架;Jones & Klenow(2016, AER)則提出一個建立在期望效用上的「福祉指標」,把消費、休閒、不平等與預期壽命整合進一個可跨國比較的單一數字,發現許多國家以 GDP 衡量與以福祉衡量的排名差異甚大(例如歐洲多國因休閒較多、壽命較長、不平等較低,福祉排名高於其人均 GDP 排名)。延伸閱讀可關注 Nordhaus 的綠色國民所得會計、聯合國 SEEA(環境經濟綜合帳)以及將自然資本折耗內生化的「真實儲蓄」(genuine savings)指標——這些都是把本文「折舊鏈」與「非市場活動」兩條線推到極致的當代研究方向。