當實質 GDP 自己也會吵架：鏈式加權、指數理論與 GDP 衡量的方法論前沿

為什麼成長率取決於你用哪一年當基準？從 Laspeyres、Paasche 到 Fisher 理想指數，再到 GDP 平減指數、折舊鏈與福祉測度的爭論。

進階 · 約 15 分鐘 ·#總體經濟#GDP#指數理論#鏈式加權#國民所得

當「實質 GDP」自己也會吵架：為什麼成長率取決於你用哪一年當基準？

你已經知道實質 GDP（real GDP）是把名目 GDP（nominal GDP）剝掉物價變動後得到的「真實產量」。但這裡藏著一個讓統計學家睡不著的問題：要剝掉物價，得先選一組價格當作「不變的尺」。問題是——用哪一年的價格？

假設我們要比較 2015 年和 2024 年的台灣產量。如果用 2015 年的價格來評價兩年的產量，會得到一個成長率；如果改用 2024 年的價格，會得到另一個成長率。兩個答案通常不一樣，有時甚至差到一個百分點以上。這不是計算錯誤，而是指數理論（index number theory）的核心難題：當不同商品的相對價格在改變、消費者又會替代（substitute）較便宜的商品時，「總產量成長了多少」這個問題本身就沒有唯一答案。

這篇文章要帶你走進入門篇刻意略過的機房：實質 GDP 究竟怎麼算出來、為什麼現代統計局改用「鏈式加權」（chain-weighting）、GDP 平減指數和 CPI 為何系統性地不一致，以及當我們把 GDP 當成福祉指標時，到底踩到哪些方法論的地雷。

GDP 與國民所得進階概念示意圖

固定基期的陷阱：Laspeyres 與 Paasche 之爭

實質 GDP 的本質是一個「數量指數」（quantity index）：它要在價格不斷變動的世界裡，衡量產量這個「量」變了多少。指數理論告訴我們，至少有兩種自然的算法。

設第 $0$ 期（基期）與第 $t$ 期，商品 $i$ 的價格與數量分別為 $p_i^0, q_i^0$ 與 $p_i^t, q_i^t$。

Laspeyres 數量指數用基期價格 $p^0$ 當權重：

$$ Q_L = \frac{\sum_i p_i^0 \, q_i^t}{\sum_i p_i^0 \, q_i^0} $$

Paasche 數量指數改用當期價格 $p^t$ 當權重：

$$ Q_P = \frac{\sum_i p_i^t \, q_i^t}{\sum_i p_i^t \, q_i^0} $$

關鍵事實是：當消費者會替代時，$Q_L \geq Q_P$ 幾乎總是成立。為什麼？因為相對價格下跌的商品（例如運算能力越來越便宜的電腦），其數量通常成長最快。Laspeyres 用「舊的、較高的」價格去評價這些快速成長的商品，等於給了它們過大的權重，把成長率高估；Paasche 用「新的、較低的」價格評價，則傾向低估。

這就是著名的「替代偏誤」（substitution bias）。用固定基期算實質 GDP，本質上是一個 Laspeyres 指數：基期離現在越遠，高估就越嚴重。美國 1990 年代曾發生過經典案例——以 1987 年為固定基期時，1990 年代後期的電腦產業（價格暴跌、數量暴增）讓實質 GDP 成長率被顯著高估。基期一過時，整段歷史的成長率就得回頭修正，這在政策上是無法接受的。

鏈式加權：用 Fisher 指數讓基期「自己滑動」

現代多數國家（美國 BEA 自 1996 年、台灣主計總處亦採用類似做法）的解法是鏈式加權。核心想法是：不要固定一個遙遠的基期，而是每兩個相鄰年份之間都重新計算一次成長率，再把這些「一年期成長率」像鎖鏈一樣串接起來。

而每一個相鄰年份的成長率，採用的是 Fisher 理想指數（Fisher ideal index）——Laspeyres 與 Paasche 的幾何平均：

$$ Q_F = \sqrt{Q_L \times Q_P} $$

Fisher 指數之所以被稱為「理想」，有兩個深刻理由。第一，它取兩個有偏估計的幾何平均，把一個系統性高估、一個系統性低估的偏誤大致對消掉。第二，它是少數同時滿足多項「指數公理」（如時間反轉檢定 time-reversal test、因子反轉檢定 factor-reversal test）的指數。更厲害的是，Diewert（1976）證明 Fisher 指數是一個「上界指數」（superlative index）：它能精確對應到一個具有彈性替代結構的生產函數，因此被視為對「真實」數量變動的二階近似。

鏈式加權的代價是：鏈式實質 GDP 的各支出成分不再能直接相加。固定基期下，消費 + 投資 + 政府支出 + 淨出口 = GDP 是恆等式；但鏈式加權因為每年權重都在滑動，各成分加總會出現一個小小的「鏈式殘差」（chain residual）。這就是為什麼官方統計表上常有一欄叫「殘差項」或「統計差異」，初學者常誤以為是計算錯誤，其實是鏈式加權的必然產物。

看一個例子：兩種基準，兩個成長率

我們用一個只有兩種商品的迷你經濟，把替代偏誤算到底。

	2015 價格	2015 數量	2024 價格	2024 數量
電腦	100	10	40	30
稻米	20	50	30	55

注意電腦相對變便宜（價格 100→40），數量大增（10→30）；稻米相對變貴，數量微增。

用 Laspeyres（2015 價格當權重）：

$$ Q_L = \frac{100\times 30 + 20 \times 55}{100 \times 10 + 20 \times 50} = \frac{3000 + 1100}{1000 + 1000} = \frac{4100}{2000} = 2.05 $$

成長 105%。

用 Paasche（2024 價格當權重）：

$$ Q_P = \frac{40 \times 30 + 30 \times 55}{40 \times 10 + 30 \times 50} = \frac{1200 + 1650}{400 + 1500} = \frac{2850}{1900} = 1.50 $$

成長 50%。

兩個答案差了 55 個百分點！這不是極端虛構——只要相對價格大幅變動（科技業就是如此），差距就會很大。

Fisher 理想指數：

$$ Q_F = \sqrt{2.05 \times 1.50} = \sqrt{3.075} \approx 1.754 $$

成長約 75.4%，落在兩者之間。這個 75.4% 才是現代統計局會採用的「實質產量成長」。你親手算過一次，就會永遠記得：實質 GDP 的成長率不是天上掉下來的數字，而是一個方法論選擇的結果。

GDP 平減指數 vs CPI：為什麼兩個物價指數會打架

物價漲了多少？台灣每個月新聞講的是 CPI（消費者物價指數，Consumer Price Index），但總體經濟學課本算實質 GDP 用的是 GDP 平減指數（GDP deflator）。兩者經常給出不同的通膨率，這不是矛盾，而是它們在量不同的東西。

GDP 平減指數的定義非常直接：

$$ \text{GDP deflator} = \frac{\text{名目 GDP}}{\text{實質 GDP}} \times 100 $$

它涵蓋的是「國內生產的所有最終商品與服務」的價格。三個系統性差異值得記住：

籃子內容不同。CPI 衡量一籃「典型消費者購買的商品」，包含進口品（如進口原油、外國手機）；GDP 平減指數只涵蓋國內生產的東西，不含進口品，但包含消費者不直接買的資本財、政府服務與出口品。所以油價飆漲會立刻推高 CPI，卻不一定推高 GDP 平減指數（因為石油是進口的，不算進國內生產）。
權重機制不同。傳統 CPI 是 Laspeyres 型（固定籃子，存在替代偏誤、傾向高估通膨）；鏈式 GDP 平減指數是 Paasche / Fisher 型（權重隨當期變動）。
用途不同。CPI 用於調整薪資、退休金、計算實質購買力；GDP 平減指數用於把整體生產的名目值轉成實質值。

一個經典政策含義：美國社會安全給付長期綁定 CPI，而 CPI 的替代偏誤估計每年約高估通膨 0.5–1 個百分點（1996 年 Boskin 委員會的著名結論），意味著數十年累積下來，政府多支付了可觀金額。這也是各國後來推出「鏈式 CPI」（chained CPI）的政策動機。

從 GDP 到 NNP 到國民所得：被折舊吃掉的成長

入門篇談的是「衡量產量」，進階篇要追問：產出之後，這些價值如何分配與消耗？這牽涉到國民所得會計（national income accounting）一條常被忽略的折舊鏈。

GDP 是「毛額」（gross），它沒有扣除生產過程中資本財的耗損（depreciation，固定資本消耗 consumption of fixed capital）。一個國家每年的機器、廠房、道路都在老化，必須有一部分產出拿去「替換」這些耗損，才能維持原有的生產能力。扣掉折舊後得到：

$$ \text{NDP（國內生產淨額）} = \text{GDP} - \text{折舊} $$

NDP 才是真正「可以拿來消費或淨增加資本」的部分。為什麼官方主推 GDP 而非 NDP？因為折舊極難精確衡量（要對全國資本存量的經濟壽命做假設），GDP 反而更「客觀」。但這帶來一個常被忽視的批判：當一國靠拼命消耗資本（或自然資源）換取高 GDP 成長時，GDP 看起來很亮眼，NDP 卻可能停滯。這正是「綠色 GDP」想修正的方向——把自然資本的折耗也算進去。

接著從生產面走到所得面。GDP 是「國內」（domestic，看地理疆界內的生產），GNI（國民總所得，Gross National Income，舊稱 GNP）是「國民」（national，看本國居民賺到的所得，無論在哪裡賺）：

$$ \text{GNI} = \text{GDP} + \text{來自國外的要素所得淨額} $$

對台灣這種有大量海外投資與台商獲利匯回的經濟體，GNI 通常高於 GDP；對愛爾蘭這種充滿外資企業（利潤匯出國外）的經濟體，GDP 則會被外企的帳面產出灌水，GNI 明顯低於 GDP。2015 年愛爾蘭因為跨國企業把智財權「搬家」進來，單季 GDP 暴增 26%，被經濟學家 Paul Krugman 嘲諷為「妖精經濟學」（leprechaun economics）——這是 GDP 作為國家經濟規模指標會被跨國資本扭曲的最著名案例。

看不見的 GDP：非市場活動與估算的藝術

GDP 原則上只算「有市場交易」的活動，但現實中統計局必須對大量沒有市場價格的東西做估算（imputation），否則 GDP 會嚴重失真。三個重要例子：

自有住宅的設算租金（imputed rent）。如果你租房，房租算進 GDP；但你若自己買房自住，並沒有付租金給別人，這部分服務就「消失」了。為避免「全民買房會讓 GDP 縮水」這種荒謬結果，統計局會設算自住者「等於付給自己」的租金，算進 GDP。這一項在多數國家佔 GDP 約 6–10%，是最大的設算項目之一。
政府服務以成本計價。國防、公立教育、警消等沒有市場售價，GDP 用「投入成本」（主要是公務員薪資）來衡量其產出。這帶來一個弔詭：政府生產力若提升（同樣成本做更多事），在 GDP 帳上反而看不出來，因為產出永遠等於投入。
地下經濟與無酬家務。毒品、走私等地下經濟，部分國家（如歐盟自 2014 年起）會設法估算納入；而無酬家務勞動（家庭照顧、煮飯）則一律不計入 GDP——這正是女性主義經濟學長期的批判，因為它系統性地低估了主要由女性承擔的勞動價值。

動手試試：當 GDP 上升卻代表福祉下降

請判斷以下情境會讓 GDP 上升、下降，還是不變，並思考它是否反映福祉的真實變化：

一場颱風摧毀大量房屋，隨後展開大規模重建。
兩個原本各自做家務的單身者結婚，從此自己煮飯、互相照顧（原本若請鐘點工，現在不請了）。
空氣污染加重，民眾大量購買空氣清淨機與就醫。

參考思路：情境 1 的重建活動會推升 GDP，但社會福祉其實是下降的（資產被毀），這就是經濟學家所說 GDP 無法區分「進步」與「修復破壞」——所謂「破窗謬誤」（broken window fallacy）的會計版本。情境 2 會讓 GDP 下降（市場服務轉為無酬家務），但生活品質未必變差。情境 3 的清淨機與醫療支出會推升 GDP，但這是在為污染這個「壞東西」付費，福祉明顯下降。三個例子都指向同一個結論：GDP 衡量的是「市場交易的流量」，不是「福祉」。

重點回顧

實質 GDP 沒有唯一算法：用基期價格（Laspeyres）會高估成長、用當期價格（Paasche）會低估，差距源於消費者的替代行為（substitution bias）。
現代統計採用鏈式加權，以 Fisher 理想指數（Laspeyres 與 Paasche 的幾何平均）逐年串接，代價是各支出成分不再能完美相加，出現「鏈式殘差」。
GDP 平減指數與 CPI 量的是不同籃子：CPI 含進口、不含資本財，是 Laspeyres 型；GDP 平減指數只算國內生產、權重隨期變動。兩者通膨率不一致是正常的。
GDP 是毛額，沒扣折舊；扣掉得 NDP。GDP 看地理疆界、GNI 看本國居民所得——愛爾蘭「妖精經濟學」顯示跨國資本如何扭曲 GDP。
GDP 靠大量設算（自住設算租金、政府成本計價）撐起，且系統性遺漏無酬家務與環境成本，因此不能等同於福祉指標。

深入探討（研究所視角）

指數理論的經濟基礎。 Fisher 指數被稱為「superlative」並非美學偏好，而有嚴格的對偶理論（duality theory）支撐。Diewert（1976, Journal of Econometrics）證明：若真實的生產（或效用）函數屬於「彈性二次型」（flexible functional form，如 translog 或可由二次式精確表示的形式），則 Fisher 指數能精確（exactly）追蹤其數量變動，誤差僅為三階小量。這把指數選擇從「會計慣例」提升為「對未知生產技術做二階泰勒近似」的計量問題。相對地，Törnqvist 指數（對數變動的加權平均）對應 translog 函數，同屬 superlative family，在實務上與 Fisher 幾乎無差異。

Penn World Table 與跨國比較。 把各國 GDP 換成共同單位以做跨國比較，不能用市場匯率（會被資本流動與非貿易財價格扭曲），必須用購買力平價（PPP, Purchasing Power Parity）。但 PPP 本身又是一個指數難題：不同國家的消費結構差異巨大，該用哪國的價格當權重？這引出 Gerschenkron 效應與多邊指數方法（如 Geary-Khamis、EKS 法）。Penn World Table（Feenstra, Inklaar & Timmer, 2015, AER）是這方面的標竿資料庫，研究經濟成長的實證文獻幾乎都建立在它之上，而其版本更迭（PWT 7→8→9→10）對應的方法論調整，曾讓「某國何時超越某國」這類結論發生反轉。

福祉測度的前沿。 對 GDP 作為福祉指標的批判已制度化。Stiglitz-Sen-Fitoussi 委員會（2009）系統性提出改用「家戶可支配所得 + 分配 + 永續性」的多維框架；Jones & Klenow（2016, AER）則提出一個建立在期望效用上的「福祉指標」，把消費、休閒、不平等與預期壽命整合進一個可跨國比較的單一數字，發現許多國家以 GDP 衡量與以福祉衡量的排名差異甚大（例如歐洲多國因休閒較多、壽命較長、不平等較低，福祉排名高於其人均 GDP 排名）。延伸閱讀可關注 Nordhaus 的綠色國民所得會計、聯合國 SEEA（環境經濟綜合帳）以及將自然資本折耗內生化的「真實儲蓄」（genuine savings）指標——這些都是把本文「折舊鏈」與「非市場活動」兩條線推到極致的當代研究方向。

← 上一篇

把一個國家塞進一個數字：GDP 如何衡量經濟規模

--

8

32.3%

140.05

82.02%

62,201

AI 回覆桌面通知

聊天訊息通知

聲音通知

更多設定