收斂、發散與泰勒展開:分析學如何丈量無限
從芝諾的一步半步出發,理解數列與級數的收斂判別,並用泰勒展開把複雜函數寫成無窮多項多項式之和。
為什麼把無限多個數字加起來,有時得到一個有限的答案?
想像你站在房間的一端,每一步都只走完剩餘距離的一半:第一步走 $\frac{1}{2}$ 公尺,第二步走 $\frac{1}{4}$ 公尺,接著是 $\frac{1}{8}$、$\frac{1}{16}$……。你永遠踏出無限多步,但奇妙的是,你終究會抵達牆邊——總距離恰好是 $1$ 公尺,不多也不少。
這個古老的「芝諾悖論(Zeno's paradox)」其實藏著整個分析學(analysis)最核心的張力:把無限多項相加,結果竟然可以是有限的。要嚴謹回答「什麼時候會收斂、什麼時候會發散」,我們需要建立一套關於數列(sequence)與級數(series)的語言。最後,這套語言會把我們帶到泰勒展開(Taylor expansion)——一種用無窮多項多項式去逼近複雜函數的強大技術。
數列:一串有秩序的數字
數列(sequence)就是一串依序排列的數字,我們寫成 $a_1, a_2, a_3, \dots$,或簡記為 $\{a_n\}_{n=1}^{\infty}$。每一個 $a_n$ 稱為第 $n$ 項,而下標 $n$ 是項次。
例如: - $a_n = \frac{1}{n}$ 給出 $1, \frac{1}{2}, \frac{1}{3}, \frac{1}{4}, \dots$,項愈來愈小。 - $a_n = (-1)^n$ 給出 $-1, 1, -1, 1, \dots$,在兩個值之間來回跳動。 - $a_n = n^2$ 給出 $1, 4, 9, 16, \dots$,無止境地增大。
我們最關心的問題是:當 $n$ 趨於無窮大時,$a_n$ 會「安定」到某個固定的值嗎?

收斂的嚴謹定義
我們說數列 $\{a_n\}$ 收斂(converge) 到極限 $L$,記為 $\lim_{n\to\infty} a_n = L$,意思是:無論你要求多麼接近,數列終究會進入並停留在 $L$ 周圍那麼小的範圍內。
用 $\varepsilon\text{-}N$ 語言精確地說:對任意 $\varepsilon > 0$,都存在一個正整數 $N$,使得只要 $n > N$,就有
$$ |a_n - L| < \varepsilon. $$
這個定義的精神是:$\varepsilon$ 代表「你要求的精度」,而 $N$ 代表「從第幾項開始就能滿足這個精度」。$\varepsilon$ 愈嚴苛,$N$ 通常就得愈大,但只要對每一個 $\varepsilon$ 都找得到對應的 $N$,數列就收斂。
以 $a_n = \frac{1}{n}$ 為例,它收斂到 $0$。若給定 $\varepsilon = 0.001$,我們只要取 $N = 1000$,那麼當 $n > 1000$ 時,$\left|\frac{1}{n} - 0\right| = \frac{1}{n} < 0.001$,確實成立。
若一個數列不收斂,就稱它 發散(diverge)。$a_n = (-1)^n$ 發散(它永遠在 $-1$ 與 $1$ 之間擺盪、不安定),$a_n = n^2$ 也發散(它衝向無窮大)。
級數:把數列的項一個一個加起來
有了數列,我們進一步把它的項加總,得到 級數(series):
$$ \sum_{n=1}^{\infty} a_n = a_1 + a_2 + a_3 + \cdots. $$
但「加無限多項」本身並沒有直接的意義——加法是針對有限項定義的。於是我們改問一個有限的問題:定義 部分和(partial sum)
$$ S_N = \sum_{n=1}^{N} a_n = a_1 + a_2 + \cdots + a_N. $$
部分和本身是一個數列 $\{S_N\}$。我們說級數收斂,當且僅當部分和數列 $\{S_N\}$ 收斂:
$$ \sum_{n=1}^{\infty} a_n = \lim_{N\to\infty} S_N. $$
這是整個級數理論的關鍵轉折:級數的收斂,被巧妙地翻譯成了一個數列的收斂問題。
看一個例子:幾何級數
回到開頭走路的情境,總距離是
$$ \sum_{n=1}^{\infty} \frac{1}{2^n} = \frac{1}{2} + \frac{1}{4} + \frac{1}{8} + \cdots. $$
這是一個 幾何級數(geometric series)。一般形式為 $\sum_{n=0}^{\infty} ar^n$,其中 $a$ 是首項、$r$ 是公比。它的部分和有漂亮的封閉公式。考慮
$$ S_N = a + ar + ar^2 + \cdots + ar^{N-1}, $$
兩邊乘以 $r$ 再相減:
$$ S_N - rS_N = a - ar^N \quad\Longrightarrow\quad S_N = \frac{a(1 - r^N)}{1 - r} \quad (r \neq 1). $$
當 $|r| < 1$ 時,$r^N \to 0$,於是
$$ \sum_{n=0}^{\infty} ar^n = \frac{a}{1 - r}. $$
對我們走路的例子,首項 $a = \frac{1}{2}$、公比 $r = \frac{1}{2}$,所以總和是 $\frac{1/2}{1 - 1/2} = 1$。芝諾的悖論就此化解:無限多步的總長度,精確地等於 $1$ 公尺。
反之,當 $|r| \geq 1$ 時幾何級數發散。例如 $1 + 2 + 4 + 8 + \cdots$($r = 2$)顯然衝向無窮大。
一個重要的迷思:收斂的必要條件不是充分條件
有一個自然的直覺:「如果每一項都愈來愈小、趨近於 $0$,那把它們加起來總該收斂吧?」這個直覺是錯的,而且是初學者最常踩的陷阱。
正確的敘述只有一半:若 $\sum a_n$ 收斂,則必然 $\lim_{n\to\infty} a_n = 0$。這是收斂的 必要條件——可以用來「篩掉」明顯發散的級數(若一般項不趨於 $0$,級數一定發散)。
但反過來不成立。最著名的反例是 調和級數(harmonic series):
$$ \sum_{n=1}^{\infty} \frac{1}{n} = 1 + \frac{1}{2} + \frac{1}{3} + \frac{1}{4} + \cdots. $$
雖然 $\frac{1}{n} \to 0$,這個級數卻 發散!一個經典的證明是把項分組:
$$ 1 + \frac{1}{2} + \underbrace{\left(\frac{1}{3} + \frac{1}{4}\right)}_{> \frac{1}{4}+\frac{1}{4} = \frac{1}{2}} + \underbrace{\left(\frac{1}{5} + \cdots + \frac{1}{8}\right)}_{> 4 \cdot \frac{1}{8} = \frac{1}{2}} + \cdots $$
每一組都大於 $\frac{1}{2}$,而這樣的組有無限多個,所以部分和會無限增大。記住這個反例,能幫你避開無數判斷上的錯誤。
判斷收斂的工具箱
由於部分和往往沒有封閉公式,我們需要一些 斂散判別法(convergence tests) 來間接判斷。以下是幾個最常用的工具。
比較判別法(comparison test):若 $0 \le a_n \le b_n$,且 $\sum b_n$ 收斂,則 $\sum a_n$ 也收斂;反之若 $\sum a_n$ 發散,則 $\sum b_n$ 也發散。直覺是「被一個收斂的級數壓在下方,自己也跑不掉」。
比值判別法(ratio test):計算相鄰項的比值極限
$$ L = \lim_{n\to\infty} \left| \frac{a_{n+1}}{a_n} \right|. $$
若 $L < 1$ 則絕對收斂;$L > 1$ 則發散;$L = 1$ 時判別法失效(需另尋他法)。這個方法對含有階乘或指數的項特別好用。
積分判別法(integral test):對正項遞減函數 $f(n) = a_n$,級數 $\sum a_n$ 與瑕積分 $\int_1^{\infty} f(x)\,dx$ 同斂同散。例如要判斷 $p$-級數 $\sum \frac{1}{n^p}$,可看 $\int_1^{\infty} \frac{1}{x^p}\,dx$,得到結論:$p > 1$ 收斂、$p \le 1$ 發散(這也再次說明了 $p = 1$ 的調和級數發散)。
動手試試:用比值判別法
判斷 $\displaystyle\sum_{n=1}^{\infty} \frac{2^n}{n!}$ 是否收斂。寫出比值:
$$ \left| \frac{a_{n+1}}{a_n} \right| = \frac{2^{n+1}/(n+1)!}{2^n/n!} = \frac{2^{n+1}}{2^n} \cdot \frac{n!}{(n+1)!} = 2 \cdot \frac{1}{n+1} = \frac{2}{n+1}. $$
取極限:$\lim_{n\to\infty} \frac{2}{n+1} = 0 < 1$。由比值判別法,級數收斂。(事實上,它收斂到 $e^2 - 1$,這正是泰勒級數的伏筆。)
條件收斂與絕對收斂
當級數含有正負交錯的項時,情況更微妙。考慮 交錯調和級數(alternating harmonic series):
$$ \sum_{n=1}^{\infty} \frac{(-1)^{n+1}}{n} = 1 - \frac{1}{2} + \frac{1}{3} - \frac{1}{4} + \cdots = \ln 2. $$
它收斂!但若把每一項取絕對值,就退回發散的調和級數。我們稱這種「本身收斂、但取絕對值後發散」的級數為 條件收斂(conditionally convergent);若取絕對值後仍收斂,則稱 絕對收斂(absolutely convergent)。
這個區別並非吹毛求疵。黎曼重排定理(Riemann rearrangement theorem)告訴我們:條件收斂的級數,只要重新排列加總的順序,就能讓它收斂到任何你指定的實數,甚至發散。換言之,對條件收斂級數而言,「加法的交換律」不再成立——這是無限與有限之間最違反直覺的鴻溝之一。
泰勒展開:用無窮級數逼近函數
現在我們把級數的威力推向高峰。許多重要的函數——$e^x$、$\sin x$、$\ln(1+x)$——本身難以直接計算,但它們都能被表示成一個 冪級數(power series),也就是無窮多項多項式之和。
泰勒級數(Taylor series) 的核心想法是:在某一點 $a$ 附近,用函數在該點的各階導數資訊去重建整個函數。其公式為
$$ f(x) = \sum_{n=0}^{\infty} \frac{f^{(n)}(a)}{n!}(x - a)^n = f(a) + f'(a)(x-a) + \frac{f''(a)}{2!}(x-a)^2 + \cdots. $$
當展開點 $a = 0$ 時,特別稱為 馬克勞林級數(Maclaurin series)。直覺上,第一項固定了函數值,第二項配對了斜率,第三項配對了彎曲程度(凹凸),項數愈多、逼近愈精準。
看一個例子:推導 $e^x$ 的展開
指數函數有個極優美的性質:$\frac{d}{dx}e^x = e^x$,所以它的所有階導數都是 $e^x$。在 $a = 0$ 處,$f^{(n)}(0) = e^0 = 1$ 對所有 $n$ 成立。代入泰勒公式:
$$ e^x = \sum_{n=0}^{\infty} \frac{x^n}{n!} = 1 + x + \frac{x^2}{2!} + \frac{x^3}{3!} + \cdots. $$
把 $x = 1$ 代入,便得到計算 $e$ 的方法:$e = 1 + 1 + \frac{1}{2} + \frac{1}{6} + \frac{1}{24} + \cdots \approx 2.71828$。而前面用比值判別法處理的 $\sum \frac{2^n}{n!}$,正是 $e^2 - 1$(缺了 $n=0$ 的那一項 $1$)。
同樣地,可以推得另外兩個基本展開:
$$ \sin x = x - \frac{x^3}{3!} + \frac{x^5}{5!} - \cdots, \qquad \cos x = 1 - \frac{x^2}{2!} + \frac{x^4}{4!} - \cdots. $$
把 $e^x$ 的展開中的 $x$ 換成 $ix$($i$ 為虛數單位),分離實部與虛部,就會神奇地得到 歐拉公式(Euler's formula) $e^{ix} = \cos x + i\sin x$——級數正是連結指數與三角函數的橋樑。
收斂半徑:展開不是處處有效
冪級數並非對所有 $x$ 都收斂。每個冪級數都有一個 收斂半徑(radius of convergence) $R$,使得當 $|x - a| < R$ 時收斂、$|x - a| > R$ 時發散。
例如 $\frac{1}{1-x} = \sum_{n=0}^{\infty} x^n$(這正是 $a=1$、$r=x$ 的幾何級數)只在 $|x| < 1$ 時成立,收斂半徑 $R = 1$。$e^x$、$\sin x$、$\cos x$ 則對所有實數都收斂($R = \infty$)。使用泰勒展開做近似時,必須留意自己是否落在收斂範圍內。
重點回顧
- 數列收斂指當 $n \to \infty$ 時,項 $a_n$ 趨近一個固定極限 $L$;用 $\varepsilon\text{-}N$ 語言精確刻畫「要多近有多近」。
- 級數收斂被定義為其部分和數列 $S_N$ 收斂,把無限相加的問題轉化為數列極限問題。
- 幾何級數 $\sum ar^n$ 在 $|r| < 1$ 時收斂到 $\frac{a}{1-r}$,是最重要的基準範例。
- 關鍵迷思:一般項趨於 $0$ 是收斂的必要而非充分條件;調和級數 $\sum \frac{1}{n}$ 就是項趨於 $0$ 卻發散的反例。
- 泰勒/馬克勞林級數用函數各階導數把函數寫成冪級數,但僅在收斂半徑內有效。
深入探討(研究所視角)
從更高的觀點看,這套理論的嚴謹根基是實數系的 完備性(completeness)。前述所有收斂結論,最終都仰賴實數的「沒有空隙」這個性質,它可由 柯西收斂準則(Cauchy criterion) 等價地表述:數列收斂的充要條件是它是柯西列,即對任意 $\varepsilon > 0$ 存在 $N$,使得 $m, n > N$ 時 $|a_m - a_n| < \varepsilon$。柯西準則的威力在於,它不需要事先知道極限值就能判斷收斂——這在抽象空間中尤為關鍵。把這個概念推廣到一般的度量空間(metric space),「每個柯西列都收斂」的空間便稱為 完備空間(complete space),這是泛函分析(functional analysis)與巴拿赫空間(Banach space)理論的出發點。
泰勒級數則牽涉一個深刻的細節:函數無窮可微(光滑)並不保證它等於自己的泰勒級數。其誤差由 泰勒餘項(Taylor remainder) 控制,拉格朗日形式為
$$ R_n(x) = \frac{f^{(n+1)}(\xi)}{(n+1)!}(x - a)^{n+1}, \quad \xi \text{ 介於 } a \text{ 與 } x \text{ 之間}. $$
只有當 $R_n(x) \to 0$ 時,泰勒級數才真正收斂到原函數。存在「病態」的反例(如 $f(x) = e^{-1/x^2}$,$f(0) = 0$),它在原點無窮可微、所有階導數皆為 $0$,泰勒級數恆等於零,卻不等於函數本身。能被自身泰勒級數表示的函數稱為 解析函數(analytic function),這道門檻把「光滑」與「解析」嚴格區分開來——而在複變分析(complex analysis)中,只要函數在某區域可微一次(全純,holomorphic),就自動是解析的,這是實數與複數世界的一大反差。
這些理論並非象牙塔的玩物。在數值分析中,泰勒展開是有限差分法與數值微分誤差估計的基石;在物理學中,微擾理論(perturbation theory)本質上就是把交互作用展開成級數;在機器學習中,二階優化方法(如牛頓法)正是對損失函數做二階泰勒展開;而傅立葉級數(Fourier series)作為級數理論的另一分支,更撐起了訊號處理與量子力學的半邊天。從芝諾的一步半步,到無窮維空間的完備性,數列與級數始終是分析學丈量「無限」的尺。