收斂、發散與泰勒展開：分析學如何丈量無限

從芝諾的一步半步出發，理解數列與級數的收斂判別，並用泰勒展開把複雜函數寫成無窮多項多項式之和。

intermediate · 約 14 分鐘 ·#數列#級數#收斂與發散#泰勒展開#微積分#數學分析

為什麼把無限多個數字加起來，有時得到一個有限的答案？

想像你站在房間的一端，每一步都只走完剩餘距離的一半：第一步走 $\frac{1}{2}$ 公尺，第二步走 $\frac{1}{4}$ 公尺，接著是 $\frac{1}{8}$、$\frac{1}{16}$……。你永遠踏出無限多步，但奇妙的是，你終究會抵達牆邊——總距離恰好是 $1$ 公尺，不多也不少。

這個古老的「芝諾悖論（Zeno's paradox）」其實藏著整個分析學（analysis）最核心的張力：把無限多項相加，結果竟然可以是有限的。要嚴謹回答「什麼時候會收斂、什麼時候會發散」，我們需要建立一套關於數列（sequence）與級數（series）的語言。最後，這套語言會把我們帶到泰勒展開（Taylor expansion）——一種用無窮多項多項式去逼近複雜函數的強大技術。

數列：一串有秩序的數字

數列（sequence）就是一串依序排列的數字，我們寫成 $a_1, a_2, a_3, \dots$，或簡記為 $\{a_n\}_{n=1}^{\infty}$。每一個 $a_n$ 稱為第 $n$ 項，而下標 $n$ 是項次。

例如： - $a_n = \frac{1}{n}$ 給出 $1, \frac{1}{2}, \frac{1}{3}, \frac{1}{4}, \dots$，項愈來愈小。 - $a_n = (-1)^n$ 給出 $-1, 1, -1, 1, \dots$，在兩個值之間來回跳動。 - $a_n = n^2$ 給出 $1, 4, 9, 16, \dots$，無止境地增大。

我們最關心的問題是：當 $n$ 趨於無窮大時，$a_n$ 會「安定」到某個固定的值嗎？

$數列與級數概念示意圖$

收斂的嚴謹定義

我們說數列 $\{a_n\}$ 收斂（converge） 到極限 $L$，記為 $\lim_{n\to\infty} a_n = L$，意思是：無論你要求多麼接近，數列終究會進入並停留在 $L$ 周圍那麼小的範圍內。

用 $\varepsilon\text{-}N$ 語言精確地說：對任意 $\varepsilon > 0$，都存在一個正整數 $N$，使得只要 $n > N$，就有

$$ |a_n - L| < \varepsilon. $$

這個定義的精神是：$\varepsilon$ 代表「你要求的精度」，而 $N$ 代表「從第幾項開始就能滿足這個精度」。$\varepsilon$ 愈嚴苛，$N$ 通常就得愈大，但只要對每一個 $\varepsilon$ 都找得到對應的 $N$，數列就收斂。

以 $a_n = \frac{1}{n}$ 為例，它收斂到 $0$。若給定 $\varepsilon = 0.001$，我們只要取 $N = 1000$，那麼當 $n > 1000$ 時，$\left|\frac{1}{n} - 0\right| = \frac{1}{n} < 0.001$，確實成立。

若一個數列不收斂，就稱它 發散（diverge）。$a_n = (-1)^n$ 發散（它永遠在 $-1$ 與 $1$ 之間擺盪、不安定），$a_n = n^2$ 也發散（它衝向無窮大）。

級數：把數列的項一個一個加起來

有了數列，我們進一步把它的項加總，得到 級數（series）：

$$ \sum_{n=1}^{\infty} a_n = a_1 + a_2 + a_3 + \cdots. $$

但「加無限多項」本身並沒有直接的意義——加法是針對有限項定義的。於是我們改問一個有限的問題：定義 部分和（partial sum）

$$ S_N = \sum_{n=1}^{N} a_n = a_1 + a_2 + \cdots + a_N. $$

部分和本身是一個數列 $\{S_N\}$。我們說級數收斂，當且僅當部分和數列 $\{S_N\}$ 收斂：

$$ \sum_{n=1}^{\infty} a_n = \lim_{N\to\infty} S_N. $$

這是整個級數理論的關鍵轉折：級數的收斂，被巧妙地翻譯成了一個數列的收斂問題。

看一個例子：幾何級數

回到開頭走路的情境，總距離是

$$ \sum_{n=1}^{\infty} \frac{1}{2^n} = \frac{1}{2} + \frac{1}{4} + \frac{1}{8} + \cdots. $$

這是一個 幾何級數（geometric series）。一般形式為 $\sum_{n=0}^{\infty} ar^n$，其中 $a$ 是首項、$r$ 是公比。它的部分和有漂亮的封閉公式。考慮

$$ S_N = a + ar + ar^2 + \cdots + ar^{N-1}, $$

兩邊乘以 $r$ 再相減：

$$ S_N - rS_N = a - ar^N \quad\Longrightarrow\quad S_N = \frac{a(1 - r^N)}{1 - r} \quad (r \neq 1). $$

當 $|r| < 1$ 時，$r^N \to 0$，於是

$$ \sum_{n=0}^{\infty} ar^n = \frac{a}{1 - r}. $$

對我們走路的例子，首項 $a = \frac{1}{2}$、公比 $r = \frac{1}{2}$，所以總和是 $\frac{1/2}{1 - 1/2} = 1$。芝諾的悖論就此化解：無限多步的總長度，精確地等於 $1$ 公尺。

反之，當 $|r| \geq 1$ 時幾何級數發散。例如 $1 + 2 + 4 + 8 + \cdots$（$r = 2$）顯然衝向無窮大。

一個重要的迷思：收斂的必要條件不是充分條件

有一個自然的直覺：「如果每一項都愈來愈小、趨近於 $0$，那把它們加起來總該收斂吧？」這個直覺是錯的，而且是初學者最常踩的陷阱。

正確的敘述只有一半：若 $\sum a_n$ 收斂，則必然 $\lim_{n\to\infty} a_n = 0$。這是收斂的 必要條件——可以用來「篩掉」明顯發散的級數（若一般項不趨於 $0$，級數一定發散）。

但反過來不成立。最著名的反例是 調和級數（harmonic series）：

$$ \sum_{n=1}^{\infty} \frac{1}{n} = 1 + \frac{1}{2} + \frac{1}{3} + \frac{1}{4} + \cdots. $$

雖然 $\frac{1}{n} \to 0$，這個級數卻發散！一個經典的證明是把項分組：

$$ 1 + \frac{1}{2} + \underbrace{\left(\frac{1}{3} + \frac{1}{4}\right)}_{> \frac{1}{4}+\frac{1}{4} = \frac{1}{2}} + \underbrace{\left(\frac{1}{5} + \cdots + \frac{1}{8}\right)}_{> 4 \cdot \frac{1}{8} = \frac{1}{2}} + \cdots $$

每一組都大於 $\frac{1}{2}$，而這樣的組有無限多個，所以部分和會無限增大。記住這個反例，能幫你避開無數判斷上的錯誤。

判斷收斂的工具箱

由於部分和往往沒有封閉公式，我們需要一些 斂散判別法（convergence tests） 來間接判斷。以下是幾個最常用的工具。

比較判別法（comparison test）：若 $0 \le a_n \le b_n$，且 $\sum b_n$ 收斂，則 $\sum a_n$ 也收斂；反之若 $\sum a_n$ 發散，則 $\sum b_n$ 也發散。直覺是「被一個收斂的級數壓在下方，自己也跑不掉」。

比值判別法（ratio test）：計算相鄰項的比值極限

$$ L = \lim_{n\to\infty} \left| \frac{a_{n+1}}{a_n} \right|. $$

若 $L < 1$ 則絕對收斂；$L > 1$ 則發散；$L = 1$ 時判別法失效（需另尋他法）。這個方法對含有階乘或指數的項特別好用。

積分判別法（integral test）：對正項遞減函數 $f(n) = a_n$，級數 $\sum a_n$ 與瑕積分 $\int_1^{\infty} f(x)\,dx$ 同斂同散。例如要判斷 $p$-級數 $\sum \frac{1}{n^p}$，可看 $\int_1^{\infty} \frac{1}{x^p}\,dx$，得到結論：$p > 1$ 收斂、$p \le 1$ 發散（這也再次說明了 $p = 1$ 的調和級數發散）。

動手試試：用比值判別法

判斷 $\displaystyle\sum_{n=1}^{\infty} \frac{2^n}{n!}$ 是否收斂。寫出比值：

$$ \left| \frac{a_{n+1}}{a_n} \right| = \frac{2^{n+1}/(n+1)!}{2^n/n!} = \frac{2^{n+1}}{2^n} \cdot \frac{n!}{(n+1)!} = 2 \cdot \frac{1}{n+1} = \frac{2}{n+1}. $$

取極限：$\lim_{n\to\infty} \frac{2}{n+1} = 0 < 1$。由比值判別法，級數收斂。（事實上，它收斂到 $e^2 - 1$，這正是泰勒級數的伏筆。）

條件收斂與絕對收斂

當級數含有正負交錯的項時，情況更微妙。考慮 交錯調和級數（alternating harmonic series）：

$$ \sum_{n=1}^{\infty} \frac{(-1)^{n+1}}{n} = 1 - \frac{1}{2} + \frac{1}{3} - \frac{1}{4} + \cdots = \ln 2. $$

它收斂！但若把每一項取絕對值，就退回發散的調和級數。我們稱這種「本身收斂、但取絕對值後發散」的級數為 條件收斂（conditionally convergent）；若取絕對值後仍收斂，則稱 絕對收斂（absolutely convergent）。

這個區別並非吹毛求疵。黎曼重排定理（Riemann rearrangement theorem）告訴我們：條件收斂的級數，只要重新排列加總的順序，就能讓它收斂到任何你指定的實數，甚至發散。換言之，對條件收斂級數而言，「加法的交換律」不再成立——這是無限與有限之間最違反直覺的鴻溝之一。

泰勒展開：用無窮級數逼近函數

現在我們把級數的威力推向高峰。許多重要的函數——$e^x$、$\sin x$、$\ln(1+x)$——本身難以直接計算，但它們都能被表示成一個 冪級數（power series），也就是無窮多項多項式之和。

泰勒級數（Taylor series） 的核心想法是：在某一點 $a$ 附近，用函數在該點的各階導數資訊去重建整個函數。其公式為

$$ f(x) = \sum_{n=0}^{\infty} \frac{f^{(n)}(a)}{n!}(x - a)^n = f(a) + f'(a)(x-a) + \frac{f''(a)}{2!}(x-a)^2 + \cdots. $$

當展開點 $a = 0$ 時，特別稱為 馬克勞林級數（Maclaurin series）。直覺上，第一項固定了函數值，第二項配對了斜率，第三項配對了彎曲程度（凹凸），項數愈多、逼近愈精準。

看一個例子：推導 $e^x$ 的展開

指數函數有個極優美的性質：$\frac{d}{dx}e^x = e^x$，所以它的所有階導數都是 $e^x$。在 $a = 0$ 處，$f^{(n)}(0) = e^0 = 1$ 對所有 $n$ 成立。代入泰勒公式：

$$ e^x = \sum_{n=0}^{\infty} \frac{x^n}{n!} = 1 + x + \frac{x^2}{2!} + \frac{x^3}{3!} + \cdots. $$

把 $x = 1$ 代入，便得到計算 $e$ 的方法：$e = 1 + 1 + \frac{1}{2} + \frac{1}{6} + \frac{1}{24} + \cdots \approx 2.71828$。而前面用比值判別法處理的 $\sum \frac{2^n}{n!}$，正是 $e^2 - 1$（缺了 $n=0$ 的那一項 $1$）。

同樣地，可以推得另外兩個基本展開：

$$ \sin x = x - \frac{x^3}{3!} + \frac{x^5}{5!} - \cdots, \qquad \cos x = 1 - \frac{x^2}{2!} + \frac{x^4}{4!} - \cdots. $$

把 $e^x$ 的展開中的 $x$ 換成 $ix$（$i$ 為虛數單位），分離實部與虛部，就會神奇地得到 歐拉公式（Euler's formula） $e^{ix} = \cos x + i\sin x$——級數正是連結指數與三角函數的橋樑。

收斂半徑：展開不是處處有效

冪級數並非對所有 $x$ 都收斂。每個冪級數都有一個 收斂半徑（radius of convergence） $R$，使得當 $|x - a| < R$ 時收斂、$|x - a| > R$ 時發散。

例如 $\frac{1}{1-x} = \sum_{n=0}^{\infty} x^n$（這正是 $a=1$、$r=x$ 的幾何級數）只在 $|x| < 1$ 時成立，收斂半徑 $R = 1$。$e^x$、$\sin x$、$\cos x$ 則對所有實數都收斂（$R = \infty$）。使用泰勒展開做近似時，必須留意自己是否落在收斂範圍內。

重點回顧

數列收斂指當 $n \to \infty$ 時，項 $a_n$ 趨近一個固定極限 $L$；用 $\varepsilon\text{-}N$ 語言精確刻畫「要多近有多近」。
級數收斂被定義為其部分和數列 $S_N$ 收斂，把無限相加的問題轉化為數列極限問題。
幾何級數 $\sum ar^n$ 在 $|r| < 1$ 時收斂到 $\frac{a}{1-r}$，是最重要的基準範例。
關鍵迷思：一般項趨於 $0$ 是收斂的必要而非充分條件；調和級數 $\sum \frac{1}{n}$ 就是項趨於 $0$ 卻發散的反例。
泰勒/馬克勞林級數用函數各階導數把函數寫成冪級數，但僅在收斂半徑內有效。

深入探討（研究所視角）

從更高的觀點看，這套理論的嚴謹根基是實數系的 完備性（completeness）。前述所有收斂結論，最終都仰賴實數的「沒有空隙」這個性質，它可由 柯西收斂準則（Cauchy criterion） 等價地表述：數列收斂的充要條件是它是柯西列，即對任意 $\varepsilon > 0$ 存在 $N$，使得 $m, n > N$ 時 $|a_m - a_n| < \varepsilon$。柯西準則的威力在於，它不需要事先知道極限值就能判斷收斂——這在抽象空間中尤為關鍵。把這個概念推廣到一般的度量空間（metric space），「每個柯西列都收斂」的空間便稱為 完備空間（complete space），這是泛函分析（functional analysis）與巴拿赫空間（Banach space）理論的出發點。

泰勒級數則牽涉一個深刻的細節：函數無窮可微（光滑）並不保證它等於自己的泰勒級數。其誤差由 泰勒餘項（Taylor remainder） 控制，拉格朗日形式為

$$ R_n(x) = \frac{f^{(n+1)}(\xi)}{(n+1)!}(x - a)^{n+1}, \quad \xi \text{ 介於 } a \text{ 與 } x \text{ 之間}. $$

只有當 $R_n(x) \to 0$ 時，泰勒級數才真正收斂到原函數。存在「病態」的反例（如 $f(x) = e^{-1/x^2}$，$f(0) = 0$），它在原點無窮可微、所有階導數皆為 $0$，泰勒級數恆等於零，卻不等於函數本身。能被自身泰勒級數表示的函數稱為 解析函數（analytic function），這道門檻把「光滑」與「解析」嚴格區分開來——而在複變分析（complex analysis）中，只要函數在某區域可微一次（全純，holomorphic），就自動是解析的，這是實數與複數世界的一大反差。

這些理論並非象牙塔的玩物。在數值分析中，泰勒展開是有限差分法與數值微分誤差估計的基石；在物理學中，微擾理論（perturbation theory）本質上就是把交互作用展開成級數；在機器學習中，二階優化方法（如牛頓法）正是對損失函數做二階泰勒展開；而傅立葉級數（Fourier series）作為級數理論的另一分支，更撐起了訊號處理與量子力學的半邊天。從芝諾的一步半步，到無窮維空間的完備性，數列與級數始終是分析學丈量「無限」的尺。

相加的順序為何要緊：絕對收斂、條件收斂與黎曼重排定理

--

5

32.3%

140.05

82.02%

62,201

AI 回覆桌面通知

聊天訊息通知

聲音通知

更多設定