2020年4月3日 星期五

極限的定義在說什麼?

$\lim\limits_{n\to\infty} a_n = L$ 意味著數列 $a_n$ 隨著 $n$ 變大會無止境地往 $L$ 靠近。直觀地理解這件事並不難,但如果真的要「證明」一個關於極限的陳述時,到底要檢查什麼?舉個簡單的例子:$$\lim\limits_{n\to\infty}a_n = A\ \ \ \&\ \ \ \lim\limits_{n\to\infty}b_n=B\ \ \Rightarrow\ \ \lim\limits_{n\to\infty} (a_n+b_n) = A+B\label{1}\tag{1}$$ 這很顯然,但說它「顯然成立」,顯然不是一個證明。能說得更清楚嗎?「因為 $a_n$ 往 $A$ 靠近,$b_n$ 往 $B$ 靠近,因此 $a_n+b_n$ 會往 $A+B$ 靠近。」這樣呢?聽起來沒錯,但好像只是用白話說一次,這樣算證明嗎?仔細想想,會發現這裡我們所遇到的困難,並不是「不會證明」,而是「不知道怎麼樣算是證明」。要解決這個問題,我們需要一個正式的定義,像下面這樣:
如果『某條件』成立,則我們說 $\lim\limits_{n\to\infty} a_n = L$。
其中『某條件』必須是可以確實檢查的事項,而不能只是直覺式的概念。只有建立了這樣的定義,我們才能知道證明到底是要證什麼。

在繼續討論之前,需要先釐清一件事。我們有時會用「$a_n$ 跟 $L$ 很近」(或者說「$|a_n-L|$ 很小」)這樣的說法,這其實有一點語病。當我們說「$a_n$ 跟 $L$ 很近」,並不是指某一項 $a_n$ 跟 $L$ 很近,而是要表達「整個數列到了第 $n$ 項之後都跟 $L$ 很近」,這很重要。比如說 $1,0,1,0,1,0,\ldots$ 這個數列,它的偶數項都跟 $0$ 很近 (其實就是 $0$),但我們不能說它的極限是 $0$,因為奇數項完全沒有往 $0$ 靠近的意思。因此,你可以找到某一項 $a_n$ 跟 $L$ 很近,甚至是無窮多項 $a_n$ 跟 $L$ 很近,並沒有用。重要的是能找到某個 $a_n$,從那之後的每一項:$a_{n+1},a_{n+2},\ldots$ 都跟 $L$ 很近。用數學的語言來說,就是說像「$|a_{100}-L|<0.01$」這樣的資訊並沒有什麼意義,而是要「$|a_n-L|<0.01$ 對所有的 $n\ge 100$」才有意義。雖然如此,為了方便,我們偶爾還是會使用「$a_n$ 跟 $L$ 很近」這樣的說法,但請記得它真正想表達的是從第 $n$ 項之後都很近。

回到我們的主題。極限的定義對初學者來說不太容易掌握。究其原因,我認為癥結點可能在於思考的「順序」。一般我們在看到 $\lim\limits_{n\to\infty} a_n = L$ 時,直覺的想法是「當 $n$ 很大,$a_n$ 會跟 $L$ 很近。」這樣的想法或許不能說錯,但卻無法給出可實際檢查的條件,因為無論 $n$ 多大,我們無法從 $a_n$ 與 $L$ 的距離做出任何判斷。並沒有一個標準說,如果 $\lim\limits_{n\to\infty} a_n = L$,那 $|a_{100}-L|$ 應該多小,$|a_{1000}-L|$ 應該多小,$|a_{10000}-L|$ 應該多小……。事實上,收斂速度這種東西要多慢就可以有多慢。比如考慮下面這樣的數列:$$a_n = \left\{\begin{array}{l}\pi\mbox{ 的小數點後第 }n\mbox{ 位}, \quad \mbox{當 }n\le 10000\\ 1/n, \quad \mbox{當 }n>10000.\end{array}\right.$$它的極限當然是 $0$,但前 $10000$ 項只是在惡搞。像這樣,很容易構造出一個收斂數列,它的前十萬項、百萬項、一億項……任意你高興的項數,與它的極限相去甚遠。所以怎麼辦?到底如何鑑定一個數列是否收斂?我說問題在於思考的「順序」。想想看,我們雖然不能說 $n$ 多大會讓 $|a_n-L|$ 很小,但如果 $a_n$ 確實收斂到 $L$,只要一直往後看,$|a_n-L|$ 總是會在「某個 $n$ 之後」變得很小才對。也就是說,不要想「如果 $n$ 很大,$|a_n-L|$ 會很小」,而是改成「$|a_n-L|$ 會很小,只要 $n$ 夠大」。很巧妙地,換成後面這樣的思維方式,就變成了一個可確實檢查的條件。因為我們可以
先說出希望 $|a_n-L|$ 有多小,再來回應 $n$ 需要多大。
然後,
如果每個希望都能得到回應,就表示 $\lim\limits_{n\to\infty} a_n = L$ 成立,反之,只要有一個希望得不到回應,就表示不成立。
下面用一個虛擬的對話來演示這個邏輯。
小明跟小美說:「我這裡有一個數列 $a_n$,它的極限是 $L$。」小美想要確定小明是不是對的,於是問:「$|a_n-L|$ 會小於 $0.1$ 嗎?」小明看了一下,說:「可以,只要 $n\ge 21$。」小美又問:「$|a_n-L|$ 會小於 $0.005$ 嗎?」小明又檢查了一下,說:「可以,只要 $n\ge 753$。」小美還不死心,想一次給他死,於是問:「$|a_n-L|$ 會小於 $10^{-10}$ 嗎?」小明這時沒辦法再算得那麼精確了,但經過一番奮鬥,他終於還是得出了結論:「可以,只要 $n\ge 10^{12}$。」小美終於被說服了。
注意小明給的回應都是「$n\ge $ 某數」,這個「某數」不一定要給得很剛好,比如說最後的 $n\ge 10^{12}$,也許 $n\ge 10^{11}$ 其實就夠了。不過這不重要,重要的是能確定從某一項之後小美的要求會滿足就好。不過話說回來,小美最後被說服,還是有點太輕率了。因為 $a_n$ 跟 $L$ 能靠近到 $10^{-10}$ 之內,未必就能靠近到 $10^{-11}$ 之內;如果能靠近到 $10^{-100}$ 之內,也未必就能靠近到 $10^{-101}$ 之內。我們說極限是「無止境地靠近」,因此,要真正確定 $a_n$ 的極限是 $L$,小明必須能回應「任意」的要求,也就是說:
無論 $\varepsilon$ 是多小的正數,只要小美要求 $|a_n-L|<\varepsilon$,小明都要能找到一個夠大的正整數 $N$,使得數列從第 $N$ 項之後都會滿足小美的要求。
把這件事用精簡的數學語言寫下來,就得到數列極限的定義了:
定義  如果對任意 $\varepsilon>0$,存在正整數 $N$,使得 $|a_n-L|<\varepsilon$ 對所有的 $n\ge N$,則我們說 $\lim\limits_{n\to\infty} a_n = L$。
看到這裡,可以停下來稍微感動一下。這樣看似平凡的一個陳述,乃是經歷了好幾代數學家的思索才得到(參考文末所附的簡史)。

弄懂了數列極限的定義,函數極限也就沒太大困難了。下面我們以 $\ f:(a,b)\to\mathbb{R}$ 來說明。令 $p$ 為 $(a,b)$ 中的一點,我們說 $\lim\limits_{x\to p}f(x) = L$,意味著「當 $x$ 趨近於 $p$,$f(x)$ 會無止境地往 $L$ 靠近。」這裡要注意,我們看的是 $x$ 往 $p$ 靠近時,$f(x)$ 的趨勢,而不在意 $f(p)$ 本身是什麼。這就好像數列極限我們是看當 $n$ 變大,$a_n$ 的趨勢,並不在意 $a_\infty$ 是什麼。事實上,在數列中根本也沒有 $a_\infty$ 這一項。然而對函數來說,真的有 $f(p)$ 這東西,所以反而會造成混淆。

現在,就像數列極限一樣,不要把 $\lim\limits_{x\to p}f(x) = L$ 想成 $x$ 很靠近 $p$ 時 $|f(x)-L|$ 會很小,這給不出具體的條件。反過來,將其理解為「$|f(x)-L|$ 會很小,只要 $x$ 足夠靠近 $p$」。因此,檢驗的方式就是先說我們希望 $|f(x)-L|$ 多小,再看 $x$ 與 $p$ 需要多靠近。如果任何這樣的要求都能達成,那上述極限就成立,如果某個要求無法達成,那就不成立。另外,也跟數列極限一樣,你能在 $p$ 附近找到某個 $x$ 或很多 $x$ 使得 $|f(x)-L|$ 很小並沒有意義。我們要的是「對所有足夠靠近 $p$ 的 $x$,$|f(x)-L|$ 都很小」。因此,必須要找到 $p$ 點附近的一個範圍,比如 $(p-0.1,p+0.1)$、$(p-0.01,p+0.01)$ 之類的,在這之內的所有 $x$,除了 $p$ 之外(因為 $f(p)$ 是誰我們不在意),都會讓 $|f(x)-L|$ 很小。我們可以弄一個類似上面小明與小美的虛擬對話,不過這裡就把它省去吧。直接給結論:
如果小明要說服小美 $\lim\limits_{x\to p}f(x)=L$,那麼就是說,無論 $\varepsilon$ 是多小的正數,只要小美要求 $|f(x)-L|<\varepsilon$,小明都要能找到一個在 $p$ 附近足夠小的範圍 $(p-\delta,p+\delta)$,使得對所有在這範圍中的 $x$,除了 $x=p$ 之外,都滿足小美的要求。
另外注意到,「$x$ 落在 $(p-\delta,p+\delta)$ 之間但 $x\ne p$」可以寫成 $0<|x-p|<\delta$。這樣,把上面的結論用精簡的數學語言寫下,我們就得到函數極限的定義,如下:
定義  如果對任意 $\varepsilon>0$,存在 $\delta>0$,使得 $|f(x)-L|<\varepsilon$ 對所有滿足 $0<|x-p|<\delta$ 的 $x$ 皆成立,則我們說 $\lim\limits_{x\to p}f(x)=L$。
這就是惡名昭彰著名的 $\varepsilon$-$\delta$ 定義。

到這裡我們的說明就算大功告成了。不過即使弄懂了定義,要熟練地使用它們來進行論證仍然不是一件容易的事。一般數學系也要到大二之後才會嚴格要求,但即使如此,如果不是把成為數學家當作目標的學生,通常到畢業了也不會真正熟練這些東西。下面附上 $\eqref{1}$ 的證明以供參考。
[$\eqref{1}$ 的證明]  對任給的 $\varepsilon>0$,我們需要證明存在某個 $N\in\mathbb{N}$,使得$$|(a_n+b_n)-(A+B)|<\varepsilon\quad\forall\,n\ge N.$$首先,$$\begin{align}|(a_n+b_n)-(A+B)|&=|(a_n-A)+(b_n-B)|\notag\\&\le |a_n-A|+|b_n-B|.\label{2}\tag{2}\end{align}$$由於 $\lim\limits_{n\to\infty}a_n=A$,存在某個 $N_1\in\mathbb{N}$,使得$$|a_n-A|<\varepsilon/2\quad\mbox{對所有的 }n\ge N_1\mbox{。}$$同樣地,因為 $\lim\limits_{n\to\infty}b_n=B$,存在 $N_2\in\mathbb{N}$ 使得$$|b_n-B|<\varepsilon/2\quad\mbox{對所有的 }n\ge N_2\mbox{。}$$現在,只要挑選 $N$ 同時大於等於 $N_1$ 及 $N_2$,則對所有的 $n\ge N$,上面兩個不等式都會成立。比如令 $N=\max(N_1,N_2)$。 這樣,就得到$$|a_n-A|+|b_n-B|<\varepsilon/2+\varepsilon/2=\varepsilon\quad\mbox{對所有的 }n\ge N.\label{3}\tag{3}$$合併 $\eqref{2}$ 與 $\eqref{3}$ 就得到我們所要的結論。

$\raise 2px {\large\S}$ 極限簡史

最後分享一些關於極限的歷史,從中可看出這東西確實不是那麼簡單。當然,數學家是要無中生有把這個定義想出來,難度比單純地理解它高得多。
  1. 在微積分剛發明的時候 (大約 1680 年),連「微分、積分是取極限得出的值」這樣的想法都不明確。比如萊布尼茲說 $$f'(x)=\frac{f(x+h)-f(x)}{h},$$其中 $h$ 是無窮小量 (infinitesimal)。
  2. 1734 年,一個名叫 George Berkeley 的哲學家對「無窮小量」提出質疑。簡單一句話:「它到底是不是零?」數學家表示困窘。
  3. 隨著時間推移,越來越多人理解、認同、宣揚微積分是建立在極限概念之上的學問。這基本上已解決柏克萊的質問:我們並沒有真的除以什麼鬼無窮小量,只是除以一個很小的量,然後看那個量往 0 靠近會發生什麼事。但雖然有「取極限」的想法,對其並沒有嚴格的定義,可能也不需要。
  4. 隨著時間再推移,數學家處理的問題越來越複雜,比如要考慮多重極限 $\lim\limits_{m,n\to \infty}a_{mn}$、函數序列的極限 $\lim\limits_{n\to \infty}f_n(x)$ 等等,開始有一些微妙的問題發生(這類問題比較深,無法在此談論)。於是有些人對長久以來一直用直覺做事開始感到不舒服。Lagrange 也許是第一個認真地覺得這件事不處理不行的大咖。他自己想不出滿意的答案,還廣發英雄帖,在 1784 年的 Berlin Academy Prize,以「微積分的基礎」為主題徵文,希望有人能把(包含極限在內的)一些微積分相關的東西定義清楚。結果據說有些人講得不錯,但仍不完全令人滿意。
  5. 以現代的標準來看,第一個在這方向上給出正確陳述的人是 Bolzano。他在 1817 年一篇談「中間值定理」的論文中用「白話」定義了連續函數(而連續的概念是建立在極限的概念之上),雖然沒有什麼 $\varepsilon$-$\delta$ 之類的,但後人認為邏輯是完全正確的。可惜他並不在主流數學圈中活躍,當時沒什麼人知道。
  6. 第一個給極限定義 (也是比較白話) 並廣為流傳的人是柯西。柯西在 1820 年代為他在法國綜合理工學院開的課寫了許多教科書,影響深遠。裡面為許多基本的數學概念給出了(相較於過去)更精確的定義,包括極限、連續、微分與定積分等 (所謂的黎曼積分,其想法其實來自於柯西)。柯西也沒有給出所謂的 $\varepsilon$-$\delta$ 定義,但在他的一些證明中用到了 $\varepsilon$ 與 $\delta$ 這兩個希臘字母,顯然因此影響了之後寫下定義的人。雖說如此,柯西到底算不算掌握了現代的極限定義,其實有很大的爭論。有人認為是,有人認為否,還有人認為柯西是採取了另一種思維,跟現代的定義不同但也是嚴謹的。我沒有能力去細究這件事。只能說,看古人寫的東西真的非常折磨。他們的用語跟說話方式都跟現代人不太一樣,常常讓人陷入「他到底在供三小表達什麼?」的困惑中。也因為如此,連史學家之間都很難取得共識。但這不影響柯西在「微積分的嚴謹化」上崇高的地位。即使他講得不完美,對後人也深有啟發。
  7. 所謂的 $\varepsilon$-$\delta$ 定義,公認是由 Weierstrass 給出。最早的資料號稱是 1861 年 (離微積分發明已過了 180 年),Schwarz 在他的課堂上所做的筆記。但我真的去看 Schwarz 的筆記內容(此頁面的Answer中有給),還是覺得並沒有講對,而且囉哩叭唆(這又呼應了我前面說的,看古人寫的東西真的非常折磨)。我們前面給的那種精練的寫法,究竟是 Weierstrass 在後來的其他著作中有確實給出,亦或只是從 Weierstrass 各式各樣的證明中看出來的,或是根本是其他人的貢獻,我無法找到資料。

沒有留言:

張貼留言