JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
Back to the library
數學 1933

機率論的基本概念(Grundbegriffe der Wahrscheinlichkeitsrechnung)

安德雷·柯爾莫哥洛夫

機率不過是測度:幾條公理,便讓偶然成為嚴密的數學。

Choose your version
In depth · the introduction

某件事的機會有多大?兩百年來,這個問題始終沒有一個乾淨的答案——直到柯爾莫哥洛夫注意到:機率,不過是一種度量的方式,就像面積,或者重量。

核心想法

想像「所有可能發生的事」組成的那個集合——骰子能落到的每一面、粒子能走的每一條路徑。把這整個集合叫作 E。一個「事件」,不過是 E 的一塊:「骰子擲出偶數」就是其中的 {2, 4, 6} 這一塊。柯爾莫哥洛夫的洞見是:一個事件的機率,其行為恰恰就像那一塊的大小。

於是他寫下了寥寥幾條簡單的規則。沒有哪個機率是負的。E 中某件事發生的機率,恰恰是 1——整體就是整體。而若兩個事件不可能同時發生,那麼「二者之一發生」的機會,就是它們各自機會的相加。從這幾條規則出發——再加上一條用來處理無窮多個事件的規則——機率的每一條定律都隨之而來。他把偶然變成了度量的一個分支,其嚴密不亞於幾何。

它是如何誕生的

到了 1900 年,機率成了數學心臟地帶的一樁醜聞:賭徒與物理學家天天在用它,它也明明奏效,可沒有人能精確地說出「機率」究竟是什麼,而種種精巧的悖論又層出不窮。大衛·希爾伯特在列舉新世紀諸大未解難題時,把它列為第六問題:為機率奠定嚴密的、公理化的根基。

工具卻從一個意想不到的地方到來。亨利·勒貝格建立了一套強有力的新理論,去「測量」複雜集合的大小;而莫里斯·弗雷歇又剝去了它幾何的外衣,使它能去測量任何東西。年輕的蘇聯數學家安德雷·柯爾莫哥洛夫看出:機率,不過是喬裝打扮的測度。1933 年,他用德文出版了一本薄薄的、僅 62 頁的書,把這一等同關係做得精確無比。他是第一個明白宣告的人:機率論,是測度論的一部分。

它為何重要

在這本書之前,機率中那些深刻的結論難以令人信任,因為它們腳下的地基含混不清。在那之後,每一條定理都立在與其餘數學同樣牢靠的根基上,而勒貝格積分的整套工具也一併免費隨行。它還馴服了無限:柯爾莫哥洛夫展示了如何給「一條永遠描畫下去的隨機曲線」這類東西賦予精確的機率——正是這一點,使現代的隨機過程理論成為可能,並隨之托起了現代金融、統計與機器學習。他也十分謹慎:他公開把功勞歸於勒貝格、弗雷歇等人,並承認他的公理對「一個機率究竟意味著什麼」隻字未提。

一個可以想像的畫面

想像把恰好一升水,澆在一張地圖上。每一片區域的「機率」,不過就是落在它上面的水量。沒有哪片區域能盛下負的水;整張地圖盛著那滿滿的一升(這就是 P(E) = 1);而兩片互不重疊的區域上的水,就是各自水量的相加。條件機率,則是在問:落在這個縣上的水裡,有幾分坐落在這座鎮上?這便是柯爾莫哥洛夫想法的全部——機率是你拿來度量的液體,而他的公理,不過是水本就遵守的那些規則。

一個可互動的機率空間:一個 6×6 的網格,列出兩顆公平骰子的 36 個等可能結果。滑桿選擇有多少結果屬於事件 A,這些格子被染色,並顯示 P(A) = |A|/36,其餘構成補集,使二者之和為 1。第二塊面板繪出 600 次確定性試驗中 A 的運行相對頻率,它向 P(A) 收斂。

它的位置

機率始於賭桌——1650 年代的帕斯卡與費馬,隨後是雅各布·伯努利的大數定律,與拉普拉斯宏大的綜合。但它的根基,幾個世紀以來始終搖搖晃晃。柯爾莫哥洛夫的這本書是那道轉軸:之前是古典機率,之後是測度論式的機率。這一框架徑直伸入現代世界——伸入香農的資訊論(本館亦有收錄)、伸入為選擇權定價的隨機漫步,以及今日人工智慧背後的那些收斂保證。相競的根基也曾被提出——馮·米澤斯的頻率、德·菲內蒂的主觀賭注——但如今每本教科書開篇所用的,是柯爾莫哥洛夫的三元組 (E, F, P)。

The original document
Original source text

前言——測度與機率

A. Kolmogorov · Foundations of the Theory of Probability · 1933 · Preface (dated Easter 1933, Moscow)
After Lebesgue's investigations, the analogy between the measure of a set and the probability of an event, as well as between the integral of a function and the mathematical expectation of a random variable, was clear.
This analogy could be extended further; for example, many properties of independent random variables are completely analogous to corresponding properties of orthogonal functions. But in order to base probability theory on this analogy, one still needed to liberate the theory of measure and integration from the geometric elements still in the foreground with Lebesgue. This liberation was accomplished by Fréchet.

公理(第一章)

Chapter I · Elementary Theory of Probability · §1 Axioms
Let E be a set of elements, which we shall call elementary events, and F a set of subsets of E; the elements of the set F will be called random events. Kolmogorov begins with five axioms concerning E and F:
I. F is a field of sets.
II. F contains the set E.
III. To each set A from F is assigned a non-negative real number P(A). This number P(A) is called the probability of the event A.
IV. P(E) = 1.
V. If A and B are disjoint, then P(A + B) = P(A) + P(B).
A system of sets F, together with a definite assignment of numbers P(A) satisfying Axioms I–V, is called a field of probability.

連續性公理(第二章)

Chapter II · Infinite Probability Fields · §1 Axiom of Continuity
VI. For a decreasing sequence of events A₁ ⊇ A₂ ⊇ ⋯ of F, for which the product (intersection) of all the Aₙ is empty, the following equation holds: lim P(Aₙ) = 0 as n → ∞.
This is the axiom of continuity. Given the first five axioms, it is equivalent to countable additivity. Kolmogorov is candid about its status:
Since the new axiom is essential only for infinite fields of probability, it is hardly possible to explain its empirical meaning … Infinite fields of probability occur only as idealized models of real random processes. This understood, we limit ourselves arbitrarily to models that satisfy Axiom VI.
[ … ]
Kolmogorov · Moscow · Easter 1933