訊號與本底：尋找數據中的「鼓包」

針，和草垛是同一種材料做的

到現在，你已經一路跟著一場碰撞，從產生它的束流，走到記錄它的探測器，也見識過觸發如何在即時之中、僅僅為了讓數據率不至於撐爆，就把絕大多數事件當場扔掉。假定這一切都順利運轉，你手裡最終留下了一份乾淨的、記錄在案的樣本，裡面有數百萬場碰撞。這一整個領域最殘酷的反轉，現在登場了：你苦苦追獵的那個新粒子，看上去一點也不特別。它一旦被產生出來，只活一瞬便衰變，而它衰變成的，恰恰是那些再普通不過的粒子——電子、光子、μ子、強子噴注——也正是從無數與它毫不相干的乏味碰撞裡，同樣傾瀉而出的那些東西。

這正是本階標題裡點出的那個核心張力。訊號，是那一小撮含有你所關心的那個過程的事件。本底，則是其餘的一切——是已知物理用來產生同一批末態粒子的、所有其他途徑。麻煩不在於本底「吵」；麻煩在於，逐個事件來看，一個本底事件可以是一個訊號事件天衣無縫的冒名頂替者。你沒法指著某一場碰撞斷言「那一場就是新粒子」。資訊只棲身於一整堆事件的統計之中——這正是為什麼本階堅持說：發現不是被瞥見的，而是被挖出來的。

不變質量：把碎片還原成它的母親

如果你沒法逐個事件地把訊號從本底裡分辨出來，那你就需要一個能把它們歸攏到不同位置去的變量。擔此重任的至高工具，是你早在兩階之前就已遇過的東西：不變質量。回想一下那個思路。一個會衰變的重粒子，不會給自己留下任何痕跡，留下的只有向外飛散的衰變產物。但能量與動量是守恆的，所以只要你把每一件衰變產物的能量和動量都測出來，再用能量-動量關係把它們組合起來，得出的那個答案，就是它們當初所源出的那個粒子的質量——而且在任何參考系裡都是同一個數，這正是它被稱為「不變」的緣由。

這就是不變質量重建，也是尋找「鼓包」時挑大梁的那匹馬。選定一個衰變道——比方說，一個新粒子衰變成兩個光子。對你樣本裡的每一個事件，拿出那兩個光子，把它們測得的能量和方向代進公式，便得出一個數：它們那個假想母粒子被重建出來的質量。對你所有的事件都這麼做一遍，再為這個數畫一張直方圖。神奇之處就在這裡。一個真實的訊號粒子，質量總是幾乎完全相同的，所以每一個訊號事件都把它的光子對堆在座標軸上的同一個位置。與此相反，本底裡的光子對是沒有共同母親的隨機組合，於是它們重建出來的質量，會在一大段範圍裡平滑地散開。那個逐個事件看一無是處的變量，一旦匯總起來，就成了決定勝負的關鍵。

具體來說，你把兩個光子的能量相加、再把它們的動量向量相加，然後用總能量的平方減去總動量的平方，開方所得就是被重建出來的質量。重點不在這點代數，而在它的後果：同一種粒子的真實衰變會全部簇集在單一的質量值上，堆成一座尖峰；而來自互不相干源頭的偶然對子，則把它們的質量抹遍整張譜，化作一片寬闊、傾斜的本底。那個逐個事件看一無是處的變量，恰恰成了讓訊號與本底終於得以分開的那根座標軸。

鼓包：一份你終於看得見的訊號

把這兩種行為畫在同一張圖上，你就得到了粒子物理學那幅標誌性的圖像：一條平滑、緩緩下降的本底曲線，而在它之上、某一個特定的質量處，端坐著一個小小的鼓包。那條平滑曲線就是本底——全是那些隨機的組合。那個鼓包就是訊號——是那些事件，裡頭有一個質量確定的真實粒子衰變了，把它的產物丟在了它自己的質量值上。尋找鼓包要做的，恰恰就是這件事：在質量譜上掃視，去尋找一處高出那平滑變化之本底的局部超出。鼓包的位置，告訴你這個新粒子的質量；鼓包裡事件的多少，告訴你它被產生得有多頻繁。

鼓包有多寬？有兩樣東西在把它抹糊。第一，是真實的物理：一個不穩定粒子並沒有一個完美銳利的單一質量，而是有一小段由它的衰變寬度所決定的散布，這就給出了我們談共振時你見過的那個天然的布萊特-維格納線型——壽命越短，峰就越寬。第二，是探測器本身——它從不完美地測準能量和角度，所以即便是一個天然寬度細如髮絲的粒子，也會被測量分辨率抹成一個更寬的隆起。一項乾淨俐落的發現，所要的是一個既夠高、又夠窄的鼓包，好讓它從底下那道本底斜坡上明白無誤地凸顯出來。

把圖像磨利：選擇條件與模擬

在你動手畫那張直方圖之前，你要先用選擇條件（cuts）把本底壓下去——所謂選擇條件，就是一些訊號事件往往能通過、而本底事件往往會落榜的甄選要求。如果你的訊號會產生兩個貨真價實的高能光子，那就要求高能量，把那些軟綿綿的垃圾統統扔掉。如果它會產生一個底夸克，就利用底夸克噴注在衰變之前會飛出可測量的零點幾毫米這一事實，給它們打上標記——這一招叫作 b 標記。每一條挑選得當的條件，都會留住你大部分的訊號、同時刪掉一塊本底，於是倖存下來的鼓包，相對它底下那條曲線就站得更高了。這門手藝的精髓在於：要狠狠地切削本底，卻又不至於把你自己的訊號也悄悄切掉。

你又怎麼知道，經過那一通選擇之後，你的訊號和本底各該長什麼樣？你去模擬它們。蒙地卡羅事件生成器用的是已知的物理——正是你一路學來的那些截面、衰變和量子概率——來擲骰子，造出數百萬場假碰撞，再讓它們穿過一套忠實的探測器軟件模型。這樣一來，你就有了預言的譜：單憑本底會給出什麼，本底加訊號又會給出什麼。把真實數據與那些模擬出來的模板相比對，就是你用來判定眼前那個小擺動究竟是一份真實超出、還是僅僅本底在正常起伏的辦法。

到底應該有多少個訊號事件？

退一步，問一個在你收集到哪怕一個事件之前就已決定一切的問題：你究竟有可能期望多少個訊號事件？正是在這裡，前面幾階裡的兩個量匯到了一起。截面，是某個給定過程發生的內稟概率，是一塊以靶恩（barn）為單位來度量的等效靶面積（而對稀有過程，則用飛靶恩——千萬億分之一靶恩）。積分亮度，則是你的機器在一輪運行中累計交付的碰撞機會總量，以反飛靶恩為單位。把這兩者相乘，你就得到一個純粹的數：那個過程預期發生的事件數。僅僅這一步乘法，就主宰了一項搜尋究竟有沒有可能。

expected events  =  cross section  x  integrated luminosity

  e.g.   1 femtobarn (fb)  x  100 inverse-fb (1/fb)  =  100 events

          rare process              a year of running     just enough
                                                          to fight for

截面定下一個過程有多可能發生；積分亮度定下機器給了它多少次機會。兩者的乘積，就是預期的訊號事件數——也是整場搜尋必須量入為出的那筆「預算」。

這就解釋了現代對撞機的整套戰略，也呼應了我們當初為什麼要把它們造成那個樣子。一個又重又新的粒子，截面極小——它難得被產生出來——所以，要想攢夠足以形成一個看得見的鼓包的訊號事件，唯一的辦法，就是去交付一個龐大的積分亮度：連續運行許多年，讓強勁而緊聚的束流盡可能頻繁地交叉。這也解釋了為什麼耐心不是可有可無的。運行之初，亮度還小，預期的訊號計數不過寥寥幾個，而任何看似的鼓包，都太容易被本底的一次隨機扎堆所偽造。隨著亮度一點點累積，一份真實的訊號會穩步長大，而一次統計上的僥倖卻往往會被沖淡——這正是通向下一篇指南的橋樑，在那裡，我們將用「五個標準差」的判據，把「一個假象有多麼不可能」量化出來。

對自己誠實

這整樁事業裡最大的危險，並不是本底——而是人的眼睛，它極其擅長看出根本不存在的圖案。盯著任何一張有雜訊的譜看得夠久，你總能在某處找出一個鼓包來。這就是為什麼嚴肅的搜尋會掃遍整個質量範圍，去清點一個假鼓包本可以偶然出現在多少個位置上，並為「自己曾到處張望過」而對自己作出懲罰——這就是所謂的「看遍他處效應」（look-elsewhere effect）。這也是為什麼發現性的分析常常採取盲分析：團隊僅憑模擬和本底區域，就把每一條選擇條件、每一道擬合程序全部固定下來，並被禁止偷看訊號區域，直到整套方法被凍結為止，如此一來，便沒有任何一個選擇能在不知不覺間被調成去討好某個鼓包。

最後，把那句誠實的告誡擺在心頭最顯眼的地方。迄今為止，每一個得到證實的鼓包，到頭來都是標準模型早已包含、或尚能容納的某個粒子——任何對撞機至今都還沒有得出過任何一項關於「標準模型之外的物理」的確鑿發現。這個領域的歷史，撒滿了那些在三個標準差處變得激動人心、隨後又隨著更多數據到來而消融殆盡的鼓包。那並不是失敗；那正是方法在起作用。一個鼓包是一個問題，還遠不是一個答案，而「訊號對本底」這門功夫，恰恰就是用來分辨二者的那套工具——耐心地、統計地，並對自己的一廂情願，懷著一份健康的疑心。