JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

訊號與本底:尋找數據中的「鼓包」

一個新粒子幾乎從不自報家門——它藏身於汪洋般的普通碰撞之中,成為一個微弱的「超出」,而那些普通碰撞看上去又跟它幾乎一模一樣。本文要講的,就是物理學家如何把一份稀有的訊號從浩瀚的本底裡分離出來,為什麼一項發現會表現為一條光滑曲線上的一個小小「鼓包」,以及截面與亮度又是如何從根本上決定那個鼓包究竟能不能存在。

針,和草垛是同一種材料做的

到現在,你已經一路跟著一場碰撞,從產生它的束流,走到記錄它的探測器,也見識過觸發如何在即時之中、僅僅為了讓數據率不至於撐爆,就把絕大多數事件當場扔掉。假定這一切都順利運轉,你手裡最終留下了一份乾淨的、記錄在案的樣本,裡面有數百萬場碰撞。這一整個領域最殘酷的反轉,現在登場了:你苦苦追獵的那個新粒子,看上去一點也不特別。它一旦被產生出來,只活一瞬便衰變,而它衰變成的,恰恰是那些再普通不過的粒子——電子、光子、μ子、強子噴注——也正是從無數與它毫不相干的乏味碰撞裡,同樣傾瀉而出的那些東西。

這正是本階標題裡點出的那個核心張力。訊號,是那一小撮含有你所關心的那個過程的事件。本底,則是其餘的一切——是已知物理用來產生同一批末態粒子的、所有其他途徑。麻煩不在於本底「吵」;麻煩在於,逐個事件來看,一個本底事件可以是一個訊號事件天衣無縫的冒名頂替者。你沒法指著某一場碰撞斷言「那一場就是新粒子」。資訊只棲身於一整堆事件的統計之中——這正是為什麼本階堅持說:發現不是被瞥見的,而是被挖出來的。

不變質量:把碎片還原成它的母親

如果你沒法逐個事件地把訊號從本底裡分辨出來,那你就需要一個能把它們歸攏到不同位置去的變量。擔此重任的至高工具,是你早在兩階之前就已遇過的東西:不變質量。回想一下那個思路。一個會衰變的重粒子,不會給自己留下任何痕跡,留下的只有向外飛散的衰變產物。但能量與動量是守恆的,所以只要你把每一件衰變產物的能量和動量都測出來,再用能量-動量關係把它們組合起來,得出的那個答案,就是它們當初所源出的那個粒子的質量——而且在任何參考系裡都是同一個數,這正是它被稱為「不變」的緣由。

這就是不變質量重建,也是尋找「鼓包」時挑大梁的那匹馬。選定一個衰變道——比方說,一個新粒子衰變成兩個光子。對你樣本裡的每一個事件,拿出那兩個光子,把它們測得的能量和方向代進公式,便得出一個數:它們那個假想母粒子被重建出來的質量。對你所有的事件都這麼做一遍,再為這個數畫一張直方圖。神奇之處就在這裡。一個真實的訊號粒子,質量總是幾乎完全相同的,所以每一個訊號事件都把它的光子對堆在座標軸上的同一個位置。與此相反,本底裡的光子對是沒有共同母親的隨機組合,於是它們重建出來的質量,會在一大段範圍裡平滑地散開。那個逐個事件看一無是處的變量,一旦匯總起來,就成了決定勝負的關鍵。

具體來說,你把兩個光子的能量相加、再把它們的動量向量相加,然後用總能量的平方減去總動量的平方,開方所得就是被重建出來的質量。重點不在這點代數,而在它的後果:同一種粒子的真實衰變會全部簇集在單一的質量值上,堆成一座尖峰;而來自互不相干源頭的偶然對子,則把它們的質量抹遍整張譜,化作一片寬闊、傾斜的本底。那個逐個事件看一無是處的變量,恰恰成了讓訊號與本底終於得以分開的那根座標軸。

鼓包:一份你終於看得見的訊號

把這兩種行為畫在同一張圖上,你就得到了粒子物理學那幅標誌性的圖像:一條平滑、緩緩下降的本底曲線,而在它之上、某一個特定的質量處,端坐著一個小小的鼓包。那條平滑曲線就是本底——全是那些隨機的組合。那個鼓包就是訊號——是那些事件,裡頭有一個質量確定的真實粒子衰變了,把它的產物丟在了它自己的質量值上。尋找鼓包要做的,恰恰就是這件事:在質量譜上掃視,去尋找一處高出那平滑變化之本底的局部超出。鼓包的位置,告訴你這個新粒子的質量;鼓包裡事件的多少,告訴你它被產生得有多頻繁。

鼓包有多寬?有兩樣東西在把它抹糊。第一,是真實的物理:一個不穩定粒子並沒有一個完美銳利的單一質量,而是有一小段由它的衰變寬度所決定的散布,這就給出了我們談共振時你見過的那個天然的布萊特-維格納線型——壽命越短,峰就越寬。第二,是探測器本身——它從不完美地測準能量和角度,所以即便是一個天然寬度細如髮絲的粒子,也會被測量分辨率抹成一個更寬的隆起。一項乾淨俐落的發現,所要的是一個既夠高、又夠窄的鼓包,好讓它從底下那道本底斜坡上明白無誤地凸顯出來。

把圖像磨利:選擇條件與模擬

在你動手畫那張直方圖之前,你要先用選擇條件(cuts)把本底壓下去——所謂選擇條件,就是一些訊號事件往往能通過、而本底事件往往會落榜的甄選要求。如果你的訊號會產生兩個貨真價實的高能光子,那就要求高能量,把那些軟綿綿的垃圾統統扔掉。如果它會產生一個底夸克,就利用底夸克噴注在衰變之前會飛出可測量的零點幾毫米這一事實,給它們打上標記——這一招叫作 b 標記。每一條挑選得當的條件,都會留住你大部分的訊號、同時刪掉一塊本底,於是倖存下來的鼓包,相對它底下那條曲線就站得更高了。這門手藝的精髓在於:要狠狠地切削本底,卻又不至於把你自己的訊號也悄悄切掉。

你又怎麼知道,經過那一通選擇之後,你的訊號和本底各該長什麼樣?你去模擬它們。蒙地卡羅事件生成器用的是已知的物理——正是你一路學來的那些截面、衰變和量子概率——來擲骰子,造出數百萬場假碰撞,再讓它們穿過一套忠實的探測器軟件模型。這樣一來,你就有了預言的譜:單憑本底會給出什麼,本底加訊號又會給出什麼。把真實數據與那些模擬出來的模板相比對,就是你用來判定眼前那個小擺動究竟是一份真實超出、還是僅僅本底在正常起伏的辦法。

到底應該有多少個訊號事件?

退一步,問一個在你收集到哪怕一個事件之前就已決定一切的問題:你究竟有可能期望多少個訊號事件?正是在這裡,前面幾階裡的兩個量匯到了一起。截面,是某個給定過程發生的內稟概率,是一塊以靶恩(barn)為單位來度量的等效靶面積(而對稀有過程,則用飛靶恩——千萬億分之一靶恩)。積分亮度,則是你的機器在一輪運行中累計交付的碰撞機會總量,以反飛靶恩為單位。把這兩者相乘,你就得到一個純粹的數:那個過程預期發生的事件數。僅僅這一步乘法,就主宰了一項搜尋究竟有沒有可能。

expected events  =  cross section  x  integrated luminosity

  e.g.   1 femtobarn (fb)  x  100 inverse-fb (1/fb)  =  100 events

          rare process              a year of running     just enough
                                                          to fight for
截面定下一個過程有多可能發生;積分亮度定下機器給了它多少次機會。兩者的乘積,就是預期的訊號事件數——也是整場搜尋必須量入為出的那筆「預算」。

這就解釋了現代對撞機的整套戰略,也呼應了我們當初為什麼要把它們造成那個樣子。一個又重又新的粒子,截面極小——它難得被產生出來——所以,要想攢夠足以形成一個看得見的鼓包的訊號事件,唯一的辦法,就是去交付一個龐大的積分亮度:連續運行許多年,讓強勁而緊聚的束流盡可能頻繁地交叉。這也解釋了為什麼耐心不是可有可無的。運行之初,亮度還小,預期的訊號計數不過寥寥幾個,而任何看似的鼓包,都太容易被本底的一次隨機扎堆所偽造。隨著亮度一點點累積,一份真實的訊號會穩步長大,而一次統計上的僥倖卻往往會被沖淡——這正是通向下一篇指南的橋樑,在那裡,我們將用「五個標準差」的判據,把「一個假象有多麼不可能」量化出來。

對自己誠實

這整樁事業裡最大的危險,並不是本底——而是人的眼睛,它極其擅長看出根本不存在的圖案。盯著任何一張有雜訊的譜看得夠久,你總能在某處找出一個鼓包來。這就是為什麼嚴肅的搜尋會掃遍整個質量範圍,去清點一個假鼓包本可以偶然出現在多少個位置上,並為「自己曾到處張望過」而對自己作出懲罰——這就是所謂的「看遍他處效應」(look-elsewhere effect)。這也是為什麼發現性的分析常常採取盲分析:團隊僅憑模擬和本底區域,就把每一條選擇條件、每一道擬合程序全部固定下來,並被禁止偷看訊號區域,直到整套方法被凍結為止,如此一來,便沒有任何一個選擇能在不知不覺間被調成去討好某個鼓包。

最後,把那句誠實的告誡擺在心頭最顯眼的地方。迄今為止,每一個得到證實的鼓包,到頭來都是標準模型早已包含、或尚能容納的某個粒子——任何對撞機至今都還沒有得出過任何一項關於「標準模型之外的物理」的確鑿發現。這個領域的歷史,撒滿了那些在三個標準差處變得激動人心、隨後又隨著更多數據到來而消融殆盡的鼓包。那並不是失敗;那正是方法在起作用。一個鼓包是一個問題,還遠不是一個答案,而「訊號對本底」這門功夫,恰恰就是用來分辨二者的那套工具——耐心地、統計地,並對自己的一廂情願,懷著一份健康的疑心。