针,和草垛是同一种材料做的
到现在,你已经一路跟着一场碰撞,从产生它的束流,走到记录它的探测器,也见识过触发如何在实时之中、仅仅为了让数据率不至于撑爆,就把绝大多数事件当场扔掉。假定这一切都顺利运转,你手里最终留下了一份干净的、记录在案的样本,里面有数百万场碰撞。这一整个领域最残酷的反转,现在登场了:你苦苦追猎的那个新粒子,看上去一点也不特别。它一旦被产生出来,只活一瞬便衰变,而它衰变成的,恰恰是那些再普通不过的粒子——电子、光子、μ子、强子喷注——也正是从无数与它毫不相干的乏味碰撞里,同样倾泻而出的那些东西。
这正是本阶标题里点出的那个核心张力。信号,是那一小撮含有你所关心的那个过程的事件。本底,则是其余的一切——是已知物理用来产生同一批末态粒子的、所有其他途径。麻烦不在于本底“吵”;麻烦在于,逐个事件来看,一个本底事件可以是一个信号事件天衣无缝的冒名顶替者。你没法指着某一场碰撞断言“那一场就是新粒子”。信息只栖身于一整堆事件的统计之中——这正是为什么本阶坚持说:发现不是被瞥见的,而是被挖出来的。
不变质量:把碎片还原成它的母亲
如果你没法逐个事件地把信号从本底里分辨出来,那你就需要一个能把它们归拢到不同位置去的变量。担此重任的至高工具,是你早在两阶之前就已遇过的东西:不变质量。回想一下那个思路。一个会衰变的重粒子,不会给自己留下任何痕迹,留下的只有向外飞散的衰变产物。但能量与动量是守恒的,所以只要你把每一件衰变产物的能量和动量都测出来,再用能量-动量关系把它们组合起来,得出的那个答案,就是它们当初所源出的那个粒子的质量——而且在任何参考系里都是同一个数,这正是它被称为“不变”的缘由。
这就是不变质量重建,也是寻找“鼓包”时挑大梁的那匹马。选定一个衰变道——比方说,一个新粒子衰变成两个光子。对你样本里的每一个事件,拿出那两个光子,把它们测得的能量和方向代进公式,便得出一个数:它们那个假想母粒子被重建出来的质量。对你所有的事件都这么做一遍,再为这个数画一张直方图。神奇之处就在这里。一个真实的信号粒子,质量总是几乎完全相同的,所以每一个信号事件都把它的光子对堆在坐标轴上的同一个位置。与此相反,本底里的光子对是没有共同母亲的随机组合,于是它们重建出来的质量,会在一大段范围里平滑地散开。那个逐个事件看一无是处的变量,一旦汇总起来,就成了决定胜负的关键。
具体来说,你把两个光子的能量相加、再把它们的动量矢量相加,然后用总能量的平方减去总动量的平方,开方所得就是被重建出来的质量。重点不在这点代数,而在它的后果:同一种粒子的真实衰变会全部簇集在单一的质量值上,堆成一座尖峰;而来自互不相干源头的偶然对子,则把它们的质量抹遍整张谱,化作一片宽阔、倾斜的本底。那个逐个事件看一无是处的变量,恰恰成了让信号与本底终于得以分开的那根坐标轴。
鼓包:一份你终于看得见的信号
把这两种行为画在同一张图上,你就得到了粒子物理学那幅标志性的图像:一条平滑、缓缓下降的本底曲线,而在它之上、某一个特定的质量处,端坐着一个小小的鼓包。那条平滑曲线就是本底——全是那些随机的组合。那个鼓包就是信号——是那些事件,里头有一个质量确定的真实粒子衰变了,把它的产物丢在了它自己的质量值上。寻找鼓包要做的,恰恰就是这件事:在质量谱上扫视,去寻找一处高出那平滑变化之本底的局部超出。鼓包的位置,告诉你这个新粒子的质量;鼓包里事件的多少,告诉你它被产生得有多频繁。
鼓包有多宽?有两样东西在把它抹糊。第一,是真实的物理:一个不稳定粒子并没有一个完美锐利的单一质量,而是有一小段由它的衰变宽度所决定的散布,这就给出了我们谈共振时你见过的那个天然的布莱特-维格纳线型——寿命越短,峰就越宽。第二,是探测器本身——它从不完美地测准能量和角度,所以即便是一个天然宽度细如发丝的粒子,也会被测量分辨率抹成一个更宽的隆起。一项干净利落的发现,所要的是一个既够高、又够窄的鼓包,好让它从底下那道本底斜坡上明白无误地凸显出来。
把图像磨利:选择条件与模拟
在你动手画那张直方图之前,你要先用选择条件(cuts)把本底压下去——所谓选择条件,就是一些信号事件往往能通过、而本底事件往往会落榜的甄选要求。如果你的信号会产生两个货真价实的高能光子,那就要求高能量,把那些软绵绵的垃圾统统扔掉。如果它会产生一个底夸克,就利用底夸克喷注在衰变之前会飞出可测量的零点几毫米这一事实,给它们打上标记——这一招叫作 b 标记。每一条挑选得当的条件,都会留住你大部分的信号、同时删掉一块本底,于是幸存下来的鼓包,相对它底下那条曲线就站得更高了。这门手艺的精髓在于:要狠狠地切削本底,却又不至于把你自己的信号也悄悄切掉。
你又怎么知道,经过那一通选择之后,你的信号和本底各该长什么样?你去模拟它们。蒙特卡洛事件生成器用的是已知的物理——正是你一路学来的那些截面、衰变和量子概率——来掷骰子,造出数百万场假碰撞,再让它们穿过一套忠实的探测器软件模型。这样一来,你就有了预言的谱:单凭本底会给出什么,本底加信号又会给出什么。把真实数据与那些模拟出来的模板相比对,就是你用来判定眼前那个小摆动究竟是一份真实超出、还是仅仅本底在正常起伏的办法。
到底应该有多少个信号事件?
退一步,问一个在你收集到哪怕一个事件之前就已决定一切的问题:你究竟有可能期望多少个信号事件?正是在这里,前面几阶里的两个量汇到了一起。截面,是某个给定过程发生的内禀概率,是一块以靶恩(barn)为单位来度量的等效靶面积(而对稀有过程,则用飞靶恩——千万亿分之一靶恩)。积分亮度,则是你的机器在一轮运行中累计交付的碰撞机会总量,以反飞靶恩为单位。把这两者相乘,你就得到一个纯粹的数:那个过程预期发生的事件数。仅仅这一步乘法,就主宰了一项搜寻究竟有没有可能。
expected events = cross section x integrated luminosity
e.g. 1 femtobarn (fb) x 100 inverse-fb (1/fb) = 100 events
rare process a year of running just enough
to fight for这就解释了现代对撞机的整套战略,也呼应了我们当初为什么要把它们造成那个样子。一个又重又新的粒子,截面极小——它难得被产生出来——所以,要想攒够足以形成一个看得见的鼓包的信号事件,唯一的办法,就是去交付一个庞大的积分亮度:连续运行许多年,让强劲而紧聚的束流尽可能频繁地交叉。这也解释了为什么耐心不是可有可无的。运行之初,亮度还小,预期的信号计数不过寥寥几个,而任何看似的鼓包,都太容易被本底的一次随机扎堆所伪造。随着亮度一点点累积,一份真实的信号会稳步长大,而一次统计上的侥幸却往往会被冲淡——这正是通向下一篇指南的桥梁,在那里,我们将用“五个标准差”的判据,把“一个假象有多么不可能”量化出来。
对自己诚实
这整桩事业里最大的危险,并不是本底——而是人的眼睛,它极其擅长看出根本不存在的图案。盯着任何一张有噪声的谱看得够久,你总能在某处找出一个鼓包来。这就是为什么严肃的搜寻会扫遍整个质量范围,去清点一个假鼓包本可以偶然出现在多少个位置上,并为“自己曾到处张望过”而对自己作出惩罚——这就是所谓的“看遍他处效应”(look-elsewhere effect)。这也是为什么发现性的分析常常采取盲分析:团队仅凭模拟和本底区域,就把每一条选择条件、每一道拟合程序全部固定下来,并被禁止偷看信号区域,直到整套方法被冻结为止,如此一来,便没有任何一个选择能在不知不觉间被调成去讨好某个鼓包。
最后,把那句诚实的告诫摆在心头最显眼的地方。迄今为止,每一个得到证实的鼓包,到头来都是标准模型早已包含、或尚能容纳的某个粒子——任何对撞机至今都还没有得出过任何一项关于“标准模型之外的物理”的确凿发现。这个领域的历史,撒满了那些在三个标准差处变得激动人心、随后又随着更多数据到来而消融殆尽的鼓包。那并不是失败;那正是方法在起作用。一个鼓包是一个问题,还远不是一个答案,而“信号对本底”这门功夫,恰恰就是用来分辨二者的那套工具——耐心地、统计地,并对自己的一厢情愿,怀着一份健康的疑心。