信号与本底：寻找数据中的“鼓包”

针，和草垛是同一种材料做的

到现在，你已经一路跟着一场碰撞，从产生它的束流，走到记录它的探测器，也见识过触发如何在实时之中、仅仅为了让数据率不至于撑爆，就把绝大多数事件当场扔掉。假定这一切都顺利运转，你手里最终留下了一份干净的、记录在案的样本，里面有数百万场碰撞。这一整个领域最残酷的反转，现在登场了：你苦苦追猎的那个新粒子，看上去一点也不特别。它一旦被产生出来，只活一瞬便衰变，而它衰变成的，恰恰是那些再普通不过的粒子——电子、光子、μ子、强子喷注——也正是从无数与它毫不相干的乏味碰撞里，同样倾泻而出的那些东西。

这正是本阶标题里点出的那个核心张力。信号，是那一小撮含有你所关心的那个过程的事件。本底，则是其余的一切——是已知物理用来产生同一批末态粒子的、所有其他途径。麻烦不在于本底“吵”；麻烦在于，逐个事件来看，一个本底事件可以是一个信号事件天衣无缝的冒名顶替者。你没法指着某一场碰撞断言“那一场就是新粒子”。信息只栖身于一整堆事件的统计之中——这正是为什么本阶坚持说：发现不是被瞥见的，而是被挖出来的。

不变质量：把碎片还原成它的母亲

如果你没法逐个事件地把信号从本底里分辨出来，那你就需要一个能把它们归拢到不同位置去的变量。担此重任的至高工具，是你早在两阶之前就已遇过的东西：不变质量。回想一下那个思路。一个会衰变的重粒子，不会给自己留下任何痕迹，留下的只有向外飞散的衰变产物。但能量与动量是守恒的，所以只要你把每一件衰变产物的能量和动量都测出来，再用能量-动量关系把它们组合起来，得出的那个答案，就是它们当初所源出的那个粒子的质量——而且在任何参考系里都是同一个数，这正是它被称为“不变”的缘由。

这就是不变质量重建，也是寻找“鼓包”时挑大梁的那匹马。选定一个衰变道——比方说，一个新粒子衰变成两个光子。对你样本里的每一个事件，拿出那两个光子，把它们测得的能量和方向代进公式，便得出一个数：它们那个假想母粒子被重建出来的质量。对你所有的事件都这么做一遍，再为这个数画一张直方图。神奇之处就在这里。一个真实的信号粒子，质量总是几乎完全相同的，所以每一个信号事件都把它的光子对堆在坐标轴上的同一个位置。与此相反，本底里的光子对是没有共同母亲的随机组合，于是它们重建出来的质量，会在一大段范围里平滑地散开。那个逐个事件看一无是处的变量，一旦汇总起来，就成了决定胜负的关键。

具体来说，你把两个光子的能量相加、再把它们的动量矢量相加，然后用总能量的平方减去总动量的平方，开方所得就是被重建出来的质量。重点不在这点代数，而在它的后果：同一种粒子的真实衰变会全部簇集在单一的质量值上，堆成一座尖峰；而来自互不相干源头的偶然对子，则把它们的质量抹遍整张谱，化作一片宽阔、倾斜的本底。那个逐个事件看一无是处的变量，恰恰成了让信号与本底终于得以分开的那根坐标轴。

鼓包：一份你终于看得见的信号

把这两种行为画在同一张图上，你就得到了粒子物理学那幅标志性的图像：一条平滑、缓缓下降的本底曲线，而在它之上、某一个特定的质量处，端坐着一个小小的鼓包。那条平滑曲线就是本底——全是那些随机的组合。那个鼓包就是信号——是那些事件，里头有一个质量确定的真实粒子衰变了，把它的产物丢在了它自己的质量值上。寻找鼓包要做的，恰恰就是这件事：在质量谱上扫视，去寻找一处高出那平滑变化之本底的局部超出。鼓包的位置，告诉你这个新粒子的质量；鼓包里事件的多少，告诉你它被产生得有多频繁。

鼓包有多宽？有两样东西在把它抹糊。第一，是真实的物理：一个不稳定粒子并没有一个完美锐利的单一质量，而是有一小段由它的衰变宽度所决定的散布，这就给出了我们谈共振时你见过的那个天然的布莱特-维格纳线型——寿命越短，峰就越宽。第二，是探测器本身——它从不完美地测准能量和角度，所以即便是一个天然宽度细如发丝的粒子，也会被测量分辨率抹成一个更宽的隆起。一项干净利落的发现，所要的是一个既够高、又够窄的鼓包，好让它从底下那道本底斜坡上明白无误地凸显出来。

把图像磨利：选择条件与模拟

在你动手画那张直方图之前，你要先用选择条件（cuts）把本底压下去——所谓选择条件，就是一些信号事件往往能通过、而本底事件往往会落榜的甄选要求。如果你的信号会产生两个货真价实的高能光子，那就要求高能量，把那些软绵绵的垃圾统统扔掉。如果它会产生一个底夸克，就利用底夸克喷注在衰变之前会飞出可测量的零点几毫米这一事实，给它们打上标记——这一招叫作 b 标记。每一条挑选得当的条件，都会留住你大部分的信号、同时删掉一块本底，于是幸存下来的鼓包，相对它底下那条曲线就站得更高了。这门手艺的精髓在于：要狠狠地切削本底，却又不至于把你自己的信号也悄悄切掉。

你又怎么知道，经过那一通选择之后，你的信号和本底各该长什么样？你去模拟它们。蒙特卡洛事件生成器用的是已知的物理——正是你一路学来的那些截面、衰变和量子概率——来掷骰子，造出数百万场假碰撞，再让它们穿过一套忠实的探测器软件模型。这样一来，你就有了预言的谱：单凭本底会给出什么，本底加信号又会给出什么。把真实数据与那些模拟出来的模板相比对，就是你用来判定眼前那个小摆动究竟是一份真实超出、还是仅仅本底在正常起伏的办法。

到底应该有多少个信号事件？

退一步，问一个在你收集到哪怕一个事件之前就已决定一切的问题：你究竟有可能期望多少个信号事件？正是在这里，前面几阶里的两个量汇到了一起。截面，是某个给定过程发生的内禀概率，是一块以靶恩（barn）为单位来度量的等效靶面积（而对稀有过程，则用飞靶恩——千万亿分之一靶恩）。积分亮度，则是你的机器在一轮运行中累计交付的碰撞机会总量，以反飞靶恩为单位。把这两者相乘，你就得到一个纯粹的数：那个过程预期发生的事件数。仅仅这一步乘法，就主宰了一项搜寻究竟有没有可能。

expected events  =  cross section  x  integrated luminosity

  e.g.   1 femtobarn (fb)  x  100 inverse-fb (1/fb)  =  100 events

          rare process              a year of running     just enough
                                                          to fight for

截面定下一个过程有多可能发生；积分亮度定下机器给了它多少次机会。两者的乘积，就是预期的信号事件数——也是整场搜寻必须量入为出的那笔“预算”。

这就解释了现代对撞机的整套战略，也呼应了我们当初为什么要把它们造成那个样子。一个又重又新的粒子，截面极小——它难得被产生出来——所以，要想攒够足以形成一个看得见的鼓包的信号事件，唯一的办法，就是去交付一个庞大的积分亮度：连续运行许多年，让强劲而紧聚的束流尽可能频繁地交叉。这也解释了为什么耐心不是可有可无的。运行之初，亮度还小，预期的信号计数不过寥寥几个，而任何看似的鼓包，都太容易被本底的一次随机扎堆所伪造。随着亮度一点点累积，一份真实的信号会稳步长大，而一次统计上的侥幸却往往会被冲淡——这正是通向下一篇指南的桥梁，在那里，我们将用“五个标准差”的判据，把“一个假象有多么不可能”量化出来。

对自己诚实

这整桩事业里最大的危险，并不是本底——而是人的眼睛，它极其擅长看出根本不存在的图案。盯着任何一张有噪声的谱看得够久，你总能在某处找出一个鼓包来。这就是为什么严肃的搜寻会扫遍整个质量范围，去清点一个假鼓包本可以偶然出现在多少个位置上，并为“自己曾到处张望过”而对自己作出惩罚——这就是所谓的“看遍他处效应”（look-elsewhere effect）。这也是为什么发现性的分析常常采取盲分析：团队仅凭模拟和本底区域，就把每一条选择条件、每一道拟合程序全部固定下来，并被禁止偷看信号区域，直到整套方法被冻结为止，如此一来，便没有任何一个选择能在不知不觉间被调成去讨好某个鼓包。

最后，把那句诚实的告诫摆在心头最显眼的地方。迄今为止，每一个得到证实的鼓包，到头来都是标准模型早已包含、或尚能容纳的某个粒子——任何对撞机至今都还没有得出过任何一项关于“标准模型之外的物理”的确凿发现。这个领域的历史，撒满了那些在三个标准差处变得激动人心、随后又随着更多数据到来而消融殆尽的鼓包。那并不是失败；那正是方法在起作用。一个鼓包是一个问题，还远不是一个答案，而“信号对本底”这门功夫，恰恰就是用来分辨二者的那套工具——耐心地、统计地，并对自己的一厢情愿，怀着一份健康的疑心。