分類與陷阱：PAINS、假陽性與真苗頭

為什麼大多數苗頭是謊言

一次初篩會產生一份苗頭清單，而其中大部分是雜訊。假陽性是指看起來有活性、卻並未按你所期望的方式作用於靶點的化合物。幾個經典的罪魁禍首值得記住名字。聚集體形成微小的膠體顆粒，把蛋白質裹挾起來，非特異性地抑制幾乎一切。反應性化合物不加區分地對蛋白質進行化學修飾。還有些分子在檢測的波長處吸收或發射光，根本不碰蛋白質就騙過了檢測器。

這些機制之所以陰險，是因為它們能產生漂亮、看似高效的量效曲線。一個化合物可以給出乾淨的IC50，卻仍然對你的靶點毫無真實作用。這正是為什麼單憑一個數字永遠定不了任何事；你必須追問這個化合物是如何產生那個數字的，而不只是它有多大。

PAINS與結構警示

PAINS——泛檢測干擾化合物——是一些子結構，它們在彼此無關的篩選中反覆作為苗頭出現。它們的濫交性源自上述壞行為：氧化還原循環、共價反應性、金屬螯合、螢光。經過整理的PAINS過濾器會自動標記這些子結構，而一個被標記的化合物在你信任它之前，應當受到認真的額外審視。

一套有紀律的分類流程

分類是一門手藝：把一份冗長、骯髒的苗頭清單，變成幾個值得投入真正化學工作的系列。目標是又快又省地淘汰壞苗頭，好讓稀缺的精力只用在能存活下來的分子上。下面的順序大致是按「最便宜且最具區分力」優先排列的。

用新稱量、重新純化的固體——而非原始板上的樣品——重新確證效力。許多「苗頭」在這一步就蒸發了。
做去垢劑測試和一個反向篩選，揭露聚集體和檢測干擾假象。
施加PAINS和結構警示過濾器；對任何被標記的東西去調查，而非自動刪除。
用一種正交的、了解機制的方法確證結合——生物物理學手段或一個靶點結合讀數。
按骨架對倖存者聚類，尋找早期的構效關係和良好的配體效率；只推進系列，而非孤立的單個分子。

對一個真正苗頭最深刻的檢驗，是可解釋的構效關係：當對分子做出小而合理的改動、效力隨之朝合理方向移動時，你幾乎可以肯定自己正結合在一個真實的結合位點上。一個孤零零的高效化合物，沒有任何類似物，周圍的構效關係平坦或混亂——這恰恰是會浪費掉一年時間的那種東西。誠實的分類，正是把原始苗頭清單轉化為下一個學習軌道將要優化的、值得信賴的先導化合物的過程。