為什麼大多數苗頭是謊言
一次初篩會產生一份苗頭清單,而其中大部分是雜訊。假陽性是指看起來有活性、卻並未按你所期望的方式作用於靶點的化合物。幾個經典的罪魁禍首值得記住名字。聚集體形成微小的膠體顆粒,把蛋白質裹挾起來,非特異性地抑制幾乎一切。反應性化合物不加區分地對蛋白質進行化學修飾。還有些分子在檢測的波長處吸收或發射光,根本不碰蛋白質就騙過了檢測器。
這些機制之所以陰險,是因為它們能產生漂亮、看似高效的量效曲線。一個化合物可以給出乾淨的IC50,卻仍然對你的靶點毫無真實作用。這正是為什麼單憑一個數字永遠定不了任何事;你必須追問這個化合物是如何產生那個數字的,而不只是它有多大。
PAINS與結構警示
PAINS——泛檢測干擾化合物——是一些子結構,它們在彼此無關的篩選中反覆作為苗頭出現。它們的濫交性源自上述壞行為:氧化還原循環、共價反應性、金屬螯合、螢光。經過整理的PAINS過濾器會自動標記這些子結構,而一個被標記的化合物在你信任它之前,應當受到認真的額外審視。
一套有紀律的分類流程
分類是一門手藝:把一份冗長、骯髒的苗頭清單,變成幾個值得投入真正化學工作的系列。目標是又快又省地淘汰壞苗頭,好讓稀缺的精力只用在能存活下來的分子上。下面的順序大致是按「最便宜且最具區分力」優先排列的。
- 用新稱量、重新純化的固體——而非原始板上的樣品——重新確證效力。許多「苗頭」在這一步就蒸發了。
- 做去垢劑測試和一個反向篩選,揭露聚集體和檢測干擾假象。
- 施加PAINS和結構警示過濾器;對任何被標記的東西去調查,而非自動刪除。
- 用一種正交的、了解機制的方法確證結合——生物物理學手段或一個靶點結合讀數。
- 按骨架對倖存者聚類,尋找早期的構效關係和良好的配體效率;只推進系列,而非孤立的單個分子。
對一個真正苗頭最深刻的檢驗,是可解釋的構效關係:當對分子做出小而合理的改動、效力隨之朝合理方向移動時,你幾乎可以肯定自己正結合在一個真實的結合位點上。一個孤零零的高效化合物,沒有任何類似物,周圍的構效關係平坦或混亂——這恰恰是會浪費掉一年時間的那種東西。誠實的分類,正是把原始苗頭清單轉化為下一個學習軌道將要優化的、值得信賴的先導化合物的過程。