當你從配體而非標靶出發設計
基於配體的藥物設計用於沒有好的標靶結構的情形——這對膜蛋白和新型標靶很常見。你不去看口袋,而是研究一組你已知活性的分子,並發問:活性分子共有而非活性分子缺乏的是什麼?整個構效關係(SAR)學科就在這裡,如今被形式化,使電腦能對它進行推理。
藥效團是其核心的抽象概念:分子要有活性所必須呈現的特徵三維排布——這裡一個氫鍵供體、那裡一個受體、一個疏水基團、一個芳香環、一個正電荷。藥效團模型把這個概念變成一個具體查詢:把若干已知活性分子疊合,找出它們在空間中共有的特徵,再用由此得到的模式去搜尋庫或評判新設計。
把分子變成數字
電腦無法對一張分子的圖像進行推理;它需要數字。分子描述符是任何計算得到的性質——分子量、logP、氫鍵供體數、極性表面積、環數——它概括了結構的某一個側面。分子指紋是另一種表示:一長串位元,標記分子含有哪些子結構或原子環境,於是兩個分子可以根據共享的位元數來比較相似性。
QSAR——定量構效關係——是把這些數字映射到活性的模型。其經典形式是一個迴歸:活性 ≈ 描述符的加權和。QSAR 模型讓你能預測一個尚未合成的分子的活性,而且同樣有用的是,它會告訴你哪些描述符驅動活性——為你的化學指明方向。
Toy QSAR (illustrative only): pIC50 = 6.2 + 0.8 * (clogP) - 1.1 * (#H-bond donors) Read it as: in THIS series, more lipophilicity helps a little, but each extra H-bond donor hurts potency. Use it to rank ideas before synthesis -- never as physical truth.
基於配體的模型在哪裡失靈
這些模型只知道它們被訓練過的東西。基於一個骨架建立的 QSAR 對另一個骨架可能嚴重出錯,而且每個模型都有一個適用域——其預測可信的化學空間區域。最尖銳的失敗是活性懸崖:兩個在指紋看來幾乎相同的分子,活性卻天差地別。懸崖違背了大多數 QSAR 背後的平滑假設,而它們恰恰是單個甲基或氟原子讓活性開關切換之處。