基於配體的設計：藥效團、QSAR 與描述符

當你從配體而非標靶出發設計

基於配體的藥物設計用於沒有好的標靶結構的情形——這對膜蛋白和新型標靶很常見。你不去看口袋，而是研究一組你已知活性的分子，並發問：活性分子共有而非活性分子缺乏的是什麼？整個構效關係（SAR）學科就在這裡，如今被形式化，使電腦能對它進行推理。

藥效團是其核心的抽象概念：分子要有活性所必須呈現的特徵三維排布——這裡一個氫鍵供體、那裡一個受體、一個疏水基團、一個芳香環、一個正電荷。藥效團模型把這個概念變成一個具體查詢：把若干已知活性分子疊合，找出它們在空間中共有的特徵，再用由此得到的模式去搜尋庫或評判新設計。

把分子變成數字

電腦無法對一張分子的圖像進行推理；它需要數字。分子描述符是任何計算得到的性質——分子量、logP、氫鍵供體數、極性表面積、環數——它概括了結構的某一個側面。分子指紋是另一種表示：一長串位元，標記分子含有哪些子結構或原子環境，於是兩個分子可以根據共享的位元數來比較相似性。

QSAR——定量構效關係——是把這些數字映射到活性的模型。其經典形式是一個迴歸：活性 ≈ 描述符的加權和。QSAR 模型讓你能預測一個尚未合成的分子的活性，而且同樣有用的是，它會告訴你哪些描述符驅動活性——為你的化學指明方向。

Toy QSAR (illustrative only):

  pIC50  =  6.2  +  0.8 * (clogP)  -  1.1 * (#H-bond donors)

Read it as: in THIS series, more lipophilicity helps a little,
but each extra H-bond donor hurts potency. Use it to rank
ideas before synthesis -- never as physical truth.

一個簡化的 QSAR 方程：係數告訴你在一個同系物系列內哪些性質會改變活性。

基於配體的模型在哪裡失靈

這些模型只知道它們被訓練過的東西。基於一個骨架建立的 QSAR 對另一個骨架可能嚴重出錯，而且每個模型都有一個適用域——其預測可信的化學空間區域。最尖銳的失敗是活性懸崖：兩個在指紋看來幾乎相同的分子，活性卻天差地別。懸崖違背了大多數 QSAR 背後的平滑假設，而它們恰恰是單個甲基或氟原子讓活性開關切換之處。