基于配体的设计：药效团、QSAR 与描述符

当你从配体而非靶点出发设计

基于配体的药物设计用于没有好的靶点结构的情形——这对膜蛋白和新型靶点很常见。你不去看口袋，而是研究一组你已知活性的分子，并发问：活性分子共有而非活性分子缺乏的是什么？整个构效关系（SAR）学科就在这里，如今被形式化，使计算机能对它进行推理。

药效团是其核心的抽象概念：分子要有活性所必须呈现的特征三维排布——这里一个氢键供体、那里一个受体、一个疏水基团、一个芳香环、一个正电荷。药效团模型把这个概念变成一个具体查询：把若干已知活性分子叠合，找出它们在空间中共有的特征，再用由此得到的模式去搜索库或评判新设计。

把分子变成数字

计算机无法对一张分子的图像进行推理；它需要数字。分子描述符是任何计算得到的性质——分子量、logP、氢键供体数、极性表面积、环数——它概括了结构的某一个侧面。分子指纹是另一种表示：一长串比特位，标记分子含有哪些子结构或原子环境，于是两个分子可以根据共享的比特数来比较相似性。

QSAR——定量构效关系——是把这些数字映射到活性的模型。其经典形式是一个回归：活性 ≈ 描述符的加权和。QSAR 模型让你能预测一个尚未合成的分子的活性，而且同样有用的是，它会告诉你哪些描述符驱动活性——为你的化学指明方向。

Toy QSAR (illustrative only):

  pIC50  =  6.2  +  0.8 * (clogP)  -  1.1 * (#H-bond donors)

Read it as: in THIS series, more lipophilicity helps a little,
but each extra H-bond donor hurts potency. Use it to rank
ideas before synthesis -- never as physical truth.

一个简化的 QSAR 方程：系数告诉你在一个同系物系列内哪些性质会改变活性。

基于配体的模型在哪里失灵

这些模型只知道它们被训练过的东西。基于一个骨架建立的 QSAR 对另一个骨架可能严重出错，而且每个模型都有一个适用域——其预测可信的化学空间区域。最尖锐的失败是活性悬崖：两个在指纹看来几乎相同的分子，活性却天差地别。悬崖违背了大多数 QSAR 背后的平滑假设，而它们恰恰是单个甲基或氟原子让活性开关切换之处。