当你从配体而非靶点出发设计
基于配体的药物设计用于没有好的靶点结构的情形——这对膜蛋白和新型靶点很常见。你不去看口袋,而是研究一组你已知活性的分子,并发问:活性分子共有而非活性分子缺乏的是什么?整个构效关系(SAR)学科就在这里,如今被形式化,使计算机能对它进行推理。
药效团是其核心的抽象概念:分子要有活性所必须呈现的特征三维排布——这里一个氢键供体、那里一个受体、一个疏水基团、一个芳香环、一个正电荷。药效团模型把这个概念变成一个具体查询:把若干已知活性分子叠合,找出它们在空间中共有的特征,再用由此得到的模式去搜索库或评判新设计。
把分子变成数字
计算机无法对一张分子的图像进行推理;它需要数字。分子描述符是任何计算得到的性质——分子量、logP、氢键供体数、极性表面积、环数——它概括了结构的某一个侧面。分子指纹是另一种表示:一长串比特位,标记分子含有哪些子结构或原子环境,于是两个分子可以根据共享的比特数来比较相似性。
QSAR——定量构效关系——是把这些数字映射到活性的模型。其经典形式是一个回归:活性 ≈ 描述符的加权和。QSAR 模型让你能预测一个尚未合成的分子的活性,而且同样有用的是,它会告诉你哪些描述符驱动活性——为你的化学指明方向。
Toy QSAR (illustrative only): pIC50 = 6.2 + 0.8 * (clogP) - 1.1 * (#H-bond donors) Read it as: in THIS series, more lipophilicity helps a little, but each extra H-bond donor hurts potency. Use it to rank ideas before synthesis -- never as physical truth.
基于配体的模型在哪里失灵
这些模型只知道它们被训练过的东西。基于一个骨架建立的 QSAR 对另一个骨架可能严重出错,而且每个模型都有一个适用域——其预测可信的化学空间区域。最尖锐的失败是活性悬崖:两个在指纹看来几乎相同的分子,活性却天差地别。悬崖违背了大多数 QSAR 背后的平滑假设,而它们恰恰是单个甲基或氟原子让活性开关切换之处。