蛋白不是雕像
晶体结构冻结了一种构象,但真实的蛋白在不停抖动。分子动力学(MD)模拟这种运动:它把蛋白、配体和显式水放进一个盒子,施加描述所有原子间作用力的力场,并以极小的时间步长向前推进,观察体系的演化。MD 揭示出单张静态图所掩盖的构象柔性——摆开的侧链、把守口袋的环、以及刚性对接看不到的诱导契合。
MD 也是询问水分子的诚实方式。通过观察水分子停留在哪里、被结合得有多紧,你可以辨认出值得作为目标的可被取代的水,以及必须保留的结构水。而且由于 MD 报告涨落,它直接关乎结合熵——结合中常被忽视的那一半,它来自配体锁定时柔性与无序的变化。
把结合视为自由能平衡
亲和力由结合自由能 ΔG 决定,它综合了焓(你画出的相互作用)和熵(有序度、柔性和水)。打分函数只粗略地估计 ΔG,这正是它排序差的原因。要把活性预测到足以指导合成的程度,你需要一种扎根于真实统计热力学、并计入蛋白运动和显式溶剂的方法。
自由能微扰(FEP)就是这种方法。FEP 不去计算单个分子的绝对 ΔG(那非常困难),而是计算两个相近类似物之间结合自由能的差值:在口袋中和在水中,全程用 MD,把一个逐渐"变形"为另一个。由于两条路径共享大部分结构,误差相互抵消,现代 FEP 能把相对活性预测到约 1 kcal/mol——足以为下一步该做哪个类似物排序。
Why a difference is easier than an absolute: ligand_A --(alchemical morph in WATER)--> ligand_B : dG_water ligand_A --(alchemical morph in POCKET)--> ligand_B : dG_bound ddG_binding(A->B) = dG_bound - dG_water A simple edit -- swap H for F, add a methyl -- changes little, so the shared parts cancel and only the change is 'paid for'.
用好 FEP,不浪费它
FEP 准确但昂贵,而且它的优劣完全取决于你起始的姿势。它在正确的地方才有回报——对一个已知系列进行后期、细致的优化——而如果你让它去比较差异极大的分子,或依赖一个你并不确定的姿势,就会浪费算力。把它当作一道精密过滤,并通过用你已经测量过的化合物来核对它,保持它的诚实。
- 在先导优化中使用 FEP,此时你有一个可信的结合姿势,并在固定骨架上探索小的修改。
- 让微扰小且化学上合理——H→F、加一个甲基、单个环替换——以保持循环可靠。
- 把计算锚定到已测量的类似物上,以便用真实数据核对预测。
- 对虚拟想法排序,合成排在前面的几个,把结果反馈回来,再重复——FEP 是设计循环内的一道过滤,而不是实验室的替代品。