从笔误到症状:「分子基础」到底指什么
你已经爬了很长一段路才到这里。你知道 DNA 里的一个单碱基改变能层层荡漾开去:一个被改动的密码子拼出不同的氨基酸,不同的氨基酸能把蛋白折成错误的形状,而一个走样的蛋白会在某个细胞指望它去做的工作上失手。分子医学不过是把这层涟漪一路追到一个人身上。疾病的分子基础这一论断——在过去七十年里被一个个病例证实——是说:疾病并非某种模糊的体液失衡,而是一些你能叫出名字、能找到、有时还能修好的具体分子的失灵。
请留意这条推理链,因为整级阶梯都立在它上面:基因型(你携带的 DNA)上的差异,只有通过中间的分子——RNA、蛋白质、它们运行的反应——才会变成表型(你身体如何运转)上的差异。一个在你肝细胞里从不开启的基因发生突变,是不可能引起肝病的;突变只在那个基因真正表达的地点和时刻才有意义。这正是为什么「某某病的基因」几乎总是一句误导人的话。基因并不直接造就性状;它们指定分子,而那些分子嵌在一张活的网络里,才产生了性状。把基因与结局之间这道缝隙记牢——简单的故事正是在这里收尾,复杂的故事正是从这里开场。
镰状细胞贫血:一个字母决定一切的教科书案例
全部医学里最干净利落的故事是镰状细胞贫血,史上第一个被追溯到单一分子改变的疾病——由莱纳斯·鲍林在 1949 年完成,那时人们甚至还没读出过一段 DNA 序列。出问题的蛋白是血红蛋白,那个填满你红细胞的携氧者。在编码它一条链的基因里,单单一个碱基被换掉了:一个 A 变成了 T。这一个字母改了一个密码子,GAG 变成 GTG,从而在这条链的第六位换掉一个氨基酸——把带电、亲水的谷氨酸,换成油腻、疏水的缬氨酸。单基因病再没有比这更字面的了:一个碱基,一个密码子,一个氨基酸,一种疾病。
normal allele: ...G A G... -> codon GAG -> glutamate (charged, soluble)
sickle allele: ...G T G... -> codon GTG -> valine (greasy, sticky)
^
one A->T change, position 6 of the beta-globin chain
result: a sticky patch -> hemoglobin molecules clump into fibers
when oxygen is low -> red cell warps into a 'sickle' crescent为什么这么小的一换就毁了一个细胞?新来的油腻缬氨酸在蛋白表面造出一块黏性的补丁。氧气充足时什么也不会发生,可一旦氧气变低,这块补丁就让血红蛋白分子彼此勾连,堆叠成又长又硬的纤维。这些纤维把柔软的圆形红细胞顶得变了形,成了僵硬的新月——一个镰刀状——它会卡在狭窄的血管里,让组织缺氧,引发界定这种病的疼痛危象。每一个症状,都从那个待错了地方的疏水氨基酸一路展开。这也漂亮地重温了前面阶梯的一个主题:一个蛋白的工作取决于它的形状,形状又取决于它的序列,所以序列出错就是形状出错,就是工作失败。
囊性纤维化:一个基因,多种坏法
囊性纤维化是诚实的下一级台阶。它仍然是单基因病——每一个病例都追溯到 CFTR 这个基因,它编码一个把氯离子泵过肺和肠道内壁细胞膜的通道。当这个通道失灵,那些表面上那层稀薄的水就变得又稠又黏;黏液堵塞气道,困住细菌,肺便慢慢结疤。到这里为止,跟镰状细胞一样干净。复杂之处在于,并不存在单独一个「那个」突变。CFTR 上两千多种不同的改变都能引起这种病,而且它们把通道弄坏的方式确实各不相同。
有些突变删去一个氨基酸(常见的 F508del),通道因此折叠错误,细胞的质检系统在它还没到达表面之前就把它销毁了——这正是你两级阶梯之前见过的那种蛋白折叠失败。另一些突变让通道到达了膜上却卡死合不开,或者造出一个开启太罕见的通道,又或者引入一个过早的无义终止密码子,把蛋白截短成废物。一个基因,一个病名——底下却是好几种各不相同的分子缺陷。这对治疗关系极大:一种帮助折叠错误的通道正确折叠的药物,对一个根本没被造出来的通道毫无作用。分子层面的细节并非纸上谈兵;它决定了哪一种药才可能管用。
诚实的大多数:复杂的多基因病
下面是那些干净案例所掩盖的真相:单基因病是罕见而鲜明的例外。它们被先教,恰恰因为从因到果的那条线如此清晰可读。但塞满诊所的那些病——心脏病、二型糖尿病、大多数癌症、抑郁症、哮喘、阿尔茨海默病——都是[[complex-polygenic-disease|复杂的多基因病]]。「多基因」是说许多基因都有份,每一个都只把你的风险往上或往下轻轻推一丝,而非由某一个单独决定你的命运。这里没有一处 GAG 变 GTG 可供你指认。取而代之的,是成百上千个常见变异,每个单独看几乎无害,却在整张网络上相加、互动。
而且基因只是故事的一半;另一半是环境——饮食、吸烟、感染、压力、你呼吸的空气。一种对糖尿病的遗传易感性,可能在一个人身上沉默一辈子,却在另一个人身上浮现出来,全看他们怎么生活。这正是为什么这些病在家族里松散地聚集,却不遵循单基因遗传那种整齐的比例:你继承到的是一种几率上的倾斜,而非一纸判决。生物学家用来给这些倾斜绘图的工具是[[molbio-genome-wide-association-study|全基因组关联研究]],即 GWAS。它扫描海量人群的基因组——有的患病、有的不患——寻找在患病组里出现得更频繁的单字母变异(SNP)。
遗传还是后天获得:同一个基因,两个不同的故事
还有第二条轴线横切过上面这一切,错过它会造成实实在在的混淆。一个突变可以是遗传的——它存在于孕育你的那枚卵子或精子里,于是它坐在你身体的每一个细胞中,并能传给你的子女。这叫生殖系突变。或者,一个突变可以是在你一生中、在某一个细胞里后天获得的——分裂时的一次复制失手,紫外线或烟草烟雾的一记重击——随后只由那个细胞及其后代携带。这叫体细胞突变。它不能被你的子女继承,因为它从未到达生殖细胞,但它绝对能在你身上引起疾病。
癌症是体细胞疾病的最佳范例,你将在下一篇指南里正式认识它。眼下先记住这条要点:癌症压倒性地是一种体细胞突变累积的病。在许多年里,一支细胞谱系积攒起一连串改变,把生长的刹车一一弄坏——敲掉一个肿瘤抑制基因,过度激活一个生长信号——直到某个克隆毫无节制地分裂。这正是为什么一个肿瘤的癌症基因组,与你出生时的基因组不同:这个肿瘤有它自己的突变史,是在你一生中一个细胞一个细胞写下的。确有少数癌症起始于一个遗传来的突变,让一个人朝着这种病抢先一步,但肿瘤本身仍是在这之上再叠加体细胞的打击才搭建起来的。
为什么找到病因是通向治愈的第一步
为什么要这么拼命去寻找分子病因?因为病因告诉你治愈可能从哪里下手。一旦你知道镰状细胞贫血是某个基因里的单个碱基,修复的靶点就一目了然了:改写那个字母,开启一个身体在出生后通常会关掉的备用血红蛋白基因,或者补进一份能用的拷贝。这每一条如今都是真正在试验中的策略。分子损伤越清晰、越单一,干净利落的基因治疗就越说得通——这正是为什么最早获批的基因编辑疗法瞄准的是像镰状细胞贫血这样的单基因病,而不是像心脏病那样的多基因病。
对多基因病而言,希望的形态不同,却同样真实。你不会把一个人身上一百个风险变异统统编辑掉。取而代之,了解这些分子让你找到瓶颈口:许多那些小风险基因恰好都汇入的某条通路,在那里一种选对了的药能起大作用。它还让你给病人分门别类——同一个诊断之下,可能藏着好几种对不同治疗有不同反应的分子亚型,这正是你将在本级阶梯后面探讨的精准医学的核心思想。诚实的说法是:理解分子基础,把一种疾病从一个你只能靠试错来对付的黑箱,变成一套你可以推理的机制——而推理,正是让你能够设计、而非靠猜的东西。