在翻译本书的过程中我发现有一些概念对于普通读者来说可能难以正确理解,因此我决定在本书开头就部分遗传学知识做一个简单介绍。尽管这是一本科普读物,讨论的是关于基因、食物、行为、环境以及它们之间的复杂交互联系;然而,你依然需要对基因与遗传有一定的了解,才能理解作者的许多见解。
腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)4种不同碱基分别与脱氧核糖和磷酸结合,构成了编码人类遗传信息的4种基本脱氧核苷酸。这4种脱氧核苷酸依照一定顺序排列起来,组成了我们的遗传物质:脱氧核糖核酸,也就是DNA。想象用红、黄、绿、蓝4种颜色的珠子串起一串串珠,我们的DNA也仿佛是这样一串串的串珠。串珠的颜色和排列—也就是脱氧核苷酸的类型与排列—决定了基因的功能。
人体内目前已经发现超过2万个基因,它们分布在人体的23对染色体上。每一个基因都对应一种或者多种蛋白质产物。也就是说,正常的基因执行正常的功能;一旦基因异常,那么下游的蛋白质产物也会发生异常,从而影响功能。严重到一定程度,就会产生相应的疾病表现,我们称之为“表型”。在遗传学研究中,基因型与表型的关联是最为重要的,即基因层面的改变究竟是否会产生相应的表型。这是问题复杂性的来源,也是本书的立论依据。
基因的改变有多种形式,比如缺失了一段,或者某个核苷酸发生了改变—在某个位置,应该是蓝色的珠子变成了红色。这种基因层面的变异也常被理解为“基因突变”。传统观念认为基因突变必然会导致个体的功能受损,从而患上某种疾病。这一观念可以解释很多经典的单基因遗传病,但现代研究发现事实远比这复杂得多。
在人类基因组中有大量序列存在个体差异。比如,一部分人在某个位置的碱基是T,而另一部分人则是A。这种差异可能与种族相关,也可能在种族内发生。关键在于,绝大多数DNA序列差异都没有临床意义—至少我们并没有发现它们的病理意义。目前倾向于认为这些变异位点是人群的多态性。
所谓多态性,简单来说就是在人群中既可以有这种情况,也可以有另一种情况,不同情况之间没有截然的“好坏”之分。血型是最典型的多态性例证。你既可以是A型血,也可以是B型血,或者O型血,或者AB型血。在基因层面,人与人之间存在着巨大的差异,同时这种DNA水平的变异并不会直接导致任何疾病的发生。
目前的研究重点集中在某些多态性位点是否可能与某些疾病的易感性相关。所谓易感性是指个体是否容易患某种疾病。举例来说,有些人无论如何吃喝都不会患糖尿病;而另一些人一旦饮食和行为失当就很容易得糖尿病,比如书中描述的美洲原住民。尽管并没有某个基因直接导致糖尿病,然而可能有一些基因位点决定了某些人更容易患上糖尿病。
如果以人类正常序列作为参照,那么在DNA水平发生的变异可以依据其对表型的影响大致归纳为以下几种类型。
1. 某个基因变异与疾病存在明确的因果关系,即基因变异必然导致疾病发生。这些变异经常被用于疾病的临床诊断。这种直接由基因突变导致的疾病被称为单基因遗传病。书中列举的G6PD缺乏症、镰状细胞贫血等都属于这类疾病,尽管作者赋予了这些疾病不同的内涵。
2. 某个基因变异与疾病的发生存在显著关联,然而基因变异并不一定致病。携带基因变异的个体存在一定的患病概率,并且通常是较高的概率。目前已知的一些肿瘤相关基因,比如BRCA1、BRCA2突变导致的乳腺癌和卵巢癌就属于这一类型的基因型表型关联。
3. 某个基因变异与疾病的发生存在关联,然而基因变异并不能独立致病。这类疾病通常被称为多基因遗传病或者复杂疾病。本书中所罗列的糖尿病、冠心病等我们熟知的现代病大多数属于这一类型。基因在这一过程中决定了疾病的易感性,然而饮食等环境因素发挥了同等重要的作用。这些疾病正是我们理解基因与环境交互作用的最佳途径。
4. 某个基因变异并没有任何已知的表型影响。人类基因组中的绝大多数变异属于这一类。这些变异从侧面印证了我们对基因认识的有限。目前的科学认为DNA序列中有实际意义的编码序列只占极小一部分,大量的序列变异并没有作用。我想这或许只是我们今天认识的局限而已—传统所说的非编码区近年也成为了研究热点,长距离调控和microRNA成为研究热点说明了我们认知的有限—然而,无论如何,你需要知道,在人类的遗传序列上存在大量的“无意义”变异—也就是说,“标准”序列从某个角度来看只是相对的。
|