Ed WildProfessor Ed Wild撰写 Jianfang Chen译制 Dr Jeff Carroll编辑

翻译:曾译萱,冯璐扬。 在一对亨廷顿等位基因中只要其中一个基因拷贝的CAG重复序列大于正常,就会引发亨廷顿舞蹈症。另一个亨廷顿基因的作用则一直备受争议。现在,基于大量数据分析,有新研究提出“短链CAG重复序列”不影响亨廷顿舞蹈症发病的时间。

什么是基因重复序列?

1993年,研究发现了导致亨廷顿舞蹈症的基因异常,其中值得注意的一点是这不仅仅是一个基因拼写上的错误。

无需担心小因素:在亨廷顿病人的一对“CAG重复序列”中,较小的序列并不影响病人的发病时间。
无需担心小因素:在亨廷顿病人的一对“CAG重复序列”中,较小的序列并不影响病人的发病时间。

大部分情况下,基因遗传病是由单个核苷酸的变化而导致–即组成DNA的单个碱基对的替换、增加或缺失。

但是,亨廷顿疾病中的基因突变更像是某一种化学"口吃"。在亨廷顿基因的前端,有一段序列CAG会被重复数次,通常是10-20次。进行此研究的科学团队发现,每一个亨廷顿患者的此基因中都有一段异常大量的CAG序列重复,并且重复不少于36次。在这对亨廷顿突变等位基因中,CAG序列重复次数多的为长链,重复次数相对少的则为短链。

每个人都有一对亨廷顿基因拷贝

事实上,每个人都拥有两个亨廷顿基因,分别遗传自双亲。只要其中一个基因突变即可引发疾病。

我们称亨廷顿基因中的CAG重复为CAG重复序列,而每一个个体均有一对CAG重复序列。

大多数人都有两个正常的CAG重复序列。大部分已发病或未发病的亨廷顿患者都是其中一个CAG重复序列正常,而另一个CAG重复序列出现错误重复,只有极少部分人是两条CAG重复序列都出现异常。

重复次数是关键

在我们讨论新的研究成果之前,先简要回顾一下对CAG重复序列的现有认识。

在发现了致病基因的突变位点后不久,研究人员便发现了,在较年轻时发病的亨廷顿患者的CAG异常重复更多。并由此推断,CAG的重复次数与发病的年龄成正相关。

而后,深入的研究表明长链CAG重复序列的重复长度是决定病症出现时间以及其进展速度的主要因素。简单来说,长链CAG重复次数越多,发病年龄越小。

长链CAG重复次数与疾病间的关系并非绝对,所以对大多数患者来说,CAG重复次数不能用于预测发病时间。亨廷顿疾病中仍有很多差异性并不取决于长链CAG重复序列。

多年来,研究人员均致力于寻找导致个体差异的原因。是不是饮食、生活方式、药物,亦或者是其他非亨廷顿基因产生的作用?目前,我们仍然不能确定。

短链CAG重复序列

我们回到最初那个简单的结论:患者亨廷顿基因长链CAG序列的重复次数影响发病,但短链CAG序列的重复次数对此似乎不起作用。

自然地,研究人员猜测,患者短链CAG重复序列的差异或许能解释,为什么长链CAG重复序列相同的两个患者会在完全不同的年龄发病。但是对此问题,不同的团队得出了不同的结果。

2009年,荷兰某团队从一个庞大的注册项目中获得了近千亨廷顿患者的数据,并对此进行了研究。不出所料,他们发现亨廷顿突变基因的长链CAG重复序列是决定个体发病时间的最主要的因素,并没有意外。

但是,他们在研究短链CAG重复序列的作用时,有了不寻常的发现:对于大部分患者,短链CAG序列重复次数越少,似乎对大脑有利,病变的程度越轻;但是,对于长链CAG序列重复次数特别多的患者,结果则是相反的–短链CAG序列重复次数在正常范围内偏高则代表着组织病变会较轻。

所以,假设某患者亨廷顿基因长链CAG序列重复次数是41次,那么如果他短链CAG序列重复次数为12而不是20,他的病变程度将较轻。但若某患者突变基因上CAG序列重复次数相当大,比如说60或70,那么如果他的正常基因上CAG重复次数为20而不是12,他的病变反而会较轻。

这真奇怪。但是很显然,如此有说服力的证据确实说明患者一对亨廷顿等位基因上的两个CAG重复序列都有重要的作用。

别这么快下结论!

如果你对这些重复序列的次数多少仍有些迷茫,不用担心!因为多亏了发表在《神经病学》上的一个新研究,所有问题一个一个迎刃而解。

在波士顿麻省总医院,由 Jim Gusella教授领导的研究团队,进行了规模更大的研究,从REGISTER,COHERT和PREDICT项目中收集了超过4,000个患者的资料。这个新研究包括了当时2009年研究的所有数据以及众多新的研究数据。

Gusella教授想让所有的研究回到最初的"设计初稿"上,所以他让团队重新检查了以前研究用过的所有数据模型。

他们获得的结果有点古怪但是非常有趣。这些统计狂人们分析数据时,必须先作出一些假设,然后利用数学公式对结果进行预测,以验证假设是否正确。一般来说,由大量数据所预测出的结果往往非常趋近预期,所以这样做是可行的。

但是在此次研究中,他们发现有一个假设不正确。尤其值得关注的是,他们发现了一个特殊的病人,在亨廷顿基因长链上有120个CAG重复序列,在短链上有11个CAG重复序列。一切都是这个数据惹的祸,使得结果偏差,放大了短链CAG重复序列的影响。

他们把这个个体从研究数据中剔除后,分析发现患者亨廷顿基因短链CAG重复序列对疾病发展没有影响。患者长链CAG重复序列是唯一影响疾病发生发展的因素。

从头开始

Gusella的团队回到了研究的最初设计上,建立了崭新可靠的方法来研究基因对亨廷顿疾病的影响。
Gusella的团队回到了研究的最初设计上,建立了崭新可靠的方法来研究基因对亨廷顿疾病的影响。

考虑到一个特殊个体对接近千人的样本都有如此大的误导,Gusella的团队于是着手设计了一个更好的模型用以分析他们庞大的数据集合,从而减少单一极端个体产生的偏差。

令人欣慰的是,最终结果表明,患者短链CAG重复序列并不会对疾病产生影响,也没有证据显示亨廷顿基因长短链CAG重复序列会相互作用。

对两个亨廷顿基因都突变的10位患者研究发现,即使是长短链CAG重复序列都存在异常,CAG重复次数较多的基因仍旧是唯一影响发病的因素。

所以,我们又回到了最初那个相对简单的结论:亨廷顿长链CAG重复序列确实可以影响发病,但无法成为预测个体发病情况的标准。同时,短链CAG重复序列并无实际作用。

倒退还是进步?

这个最新的研究可能被看做是一个倒退:我们过去以为正确的认知被推翻了。

但我们不这样想。对于我们来说,寻找导致亨廷顿疾病发病的真正原因才是最重要的,即使这意味着质疑我们对此疾病最基础的设想。

2009年提出的理论认为亨廷顿基因的长短链CAG重复序列会相互影响。事实上,这个假设有点不合理,就我们目前对突变亨廷顿蛋白的认识,要解释这个理论有一定难度。

所以,既然我们确定短链CAG重复序列又回到了以前的状态,我们就又少了一样需要担心的事情。而且,我们非常肯定所有支持这一理论的数据都充分合理。

Gusella教授的研究还有一个好处,它给予了我们崭新可靠的数学统计方法,可用于研究基因差异对症状发病的影响。

随着大规模的研究慢慢步入正轨,这些方法在不久的将来很可能非常有价值,可以用于搜索整个人类基因组,寻找影响亨廷顿疾病的基因。

我们常说"科学就是积累"。对于这句话,这是个很好的例子。每天,我们对亨廷顿疾病的了解都会多一点点。每过一天,我们就离找到治疗方法的那天更接近一点。