就是A rose by any other name would smell as sweet(即使给玫瑰换个称谓,它依然芳香如故)。
但如果看看我们自己的DNA剧本,它并不像莎士比亚那些划了线的词语那么清晰和紧凑。相反,每个编码蛋白的区域就像是漂浮在废话海洋上的一个词。
多年来,科学家们并不能解释为什么那么多的DNA不编码蛋白。这些非编码的部分被误会成垃圾DNA。但渐渐的,这个看法已经被一大堆理由逼迫得站不住脚了。
也许,转变该观点最根本的原因是源于我们细胞中垃圾DNA那惊人的总量。其中一个最大的冲击来自2001年人类基因组测序完成的时候,人们发现人类细胞中98%以上的DNA被划入了垃圾的行列。它不编码任何蛋白。上面使用的莎士比亚的比喻实际上是一个精简了的模型。在基因组里,乱七八糟的文字的比例约为前面提到的乱序剧本的4倍。每一个有意义的字母都对应着超过50个字母的垃圾文字。
还有一个类似的比喻。请想象下我们去参观一个汽车厂,这家汽车厂也许像法拉利那么高端。如果我们看到只需要两个人就能造好一辆炫酷的红色跑车,而同时又有98个人在一旁无所事事的话一定很惊讶。这显然是荒谬的,那么为什么这在我们的基因组里是合理存在的?当然,你可以说从共同祖先进化而来的生物往往不是完美的比如我们人类就确实不需要阑尾(本书中作者多次以阑尾为例说明人体确实存在一些无功能的器官,但此观点尚存争议,因为有研究者认为阑尾在免疫和消化方面仍具有一定的功能。)但这次似乎不完美得有点过头了。
事实上,在我们的汽车厂里,更可能的情况应该是,由两个人组装一辆汽车,其他的98个人做着其他一切使这家企业运转的工作。融资、记帐、宣传产品、处理养老金、打扫厕所和汽车销售等,这可能是一个更好的垃圾DNA在我们基因组里工作的模式。我们可以把蛋白作为生命所需的最终物质,但如果没有垃圾DNA的话,它们永远不会被正确地生产和整合出来。确实,两人就能制造汽车,但他们不能保证公司可以出售汽车,也不能把它变成一个强大且成功的品牌。同样,如果没有汽车被生产出来,就算有98个员工在展厅拖地板和磨破嘴皮子也没有任何意义。只有每个组件各司其职的时候整个组织才能运转。而这,就是我们基因组的模式。
另一个来自基因组测序的令人震惊的事实是,使用经典的基因模型无法解释人类极其复杂的解剖结构、生理功能、智力和行为。在编码蛋白的基因的数量上,人体跟简单而微小的蠕虫几乎具有相同的数量(大约20 000个)。更值得注意的是,大部分蠕虫的基因跟人类基因可以直接等效。
当研究人员想在DNA水平上深入分析人类与其他生物到底有什么区别的时候,很明显,基因不能提供解释。事实上,遗传物质只有一个特征与复杂性相关。这个唯一的随着动物复杂性增加而增加的就是垃圾DNA区域。一个生命体越复杂,垃圾DNA所占的百分比就越高。只有现在,科学家们才真正开始关注这个有争议的观点,就是垃圾DNA可能是进化复杂性的关键。
从某个角度看,这些数据所引出的问题是很明显的。如果垃圾DNA是如此的重要,那它到底是干什么的?如果不编码蛋白,它在细胞中的作用是什么?现在人们逐渐接受了垃圾DNA其实具有多种不同功能的观点,所以对下面的叙述我们并不会感到吃惊。
它们中的一些在染色体(我们的DNA被打包成的巨大分子)中形成特殊的结构。这种垃圾DNA保护我们的DNA不被解体和受损。随着我们年龄的增长,这些区域不断缩小,最后缩小到临界程度。之后,我们的遗传物质就变得很容易遭遇潜在的灾难性的重排,从而导致细胞的死亡或癌变。其他结构类型的垃圾DNA在细胞分裂成子细胞过程中进行染色体均分时作为锚点。(子细胞是指由亲代细胞分裂产生的细胞。)其他的则作为绝缘结构,限制了特定区域染色体的基因表达。
但是我们很多的垃圾DNA并不仅仅具有上面提到的功能。它确实不编码蛋白质,但它却编码另外一种分子,我们称之为RNA。垃圾DNA里面有很大一类在细胞内建造工厂,来帮助蛋白质的合成。其他类型的RNA分子负责将制造蛋白质所需的原料转移到工厂里面。
另外有些垃圾DNA是来自病毒和其他微生物的遗传物质的入侵,它们已经如遗传间谍般融入了人类染色体中。这些早已死去的生物的残留物对细胞有着潜在的危险,有些在个体中,而有的甚至存在于广泛的人群中。哺乳动物细胞已进化出多种机制来使这些病毒元件保持沉默,但有的时候这些系统可以被打破。当出现这种问题的时候,它们所产生的影响可以是相对良性的,比如特定种系小鼠毛色的改变,也可以是很严重的,比如增加罹患癌症的风险。
就在前几年,人们认识到垃圾DNA的一个主要作用其实是调节基因的表达。有时候,它在个体上会有巨大的、明显的效果。比如,一个垃圾DNA就可以决定雌性动物能否保持正确的基因表达模式。它的作用也可以是在群体中的,一个最常见的例子是虎斑猫颜色特征的控制。在极端的例子中,该机制也能解释为什么有同样遗传性疾病的同卵双胞胎女性会出现截然不同的症状。在某些情况下,情况可以极端到双胞胎中的一个罹患了严重危及生命的疾病,而另一个则是完全健康的。
成千上万的垃圾DNA片段被认为参与了调控基因表达的网络。它们就像是遗传剧本的舞台导演一样,只是其指导对象的复杂性是我们在剧院里无法想象的。它绝对不是出去,被熊追赶那么简单。而应该是类似于如果在温哥华和珀斯的暴风雨中表演《哈姆雷特》,就应该重读《麦克白》这一行的第四音节。除非有个业余演员在蒙巴萨表演《理查三世》而且基多在下雨。
研究人员刚刚才开始揭开垃圾DNA庞大网络中的奥秘和关联的一角。这个领域仍极具争议。在极端的情况下,有科学家声称有些武断的说法严重缺乏实验证据的支持。其他有些人则觉得有整整一代科学家(甚至更多)被困在一个过时的模型中而无法看到或者理解这个新领域。
有部分原因是,我们可以用来探索垃圾DNA功能的手段还比较落后。这有时会让研究人员很难使用实验来检验他们的假设。确实,我们对该领域的研究时间还相对较短。但有时候,我们可以从实验室的板凳跟机器旁退出来,去草坪转转。实验每天都在我们身边发生,因为自然和进化已经使用了几十亿年的时间来尝试各种变化。即使仅仅在我们这个物种出现和繁衍的时间段,也已经有足够的时间来进行大规模的实验测试。因此,我们将在本书中利用人类遗传学的火炬来探索黑暗。
可以有许多方法来开始我们的探究基因组暗物质之旅,这里,让我们用一个有些奇怪但不容置疑的事实来开始。一些遗传病是由垃圾DNA的突变引起的,这应该是我们进入隐藏的基因组宇宙的最好起点。