2017年2月6日, 国家基因库生物多样性基因组学团队、日本东北大学、东京大学等单位的科学家们共同揭开鸟类特有性状的形成及宏观演化之谜——特异性保守序列对鸟类特有性状的宏观演化起到重要作用。此项关于鸟类基因组特异性保守序列 (avian-specific highly conserved elements, ASHCEs) 的研究成果在Nature Communications上发表。中国科学院古脊椎动物与古人类研究所徐星研究员也参与了该研究,从古生物学角度佐证了这项主要基于基因组信息的研究。
鸟类,作为恐龙现存的唯一后裔,曾在白垩纪末大灭绝事件后(约6600万年前)发生爆发性的物种演化,演化出众多种类,生存于各式生态环境中。如今,现生鸟类超过10500种,是四足类脊椎动物中最丰富的一个类群。虽然鸟类拥有极为丰富的生物多样性,但几乎所有的鸟类都具有许多共同的特征,比如鸟喙、中空质轻的骨头、羽毛、飞行能力等。这些鸟类区别于其他物种类群的特征如何在演化过程中形成,是演化生物学里最基础的问题之一。
图1 鸟类特有形态之一:翅膀上的飞羽是赋予鸟类飞行能力的最重要特征。
研究者首先猜测鸟类的特异性表型可能与其基因组特异性的保守DNA序列有关,即这些序列由于受到强烈的自然选择压力在所有鸟类中很少发生变化,但在其他脊椎动物里这些序列要么不存在,要么发生了很大的变化。研究团队通过比较48个已知鸟类物种的基因组和9个其它类群脊椎动物基因组(涵盖哺乳类、爬行类、两栖类和鱼类),发现大概1%的鸟类基因组区域属于鸟类基因组特异性保守序列(ASHCEs),而超过99%的ASHCEs都落在非编码区。在比较蛋白编码基因数目时发现,跟其他脊椎动物相比,鸟类基因组极少产生新的蛋白编码基因。由此研究者们推断,鸟类特异表型的产生并不是通过增加新的蛋白编码基因来实现,而是通过改变非编码区的调控序列,从而影响基因的表达,即ASHCEs可能包含重要的基因调控功能。
图2 鸟类在演化过程中几乎没有产生新的基因:通过比较48只鸟及9种其他动物的基因组,发现在鸟类特异保守的DNA序列中,几乎全是(99.69%)不编码蛋白质的。
通过分析研究发现,一半以上的ASHCEs含有潜在的转录因子结合位点;另外还有不少还可以表达形成非编码基因。转录因子结合位点和非编码基因都是基因表达调控中的重要角色,这正验证了ASHCEs包含大量调控元件的推测。此外,研究者们使用染色质免疫共沉淀技术(ChIP-seq)获取鸡胚胎不同发育时期的三种组蛋白修饰图谱进行分析,发现这三种染色质组蛋白修饰都在ASHCEs中显著富集。其中一些ASHCEs在不同发育时期呈现出不同程度的组蛋白修饰水平,说明这些元件很可能是鸟类特有的参与发育调控的增强子或调控序列。
图3 鸟类在演化过程中获得了新的增强子,以致改变了对基因在时间和空间的激活状态:在鸟类的演化过程中,基本上没有新基因的产生。鸟类主要通过获得新的基因调控DNA序列来控制新性状的形成。
研究团队为深入研究ASHCEs在鸟类发育中的调控功能,用原位杂交技术检测100个ASHCE关联基因在胚胎发育中的表达模式。通过比较鸡、壁虎和小鼠的胚胎发育过程,研究者识出多个基因在鸟类胚胎发育过程中有着特异表达模式。最有意思的是SIM1基因,它只在鸡胚胎中表达,其表达时间和位置与飞羽的发育时间和位置相契合。飞羽是特化的羽毛,飞羽的出现是鸟类拥有了飞翔能力的关键因素。研究者将SIM1关联的一个ASHCE序列结合绿色荧光蛋白转入小鼠胚胎中,转基因小鼠胚胎中的绿色荧光蛋白即呈现出与鸡胚胎中SMI1一致的表达模式,验证了SIM1关联ASHCE元件具有增强子功能。因此,研究者认为SIM1基因以及其关联的ASHCE对鸟类飞羽的形成有着重要的作用。而这个鸟类特有性状正是因为鸟类祖先在与其他恐龙分化后,SIM1基因附近获得一个关联ASHCE元件,促使了鸟类飞羽的表达,也使得鸟类获得飞翔的功能。
图4 Sim1鸟类增强子使飞羽的发生位置活性化:Sim1基因在鸟类以外的动物中也存在,并且与中枢神经系统等作用有关。但是鸟类的Sim1基因由于有鸟类特异性增强子的存在,在翅膀的飞羽形成位置被激活表达(上图)。另一方面,其他动物(例如小鼠)的前足并没有Sim1基因的活性化(中图);而把鸟类增强子人工导入后,小鼠的前足也能和鸡的翅膀一样有该基因的表达(下图)。报告基因是一个用来观察基因是否被某个DNA序列(这里是鸟类增强子)打开或关闭的工具。
鸟类不仅在翅膀上生长出飞羽,在尾巴上也长着同样类型的羽毛,成为雄鸟展示自身,吸引异性的重要装饰。研究团队根据恐龙化石和早期鸟类祖先化石发现,翅膀上的飞羽和尾巴上的飞羽是在同一时期演化形成。根据SIM1基因在翅膀和尾巴的表达模式,研究人员推测两个部位的飞羽可能有相同的分子演化机制。此外,研究人员还发现有些驯化的鸟类比如鸡和鸽子,由于人为的选择,有些品系甚至在腿上也长着相同的飞羽,在这些品系的腿部同样能检测到SIM1基因的表达, 更进一步证明SIM1是控制飞羽形成的关键基因。
图5 Sim1鸟类特异的增强子是在恐龙时代获得的:根据化石记录推定,鸟类约在1亿7千多年前侏罗纪时期获得初级的飞羽。而这个增强子约在1亿4千年前开始受到强烈的自然选择压力,开始在鸟类基因组固定下来。此时恰好与鸟类祖先首次出现真正意义的现代飞羽的时间吻合。在这一时期鸟类进一步提高了其飞行能力。
鸟纲基因组计划(B10K)负责人及本项研究的通讯作者张国捷研究员介绍说,鸟类采取了于其他物种不同的方式来实现其生物特征的演化,即不需要借助新基因的产生,而是改变其中的非编码序列来实现对基因功能的特异性调控。为适应飞行,鸟类面临着强大的选择压力因而只保留了很小的基因组,所以在演化过程中很少产生新的基因。但通过对少数的非编码元件的修改也使得鸟类获得了许多其他物种所没有的特异性状。
值得一提的是,这项研究是一个多学科综合的成果,集合了基因组学、发育生物学、演化生物学和古生物学等多个学科的知识,为系统了解生物复杂演化机制提供了重要的借鉴。