西瓜基因组框架图谱绘制与20份代表性资源重测序研究
郭绍贵,许 勇(编译)
(北京市农林科学院蔬菜研究中心 北京 100097)
目的与意义:西瓜是一种重要的葫芦科作物,占全世界蔬菜生产面积的7%。经过长期人工选育,西瓜遗传多样性变的十分狭窄,已成为西瓜品种改良的瓶颈。本研究以东亚类型高品质西瓜品种‘97103为材料进行西瓜全基因组序列分析,并开展20份代表性西瓜资源的基因组重测序分析,以明确西瓜基因组结构和进化历程,阐明果实品质和维管束信号传导等重要生物学过程的分子机制。
材料与方法:利用Illumina GAII测序平台进行‘97103基因组高通量测序。基于‘97103×PI296341-FR F8重组自交系群体构建高密度遗传图谱进行scaffold锚定。利用PILER、RepeatScout、LTR_FINDER、RepeatProteinMask和RepeatMasker进行基因组重复序列注释。利用Augustus、GlimmerHMM、BLAT、TBLASTN和GLEAN进行基因预测整合。基于SwissProt、TrEMBL、Pfam、PRINTS、PROSITE、ProDom和SMART数据库进行基因功能注释。利用OrthoMCL进行基因家族分析,MRBAYES构建系统进化树。通过Pfam和SMART数据库比对鉴定基因组抗病基因。利用454测序平台进行果实发育转录组分析。
结果与分析:(1)‘97103测序组装获得了353.5 Mb基因组序列,覆盖了西瓜全基因组大小的83.2%,共包含1 793个scaffolds (≥500 bp),scaffold和contig的N50长度分别为2.38 Mb和26.38 kb。共有234个scaffold锚定到西瓜11条染色体,覆盖了西瓜基因组大小330 Mb,占基因组组装序列的93.5%。西瓜基因组共预测出23 440个蛋白编码基因,其中约85%的基因被功能注釋。(2)利用荧光原位杂交技术分析发现,10份现代栽培西瓜(C. lanatus subsp. vulgaris)和6份半野生西瓜(C. lanatus subsp. mucosospermus)的5S和45S分布与97103基因组上的rDNA分布一致,而野生西瓜(C. lanatus subsp. lanatus)基因组含有1个45S和2个5S rDNA簇,其中一个5S rDNA簇位于染色体11短臂,表明在西瓜进化过程中染色体可能发生了融合、断裂和倒位事件。这一发现进一步证实了三个西瓜亚种的系统进化关系。根据双子叶植物古六倍体化事件,我们提出了从7条祖先染色体到现代西瓜11条染色体的进化模型。(3)本研究对20份代表性西瓜资源进行了基因组重测序分析,共鉴定出678万个SNP和96万个Indel。遗传多样性分析表明,野生西瓜具有更高的遗传多样性,说明利用野生西瓜进行种质改良有很大的潜力。进一步通过邻接树法和主成分分析方法研究了西瓜种质资源的群体结构关系,结果显示,栽培西瓜C. lanatus subsp. vulgaris和半野生西瓜C. lanatus subsp. mucosospermus的关系更近。(4)群体进化分析共鉴定出108个选择性清除区域,覆盖基因组7.78 Mb,包含741个基因。我们发现与西瓜重要性状生物学过程有关的候选基因受到进化选择,如碳水化合物利用调节、糖介导的信号传导、碳水化合物代谢、蔗糖刺激响应、氮素代谢调节、低氮胁迫细胞响应和生长等。3号染色体3.4~5.6 Mb区域鉴定出一个包含12个S-locus蛋白激酶串联排列的基因簇。同时,植物抗逆相关基因与品质性状相关基因(如碳水化合物代谢、果实风味和种子含油量等)也富集在该区域。(5)抗病性改良一直是西瓜育种的主要目标。西瓜基因组共鉴定出44个NBS-LRR基因。分析发现,NBS-LRR基因为独立进化,而LOX基因家族经历了一个快速扩张过程。我们进一步鉴定了197个receptor-like基因,具有染色体成簇分布的显著特征,表明串联复制可以是这些抗病基因的进化基础。(6)我们分别从西瓜和黄瓜维管束鉴定出13 775和14 242个mRNA,从西瓜和黄瓜韧皮部汁液中分别获得了1 519和1 012个转录本。分析发现西瓜和黄瓜维管束中获得的基因基本一致,而韧皮部汁液中的转录本仅50%~60%为两者共有。GO term富集分析显示,这些共有韧皮部转录本主要参与胁迫或刺激响应。(7)西瓜果实发育是一个复杂的过程。在果实发育过程中,3 046和558个基因分别在果肉和果皮中差异表达。GO term富集分析显示,果实发育过程中果皮和果肉的多个生物学过程相关功能均发生了显著变化,如细胞壁形成、类黄酮代谢和防卫反应等。而类胡萝卜素、已糖和单糖代谢过程仅在果肉发育过程中发生显著变化,在基因表达水平上反映了西瓜果肉和果皮之间的主要成熟特性差异。193个转录因子在果实发育过程中显著差异
表达。其中bZIP基因Cla014572含有SC-uORF结构域,随着果实发育而下调表达。MADS-box转录因子是果实膨大和成熟过程的重要调控基因。基于系统进化分析我们在RIN和AGL1分支中分别发现2个西瓜MADS-box转录因子在西瓜果实发育过程中差异表达。其中Cla009725和Cla019630的表达模式与番茄TAGL1类似,推测它们在西瓜果实发育过程中具有类似的生物学调控功能。(8)西瓜瓜氨酸代谢途径分析发现,精氨琥珀酸裂解酶和精氨琥珀酸合成酶家族发生了基因扩张。其中1个精氨酸琥珀酸裂解酶和2个精氨琥珀酸合成酶基因随着西瓜果实发育显著下调表达,表明成熟果实中的瓜氨酸积累可能是由于瓜氨酸降解活性的下降而引起。
结? ? 论:本研究完成的西瓜基因组框架图谱是分子生物学研究和遗传改良的关键数据资源。我们发现从半野生西瓜到现代栽培西瓜的驯化过程中,多个基因组区域受到强烈选择,进而形成了现代栽培西瓜含糖量高、早熟等生物学特征,而大量抗病基因在从野生西瓜到现代栽培西瓜的进化和人工驯化过程中丢失。结合维管束与果实发育转录组测序,明确了瓜类植株信号传导和调控、果实成熟糖代谢与调控以及瓜氨酸代谢的基因网络,为最终阐明葫芦科作物基因组进化与重要性状形成的分子机制等理论研究奠定了重要基础。