基于DArT-Seq SNP的高密度遗传图谱的构建及野生型和 栽培型西瓜杂交遗传群体偏分离基因组区域的鉴定

    任润生 李苹芳 徐锦华 张曼 刘 广 姚协丰 羊杏平

    目的与意义: 西瓜[Citrullus lanatus (Thunb.) Matsum. et Nakai] 是重要的蔬菜作物,在全世界范围内都广泛种植。构建高密度的西瓜遗传图谱和不断利用新开发的标记构建饱和遗传图谱仍然是目前西瓜基因组学研究的重要内容之一。本项研究主要以西瓜自交系‘K3和野生西瓜种‘PI 189225为亲本构建F2分离群体,利用以DArTseq为基础的SNP标记构建西瓜高密度遗传连锁图谱。

    材料与方法: (1)对苗期采集的母本、父本、F1、F2 单株幼嫩真叶2 g,真空干燥后,采用CTAB法进行DNA提取。(2)依照Kilian 等(2012)的方法,用限制性内切酶PstI 和MseI 将其随机打断,根据酶切的接头序列,采用带有PstI和HpaII的接头序列进行连接并PCR扩增。根据识别标签序列得到每个个体的测序reads,以西瓜97103为参考基因组序列进行BLAST序列比对和数据过滤等获得亲本与群体的SNP基因型。(3)根据亲本与群体的基因型,采用滑动窗口法,即选择以每15个SNP 为1个窗口,每次滑动1个SNP,确定每个窗口的基因型以及每个个体的交换位点,得到每个个体的Bin基因型。(4)使用JoinMap4.1软件,作图法选择maximum likelihood(ML)算法,作图函数选择Kosambis 函数构建遗传图谱。各个染色体遗传标记图谱采用软件MapChart v2.2进行作图。

    结果与分析: (1)采用DArTseq方法,共获得了4 808个SNP标记,这些标记的平均得率为91.3%,PIC值为0.022~0.500,平均PIC值为0.454。根据SNP标记剔除的标准,共有1 343个SNP标记被剔除,剩余3 465个标记(占总数的72.1%)用来组装相应的bin标记。(2)利用滑动窗口法和软件JoinMap 4.1进行遗传图谱构建,最终获得包含1 161个bin标记的高密度遗传图谱,全长1 099.2 cM,标记间平均距离为2.16 cM。单个染色体长度差异明显,其中最短的7号染色体为61.8 cM,最长的5号染色体为140.2 cM。单个染色体上的bin标记数也差异明显,其中bin标记数最少的为7号染色体,共含有62个bin标记;5号染色体为含有最多bin标记的染色体,共含有160个bin标记。平均每条染色体含有105.5个bin标记。大部分bin标记间的遗传距离都小于5.0 cM,而01号染色体则有区间分别为5.5 cM和9.9 cM;03号染色体则有区间分别为6.2 cM和6.9 cM;10号染色体和11号染色体则有两区间分别为5.4 cM和10.4 cM。整个染色体的物理长度为330.6 Mb,平均物理长度为30.0 Mb,最小的为04号染色体(24.3 Mb),而最长的为9号染色体(35.0 Mb)。(3)研究结果显示大部分染色体的遗传图谱和其物理图谱之间的关系都一致,而只有11号染色体上大约有21.2 Mb的区段则不一致。除了遗传图谱和其物理图谱之间的关系外,我们还通过比较遗传距离(cM)和物理距离(Mb)之间关系,计算了每条染色体的重组频率,结果显示11条染色体的重组频率差异较明显,重组频率最低的为7号染色体,为2.0 cM/Mb;而重组频率最高的为5号染色体,为4.2 cM/Mb;而11条染色体的平均重组频率为3.3 cM/Mb。((4)卡方测验表明,1 161个bin标记中,共有616个标记(占53.1%)表现出显著偏分离(P = 0.05)。其中513個标记(占44.2%)偏向于西瓜优良栽培品种K3,而103个标记 (占8.9%)偏向于野生西瓜种质‘PI189225。513个偏向于西瓜优良栽培品种K3的标记都分布于除6号染色体外的其他所有的染色体上;而103个偏向于野生西瓜种质‘PI189225的标记则主要分布于5个染色体上,分别为04号染色体上 2个标记, 06号染色体上11个标记, 07号染色体上16个标记, 10号染色体上39个标记以及 11号染色体上35个标记。所有的这616个偏分离标记在11条染色体上主要以成簇分布,共形成44个偏分离标记区(Segregation distortion region,SDRs)。⑤通过对西瓜种质‘97103和‘PI 296341-FR之间基因组序列的比对,在葫芦科基因组数据库中共鉴定出4 335 338 SNPs 和35 197 InDels。为了确定在本研究中的偏分离的标记主要是由于西瓜栽培种和野生种之间基因组结构的差异造成,根据每个标记的物理位置,本研究将这些标记(SNPs 和InDels)和偏分离的区域进行比较分析,44个SDRs中共包含有2 289 215 SNPs 和18 023 InDels。总体上看来,位于染色体02, 04, 06, 07和09上的SDRs中的SNPs的密度(SNPs/Mb)多于位于其他非SDRs区域中或整个染色体。相反,位于染色体01, 03, 05, 08,10和11上的SDRs中的SNPs的密度(SNPs/Mb)则低于位于其他非SDRs区域中或整个染色体。同样的趋势也表现在InDels上。

    结 论: 本研究中,笔者利用F2分离群体构建了西瓜遗传连锁图谱,根据遗传图谱的构建方法以及所用的大量的SNP标记,本高密度图谱具有很高的可信度。通过进一步对遗传图谱的分析,发现了存在有多个位于不同染色体上的偏分离区域,以及发现位于11号染色体上的一段区域,其遗传位置和物理位置不一致,本研究也对这些现象都作了具体描述和分析。本研究所构建的具有高密度和高可信度的遗传图谱将对西瓜基础和应用研究,以及对我们更进一步理解西瓜基因组结构将提供重要的帮助。