本文来自作者[admin]投稿,不代表东辰文化立场,如若转载,请注明出处:http://www.mzwhys.cn/jyan/202506-3152.html
单个雄性H.的基因组DNA用于构建11个库,包括短插入(170 bp ,500 bp,800 bp)和伴侣对(2 kb,5 kb ,5 kb,10 kb,20 kb ,20 kb)库,并在Illumina Hiseq 2000测序平台上进行了测序 。总体而言,我们获得了大约218 GB的原始序列数据(补充表1.1)。使用默认参数使用Soapdenovo2.04(参考文献42)组装基因组。没有使用统计方法来预先确定样本量 。实验不是随机的。在实验和结果评估中,研究人员并未对分配视而不见。
总共构建了19个RNA-Seq库 ,其中包括来自男性和雌性H的组合软组织(大脑,g,肠 ,肠道,肝脏和肌肉)的两个文库 。以及使用衬里海马(Hampocampus hippocampus ectus)的RNA(补充信息,第2节)的RNA(补充信息 ,第2节)。所有图书馆均根据制造商的说明(Illumina,San Diego,CA ,CA,美国)使用Illumina Truseq RNA样品制备套件制备,并使用Illumina Hiseq 2000平台进行了测序。RNA-seq读取是使用Trinity43从头组装的 ,或映射到H。使用带有默认参数的TopHat44来基因组,然后使用内部Perl脚本进行分析 。基因在育雏袋发育不同阶段的基因的差异表达使用以前开发的方法45确定。使用QRT – PCR验证了RNA-seq结果,每个阶段都有五个生物学重复。所有数据均表示为平均值±平均值±标准误差,并通过单向方差分析进行评估 ,然后进行Tukey的诚实显着差异测试,以通过多个比较来调整P值 。对于p值<0.05,结果被认为具有统计学意义。
H. COME基因组的注释是使用Ensembl基因注释管道进行的 ,该管道整合了从头算基因预测和基于证据的基因模型。简而言之,从Ensembl(版本75)下载了D. Rerio,G 。Aculeatus ,O。Latipes,T。Rubripes和T. nigroviridis的蛋白质序列,并使用带有参数的TBLASTN46映射到基因组中 。其次 ,使用太阳能(内部软件,0.9.6)加入了来自BLAST的高分段对(HSP)。第三,使用GeneWise47对齐串联段以完善基因模型。最后 ,我们滤除了基于Genewise评分的全长副本和过滤冗余对准的比对率的比对 。此外,使用H.出现成绩单(emair_transcript和male_transcript)和H. h. rectus转录本(JUV_BRAIN,JUV_BODY,RUD_TESTIS和PROP_POUCH)来协助基因模型预测。我们使用Swiss-Prot ,Trembl,NCBI NR数据库和KEGG数据库注释了预测的基因模型(补充表3.4)。
我们使用了CAFE(2.1版),该程序用于分析最大似然框架下的基因家族扩张和收缩。基因家族是由Treefam管道和物种之间估计的差异时间作为输入而产生的 。我们使用参数“ -p 0.01 ,-r 10000,-s”来搜索基因的出生和死亡参数(λ),计算了使用10,000个蒙特卡洛随机抽样观察到的每个基因家族的概率 ,并报告了基因家族中概率小于0.01的基因家族的出生和死亡参数。对于H.的基因家族扩张和收缩分析。包含具有多个功能注释的序列的家族也被删除(补充表4.1和4.2) 。
我们从基因家族分析(补充信息,第4.1节)中获得了4,122个直系同源基因。使用Muscle48与默认参数对齐一对一直系同源基因的蛋白质序列。然后,我们使用Trimal(参考文献49)用参数“ -gt 0.8 –ST 0.001 –CONS 60 ”过滤了饱和位点和不良区域 。在串联比对中修剪饱和位点和不良区域后 ,使用了2,128,000个氨基酸进行系统基础分析。修剪的蛋白质比对用作对齐相应的编码序列(CDSS)的指南。使用内部Perl脚本将CDS中的对齐蛋白和四倍变性位点分别串联为超基因 。
使用串联蛋白序列的RAXML版本8.1.19(参考文献50)重建系统基因树。具体而言,我们使用Protgammaauto参数选择了最佳氨基酸取代模型,指定斑点GAR为外组 ,并使用100个引导程序评估了结果的鲁棒性。为了比较不同物种的中性突变速率,我们还基于四倍的退化位点产生了系统发育 。系统基因拓扑用作输入,RAXML中的“ -f e”选项用于使用ModelEgenerator版本0.85(参考51)建议,使用四倍退化(GTR)模型下的四倍退化(GTR)模型下的四倍退化位点(GTR)模型来优化输入树的分支长度。我们使用r-package ape52中的phylo模块 ,根据中性树的优化分支长度计算了对外组(斑点GAR)的成对距离。在McMctree Program53中实现的贝叶斯松弛分子时钟(BRMC)方法用于估计不同物种之间的差异时间。一对一源基因和系统基因拓扑的串联CD用作输入 。基于化石记录的两个校准时间点O. latipes – t。Nigroviridis(〜96.9-15090万年前(Mya))和D. Rerio – G。Aculeatus(〜149.85–165.2 Mya)(http://www.fossilrecord.net/dateaclade/index.html)在McMctree估计中用作约束 。具体而言,我们在计算中使用了相关的分子时钟和REV替代模型。MCMC流程运行了5,000,000步,每5,000步进行一次采样。McMctree建议H.与Stickleback ,Nile nile Plapia,Platyfish,Fugu和Medaka的共同祖先不同 ,约有103.8 Mya,与白垩纪相对应 。
我们从NCBI下载了1,417个或基因家族成员的蛋白质序列,并将其映射到H。使用带有“ E-Value≤1e-10”和“对齐速率≥0.5 ”的TBLASTN的基因组。太阳能(内部软件 ,0.9.6版)用于在每对蛋白质映射结果之间连接高分段对(HSP) 。我们保留了一比对,对齐速率超过70%,映射身份超过40%。随后 ,将蛋白质序列映射到基因组上,并在上游和下游扩展280 bp,以定义整合的基因模型。为了进行系统发育分析,使用肌肉对齐蛋白质序列 ,并使用PHYML将JTT+Gamma模型对齐用于最大样本分析,以构建系统发育树 。
使用Vista的H. Come,Stickleback ,Fugu和斑马鱼的TBX2B-TBX4-BRIP1区域的同步分析表明,H。tbx4丢失了。(图3)。为了排除H. Come基因组序列中TBX4缺乏的情况是由于组装误差造成的,我们首先验证了H. H. TBX2B-TBX4-BRIP1区域的微同步区域 。简而言之 ,设计了28个引物对(补充表9.1),用于重叠放大器,从TBX2B的末端“步行”到BRIP1的开始。这些产品的扩增子大小和部分末端测序并未表明H组装中的任何异常。
此外 ,我们进行了以下分析:(1)使用来自斑马鱼和尼罗尼非非非鱼的TBX4蛋白搜索了H. COME基因组(TBLASTN),并且无法找到TBX4基因;(2)仅使用TBX4蛋白的域序列搜索H.基因组,但无法找到TBX4基因;(3)使用斑马鱼和尼罗尼非非非鱼的TBX4蛋白进行TBX4(TBLASTN)的H. come和H. h. h. h. h. h. h. come come come come and come come and tbx4(tblastn) ,但无法找到任何匹配的转录本;(4)搜索H. Come和H. h. h. h. h. hictus转录组数据也具有域序列,并且没有找到tbx4基因的残余;(5)H 。的“幽灵” TBX4基因座中预测CNE。使用Fugu TBX4 locus作为参考(基础)(补充图9.3)。我们使用了其他鱼类基因组基因座中存在的CNE(在H. Come中不存在)来搜索H.来源基因组来排除它们可能存在于基因组中其他地方的可能性 。我们在H中找不到这些CNE中的任何一个。最后,我们进行了退化的PCR实验,以确定H中是否缺少TBX4基因。使用四个前向和两个反向引物(补充表9.1) ,我们检查了在七种海马物种中是否存在TBX4(包括H. comes和H. rectus),五种pipefish(四种来自Syngnathus属,一种来自Corythoichthys属的种类 ,来自Corythoichthys)(全部来自Syngnathidae Fins syngnathidae fins pelvic pelvic fins);Ghost Pipefish(solenostomus)和小号鱼(Aulostomidae)与Syngnathidae密切相关,但具有骨盆鳍 。还有其他具有骨盆鳍的硬骨鱼类(补充图9.1和9.2)。
我们使用CRISPR -CAS9策略来生成TBX4突变斑马鱼线。设计了两个引导RNA(GRNA),靶向斑马鱼TBX4在序列的5'端 ,该序列的上游或DNA结合Tbox域内的上游或内部(补充图9.4) 。如先前所述54(补充表9.2中给出的寡核苷酸序列),使用合成的寡核苷酸克隆到PT7GRNA载体中。使用Megascript T7转录试剂盒(Thermo Fischer Scientific AM1334)抄录,使用Mirvana miRNA隔离套件(Thermo Fischer Scientific AM1560)纯化了使用Megascript T7转录试剂盒(Thermo Fischer Scientific AM1334)抄录的BAMH1-HF(NEB R3136T)后 ,从该载体(NEB R3136T)线性化后从该载体合成GRNA。使用MMACHINE SP6转录试剂盒(Thermo Fischer Scientific AM1340)从CS2+Cas9载体合成Cas9 mRNA,并使用RNAeasy Mini Kit(Qiagen 74104)的RNA清理方案纯化。
在野生捕获菌株的斑马鱼中被注射,在一个左右的grna和〜90 ng cas9 RNA的单阶段 。将这些F0鱼饲养至成熟 ,并使用跨靶位点的FIN剪辑,DNA分离和PCR进行基因分型(补充表9.2中给出的基因分型引物)。使用T7核酸内切酶(NEB M0302L)分析了PCR产物的突变54。将镶嵌突变体F0鱼量入到AB野生型鱼中,并使用PCR和T7核酸内切酶进行批处理基因分型以传播突变 。将突变的PCR产物克隆到PGEM-T载体(Promega,Madison ,WI)中,并测序以鉴定载体鱼传输移码突变。这些载体鱼再次被越过AB野生型,并将所得的F1鱼饲养至成熟。使用FIN剪辑 ,DNA分离,PCR,T7核酸内切酶进行基因分型 ,以鉴定杂合突变鱼,然后通过克隆和测序突变PCR产物进行测序,以证明存在Fameshift等位基因的存在 。CRISPR – CAS9突变策略在扩展数据中示意性地显示了图5。
在F0突变体TBX4鱼中 ,我们观察到低频下的骨盆鳍损失。GRNA#1给出了3/42 FISH,具有双侧或单面骨盆鳍损失,而1/34的GRNA#2具有单侧骨盆鳍损失(扩展数据图5) 。我们观察到GRNA#1和GRNA#2的突变等位基因传播 ,但未能识别导致GRNA#2的移码突变的缺失,因此该CRISPR没有生成稳定的线。对于GRNA#1,我们确定了几个移码突变体,其中一个进一步分析。该突变体具有缺失/替代突变 ,其中八个核苷酸被三个核苷酸代替,导致有效的5 bp缺失并引入了移码突变(扩展数据图5) 。该突变引入了下游终止密码子,导致缺乏DNA结合结构域的严重截断的蛋白质(补充图9.4和9.5)。突变线保持在AB野生型背景上。
使用斑马鱼作为参考基因组 ,产生了六种硬骨鱼的全基因组比对。斑马鱼(ZV9,2010年4月)的软膜基因组序列是从Ensembl Release-75 FTP网站下载的 。从UCSC基因组浏览器:Stickleback(2006年2月,FR3 ,2011年10月,2011年10月),Medaka(2005年10月2日 ,2005年10月2日),Nile Tilapia(Orenil2,2012年2月2日) ,从UCSC基因组浏览器:Stickleback(Gasacu1,2006年2月)下载了以下软掩盖的基因组序列。使用WindowMasker(来自NCBI BLAST+软件包v.2.2.28)重复屏蔽H. CAME基因组序列(HIPCOM0),并带有附加参数“ -dust true ”。使用此方法将大约32%(158.1/501.6 Mb)掩盖了基因组 。
仅排除斑马鱼的染色体序列,而排除了脚手架。参考(斑马鱼)基因组分为21 MB序列 ,其重叠为10-kb,而percomorph鱼类基因组(H. Come,Stickleback ,Fugu,Medaka,Medaka和Nile Tilapia)分为10 MB序列 ,没有重叠。使用Lastz V.1.03.54(参考55)进行成对对齐,并具有以下参数:–Strand =两种种子= 12of19 – Notransition – Notantion – gappation -gap = 400,30 – hspthresh = 3000 – gappedThresh = 3000 – Inner = 2000 -inner = 2000 – amasking = 50 – ydrop = 9400 – ydrop = 9400 – scores = hoxd55.q – format = axt = axt = axt 。使用内部PERL脚本将分裂序列的坐标恢复为基因组坐标。使用UCSC基因组浏览器工具“ AXTCHAIN”和“ CHAINNET”,将比对减少为参考基因组的单个覆盖范围。使用Multiz.v11.2/hover.v3(Ref 。56)产生多个比对 ,并带有树拓扑“(ZV9(hipcom0((fr3 gasacu1)(oryylat2 orenil2))))”。
从多个比对中提取了斑马鱼基因的四倍(4D)位点(Ensembl Release-75)。这些4D位点用于使用Rphast v.1.5 Package57(一般可逆的“ Rev ”替代模型)中的Thylofit构建中性模型 。然后,在每个斑马鱼染色体比对上以Rho估计模式运行Phastcons,以获得每个染色体的保守模型。这些保守的模型使用Phyloboot平均为一个模型。随后 ,使用具有以下输入和参数的PHASTCON在多个比对中预测了保守的元素:中性和保守的模型,输入对准的目标覆盖= 0.3 = 0.3和保守序列的平均长度= 45 bp。为了评估这种方法在识别功能元件中的敏感性,将Phastcons元素与斑马鱼蛋白编码基因进行了比较 。80%的蛋白质编码外显子(197,508/245,556外显子)被保守元件(最小覆盖率10%)重叠,表明该识别方法相当敏感。
如果CNE在percomorph基因组中显示出一个CNE ,如果它显示出至少30%的斑马鱼CNE,则在多斑马cne中显示出覆盖范围。为了识别由于基因组的重排或由于Teleost Fish重复基因分配CNE而导致的多量对齐中可能错过的CNE,我们使用BlastN搜索了斑马鱼CNES ,使用BlastN的基因组(E <1×10-10; <1×10-10;≥80%的身份;≥30%覆盖) 。那些在Percomorph基因组中没有显着匹配的CNE被认为是该基因组中缺少的。为了说明可能因测序差距而丢失的CNE,我们确定了斑马鱼和Percomorph基因组中无差距的同步间隔,并产生了一组从这些间隔中缺少的CNE。这些CNE代表了Percomorph鱼类中缺失的一组CNES ,因此被用于进一步分析 。使用Great Software58进行了与CNE相关的基因的功能富集,每个CNE分配给具有最近转录起始位点的基因,在斑马鱼基因组中的1 MB之内 ,并根据基因组区域的A超测试(False Discovery速率(FDR)Q值<0.05)识别出明显富集的功能类别。我们确定了与CNE相关的基因的统计学意义基因本体论生物学过程项,分子功能项和斑马鱼表型描述。
我们还使用全球对齐计划姆拉根(Mlagan)预测了H. Come和其他代表性的硬骨鱼类中的CNE 。使用Mlagan与斑马鱼对齐直系同源的HOX簇作为参考序列,并使用VISTA预测CNE。
在H中丢失的七个代表性斑马鱼CNE(在丢失的CNE中最大)被用GFP作为记者基因而在转基因斑马鱼中提高活性。使用斑马鱼基因组DNA作为模板通过PCR扩增CNE 。将产物克隆到与小鼠CFO(MCFOS)基底启动子和GFP的编码序列相关的Minitol2转座子供体质粒中。转座酶mRNA是通过使用MMESSAGE MMACHINE T7试剂盒(Ambion; Life Technologies)在体外转录cDNA来产生的。将含有CNE的MCFOS-MINITOL2构建体和转座酶mRNA共同注入斑马鱼胚胎的蛋黄 ,这是一个至两个细胞的阶段。每个CNE构建体被注入250-350个胚胎,并在两天内重复注射 。在28°C下饲养胚胎,并在24、48和72小时(HPF)观察到GFP。注射后胚胎的存活率为70-80%。在至少20%的F0胚胎中,一致的GFP表达被认为是由CNE驱动的特定表达 。将这种胚胎饲养至成熟度 ,并与野生型斑马鱼交配以产生F1线。在拟合具有落膜的化合物显微镜下观察到GFP在F1胚胎中的表达(Axio Imager M2; Carl Zeiss,Germany),并使用连接的数字显微镜摄像头(AxioCam; Carl Zeiss ,德国)拍摄。通过将斑马鱼胚胎保持在0.003%N-苯基硫脲(Sigma-Aldrich,瑞典)中,可以抑制色素沉着 。在至少三条F1鱼类中观察到的一致的GFP表达被认为是由CNE驱动的特定表达。
所有动物均严格按照美国国立卫生研究院(美国)指南进行护理。斑马鱼基因敲除方案得到了Sun Yat-Sen University的机构动物护理和使用委员会的批准 。斑马鱼转基因测定方案得到了新加坡一A*星的生物资源中心的机构动物护理和使用委员会的批准。
老虎尾海马(H。H. h. h. to and H.的RNA-seq读取分别沉积在登录号下的NCBI序列读取存档中 ,分别为SRA392578和SRA392580 。
赞 (1)
评论列表(4条)
我是东辰文化的签约作者“admin”!
希望本篇文章《海马基因组及其专业形态的发展》能对你有所帮助!
本站[东辰文化]内容主要涵盖:生活百科,小常识,生活小窍门,知识分享
本文概览: 单个雄性H.的基因组DNA用于构建11个库,包括短插入(170 bp,500 bp,800 bp)和伴侣对(2 kb,5 kb,5 kb,10 kb,20 kb,20 kb...