本文来自作者[admin]投稿,不代表东辰文化立场,如若转载,请注明出处:http://www.mzwhys.cn/zlan/202506-2605.html
我们使用网络科学(WOS)高级搜索功能对同行评审的出版物进行了文献搜索,以查找包含遗传多样性时间衡量时间的已发表作品 。我们的搜索有意地进行了广泛的范围 ,并遵循既定的首选报告项目,以进行系统评价和荟萃分析(PRISMA)协议,尽可能接近37,38。在线搜索是在2019年1月18日使用针对人群遗传测量值的关键字进行的 ,无论变化的方向如何(例如,“增加 ”和“减少”都作为搜索词包括在内)(补充信息2.1和补充数据4)。重复删除后总共检索了80,271个记录,78,727 。我们获得了70,069个记录的全文。其余的记录是通过其标题 ,摘要和关键词手动筛选的,其中8,596个被排除在我们的包容标准上;无法获得62个全文(扩展数据图2和补充信息2.1)。然后,我们在R v.3.5.239中执行了全文挖掘 ,使用包装PDFSearch V.0.2.340,Dplyr V.0.8.041和Stringi v.1.3.142删除不包含人群遗传关键的记录(补充信息2.2) 。这导致了34,346个预定的遗传多样性变化的研究,这些研究通过包装Revtools v.0.4.043(补充信息2.2)分类为主题群集。
我们对所有34,346件作品进行了初始筛选和数据提取,然后进行了一系列的重新萃取和数据验证步骤。手动筛查针对纳入标准的研究 ,遗传多样性测量和元数据的提取是由作者团队成员同时通过使用共同的书面准则的多个研讨会(扩展数据表1和2和补充信息2.3-2.6)进行的 。仅当他们满足以下所有标准时,研究才适用于我们的分析:
除了记录每个记录的书目数据外,我们还提取了可以使我们计算效果大小的数据(请参见下文和补充信息2.4) ,以及元回归的相应元数据(扩展数据表1和2和补充信息2.5和2.6)。我们的数据集包括许多研究,其中主要目标不是评估遗传多样性或遗传多样性本身的变化,而是报告了遗传多样性的时间测量 ,否则否则就符合我们的荟萃分析的纳入标准。
我们捕获了与三个可能的研究设计一致的遗传多样性统计(请参阅补充信息2.4):(1)变化的线性度量(例如,两个或更多时间点的回归),主要得出统计测量值 ,例如回归系数或T统计;(2)两个时间点比较(例如,两种均值的比较),主要得出的是平均多样性估计的对;或(3)通过使用单个样本在时间44,45中使用单个样本对过去有效的人口大小的概率建模获得的统计或遗传测量结果的合并分析。由于在我们的分析中唯一地鉴定了后者 ,这是因为在共同分析的理论框架基础上的重要差异 。也就是说,遗传多样性的“早期”度量不是从实际的生物样品中采取的,而是从遗传遗传的最新数据和原理中推断出来的。此外,作者可以根据环境或其他非遗传假设来确定合并分析中的早期时间点 ,或者根据数据中的实质性模式而在事后确定。
遗传多样性变化数据与相应的误差估计和样本量一起记录;所有这些都使用与论文报告的相同的精度提取 。我们还记录了研究的时间范围(近年来和近年来,用于计算研究持续时间和研究中点),以及所使用的遗传数据的数量和类型(例如 ,基因座数量,遗传标记类型,基因组)。我们将遗传多样性将数据分类为四种度量类型 ,与遗传组成的“必需生物多样性变量 ”一致28:(1)变体计数(例如,等位基因丰富度);(2)变异频率的均匀度(例如,预期的杂合性和核苷酸多样性);(3)人口级别变异的均值(例如 ,观察到的杂合性和谱系近交);(4)综合统计(例如,有效的人口规模;见下文)。
我们对遗传多样性变化与生态障碍或保护管理行动之间的关联特别感兴趣,因此收集了这些“影响元数据” ,其中在论文中报告了威胁和/或保护管理措施,因为在研究的抽样时间点之间有可能影响研究人群 。原则上,我们将生态障碍分为有可能损害焦点物种或其栖息地的条件的事件,以及保护管理行动为人类活动 ,旨在改善焦点物种或其栖息地的条件。对于后者,我们还考虑了保护管理措施的强度(即焦点物种可能经历的保护干预的大小)。我们还收集了更多的元数据,因为生态障碍的目标可能会因物种而异 。例如 ,对于害虫和病原体(例如,减少人口)通常是故意的,而受威胁物种的干扰可能包括人类活动的间接或无意后果(例如 ,栖息地丧失和碎片化)。我们用于这些变量中每个变量的类别的简要定义在扩展数据表中和补充信息2.5中提供了完整的定义。
收集的其他主持人(补充信息2.6):研究物种的分类学身份(通过文献审查标准化以与开放的生命树相一致),乡村和陆地和/或在采集样品的地方的陆地和/或海洋领域的术语 。36,47,48,以及在出版物中报道的多个人群的情况下 ,独特的现场标识符。我们还收集了研究物种的威胁状态。研究物种的生成长度(补充数据5);以及被视为病原体或害虫的驯养物种或种群的分类(基于来源出版物,相关数据库或其他已发表的来源的描述)。
许多研究报告了适合在我们的分析中包含的遗传多样性的多次测量 。考虑到数据子集的报告和分析的采样方案,我们提取了每个出版物的遗传多样性变化的独立度量(补充信息2.4)。在补充信息2.7-2.9中 ,描述了控制非独立数据,缺失数据,无限置信区间(估计有效人群规模),零差异和非常规研究设计的程序。初步提取后 ,所有纳入的研究均由作者团队的一个小验证组的另外两个成员重新处理,以确保在收集遗传和元数据的一致性(补充信息2.10)中 。
在原始搜索过程中,从WOS自动下载了每项纳入研究的完整书目细节(另请参见补充数据1-3)。Additional bibliographic metadata were also collected from the WOS, including journal title abbreviations, WOS subject categories for which each journal ranked highest, and the impact factor percentile ranking for each journal within its WOS category for 2020. Publication trends and the characteristics of studies included in our final dataset were summarized visually using the R packages ggplot2 v.3.4.349, treemapify v.2.5.550 and ggridgesV.0.5.451。我们还探索了共发生的模式 ,并表征了我们在完整数据集中报告的生态障碍和保护管理措施的变化,以及五个最丰富数据的分类学类别的数据子集 。我们在生态干扰类别和保护管理措施中计算了成对的Spearman的等级相关系数(R),并使用Corrplot V.0.9252在R中可视化R。我们还使用主组件分析研究了这些变量之间的关系 ,并使用包装exextra v.1.0.753可视化。
为了可视化数据集中物种的分类多样性及其进化关系,我们使用R Package Rotl v.3.0.1254使用上述寿命ID的开放树生成了系统发育树 。SacCharomyces CF。酿酒酵母(OTT ID 7511391)用作外部群。Six species could not be placed in the phylogeny due to unresolved taxonomy: the Japanese mud snail (Batillaria attramentaria), white seabream (Diplodus sargus), a fruit fly (Drosophila pseudoobscura), a sea snail (Euparthenia bulinea), fourfinger threadfin (Eleutheronema tetradactylum) and the bicolour damselfish(Stegastes Partitus) 。使用R包GGTREE v.3.8.255,GGTREEEXTRA v.1.10.056 ,GGIMAGE V.0.3.357和RPHYLOPIC V.1.2.158可视化系统发育。从系统中下载了每个分类类别的代表性生物的剪影(https://www.phylopic.org;有关信用的补充信息2.6参见补充信息2.6)。由于我们的研究中物种的分类多样性,因此无法在所有物种上获得过时的树,因此将树的拓扑结构用于建模。
对于满足我们的纳入标准的每个比较 ,我们计算了套期保值的G*(有时称为Hedges的D59,带有样本量校正J)是我们的效果大小的量度 。在我们的情况下,将树篱的G*选为效果大小量度,因为它基于两个值之间的标准化平均差异 ,在我们的情况下,“早期”和“最近 ”的时间点可最大程度地减少样本尺寸研究的效果尺寸估计的过度膨胀 <20, and outperforms other common effect size measures such as Cohen’s d and Glass’ Δ when the assumption of homogeneity of variance is violated60. All formulae used to evaluate Hedges’ g* and its error are reported in Supplementary Information 2.11.
Calculation of Hedges’ g* requires the sample size and error associated with the measure of genetic diversity change. Depending on the way in which genetic diversity metrics or their summary statistics are calculated, the associated sample size for effect size calculation may be for example, the number of loci, the number of samples, the number of populations or a rarefied sample size. For comparisons based on linear measures of genetic diversity change, which varied in the methods used to determine genetic change, each paper was manually checked to retrieve the appropriate sample size and error. For two timepoint comparisons and comparisons based on coalescent analyses, we followed a hierarchical procedure to establish the sample size to use for each effect size (Supplementary Information 2.11). Multiple error types were reported (for example, s.d. or confidence intervals), and so Hedges’ g* was calculated using published formulae for interconversion of these data types (Supplementary Information 2.11).
For comparisons where an effect size was calculated, the direction of the effect was determined. We ensured consistent directionality among the following measures of genetic diversity (note that many metrics were recorded in our dataset, and so the abbreviations reported below are summaries only):
For comparisons where genetic diversity metric type was recorded as ‘other’, each paper was manually checked to determine the correct direction of the effect given the context of the metric within the publication and the authors’ interpretation of genetic diversity change as a loss or gain. For negatively correlated metrics, we multiplied the Hedges’ g* effect size by −1 to reverse the direction of the effect—that is, across our dataset a positive Hedges’ g* represents an increase in genetic diversity and a negative Hedges’ g* represents a loss of genetic diversity.
All calculated effect sizes >| 4 |研究团队的一个成员将手动检查为潜在异常值,以确认缺乏数据输入错误。考虑到我们广泛的统计数据 ,还检查了这些数据是否可能计算错误,误解统计误差(例如,标准误差与S.D.)或其他差异。筛选极值的结果可以在补充信息1.4中找到 。
我们将多级贝叶斯层次模型拟合在R软件包MCMCGLMM v.2.3461中 ,纸ID作为随机效应,使所有模型都可以考虑到报告多个包含效果大小的研究所介绍的非独立性。通过将该物种的Z标准化世代数(即,在早期和最近的时间点之间经过的年数)作为所有元注册的固定效应 ,对遗传多样性的变化进行了建模。除非补充信息2.12中另有说明,否则所有元回归还包括Z标准研究中点(年)的固定效应 。
每种型号的迭代次数为6,000,000次,使用了弱信息的逆伽马之前 ,燃烧为200,000,间隔为5,000。我们报告了每个模型集的后均平均值和95%的HPD可靠间隔。HPD可信间隔为95%(零)的估计值在α= 0.05时被认为具有统计学意义 。在痕量图中对模型诊断进行了视觉检查;有效的尺寸> 1,000,并且使用CODA V.0.19.462检查了滞后点之间的自相关<0.1。通过通过海德伯格和韦尔奇在尾巴中的半宽和平稳性测试来确认链条收敛。此外,每个模型都独立运行三次 ,以使用潜在的缩放降低因子计算<1.1的Gelman-Rubin收敛诊断 。为三个模型中的每一个获得了偏差信息标准(DIC),并选择了最低DIC的模型进行解释。
我们的基本模型包括上述固定效果和随机效应(即固定效应= Z标准的中点,世代的数量;随机效应=纸张ID) ,尽管该模型的变化接受了灵敏度测试,以确定包括系统发育为额外的随机效应的影响,并在数据集中包括极端值(在补充信息2.11中描述)。计算了包括系统发育的基本模型和灵敏度测试模型的扩展异质性统计63。扩展异质性统计分区的总异质性(I2TOTAL)分为系统发育方差(在系统发育模型 ,I2Pholy发育中),研究ID方差(I2Study)和残留方差63,64(I2Residual) 。对于系统发育模型,我们还获得了LAMBDA(系统发育信号(H2)) ,作为系统发育的随机效应的方差,除以所有随机效应的总方差(系统发育,研究ID和残余方差)。总的异质性很高 ,但是系统发育信号仅解释了总体方差的5.48%,因此被排除在进一步的建模之外(另请参见补充信息1.5);这也允许简化模型结构。根据灵敏度测试的结果(补充信息1.5),我们从随后的荟萃分析建模中排除了系统发育和极值 。
我们使用两种方法评估了荟萃分析中的出版偏见。首先,我们调查了时间停滞的偏见 ,其中在发表的几年中可能会报告遗传多样性变化的不同模式。鉴于近几十年来测量遗传多样性的方法已经大大提高,因此可能发生这种偏见 。因此,我们将最终基本模型拟合了Z标准的出版年度固定效果。如果斜率估计值的95%HPD可靠间隔不包括零 ,则可以推断时间滞后偏差的证据。其次,我们在漏斗图中绘制了针对树篱的G*的G*精度,以可视化可能发生的出版物偏差 ,例如,如果没有发表较小的研究,则没有发表较小的研究 。我们没有观察到时间延迟偏置或漏斗图不对称性(补充信息1.5)。考虑到数据集中的高异质性和缺乏可检测的出版物偏见 ,我们进行了元回归建模。
进行了元回归,以评估不同主持人变量对遗传多样性变化的影响 。这些大致分为与以下方面相关的主持人:(1)如何测量遗传多样性变化(即研究设计);(2)衡量遗传多样性变化以及在哪种物种(即种群环境)中的地方;(3)生态障碍(即威胁);(4)保护干预措施(即保护管理)。在元回归中,系数估计每个类别与以截距为代表的指定参考组有何不同。由于所有主持人变量都是分类的 ,因此我们对每个主持人进行了单独的元回归,以避免相关性的混杂效应,并允许相对于截距的生物学上有意义的分类变量解释。对于所有模型,只有在有10个或更多效应大小为类别的效应大小为65时 ,主持人变量才包括在内 。所有模型均以弱信息的逆伽马为先验,纸质ID随机效应和标准化年中点以及研究(作为研究长度的量度)作为固定效应(除非另有指定)以及补充信息2.12中描述的其他固定效应。
由于仅从先前的研究中收集数据,因此不需要道德批准或指导。
有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得 。
赞 (1)
评论列表(4条)
我是东辰文化的签约作者“admin”!
希望本篇文章《全球荟萃分析表明,需要采取行动来阻止遗传多样性丧失》能对你有所帮助!
本站[东辰文化]内容主要涵盖:生活百科,小常识,生活小窍门,知识分享
本文概览: 我们使用网络科学(WOS)高级搜索功能对同行评审的出版物进行了文献搜索,以查找包含遗传多样性时间衡量时间的已发表作品。我们的搜索有意地进行了广泛的范围,并遵循既定的首选报告...