【代谢组学】代谢组学与其他组学数据的整合

网上有关“【代谢组学】代谢组学与其他组学数据的整合”话题很是火热,小编也是针对【代谢组学】代谢组学与其他组学数据的整合寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题 ,希望能够帮助到您。

主要内容:

1.多组学数据整合概述

2.主要分析软件汇总

3.数据预处理的方法

1.多组学数据整合概述

1.1?多组学数据整合的现实意义

在研究疾病和其他性状或扰动的分子机制时,在一个以上的组学平台上进行分子分析是一种常见的做法。?

意义:多组分平台数据的整合分析为生物系统提供了更全面的分子特征,有可能改进疾病分子机制的发现以及诊断和预后预测模型 。?

目的:整合分析主要是为了更好地确定不同类型的生物分子是如何关联的(例如 ,代谢数量性状位点(mQTL)分析),为了确定与表型或疾病结局显著相关的分子途径,或者提高预测性能 ,例如,在生物标记物发现和诊断或预后应用的情况。?

如果数据集不是从同一个人那里收集的,那么跨组学数据集的整合分析的范围也是有限的。

2.?分析使用的原材料

2.1?可以参与分析的“材料 ”

1.软件:所有可以进行统计分析和数据可视化的软件都可以使用(例如 ,R) 。?

2.计算资源:原则上,所有分析都可以在功能相当强大的台式计算机上进行,尽管建议在某些分析中使用更强大的计算资源 ,例如计算服务器。?

3.研究设计:主要考虑匹配样本研究设计 ,在多元分子表型(-omics)平台上分析来自相同个体的生物样本。例如,在匹配样本设计中,单个血液样本可以分成两份 ,其中一份在代谢平台上分析,另一份在转录平台上分析 。然而,匹配样本设计可以基于同一生物样本小份体液 ,但也可以不一定要基于,例如在同一时间点从同一个人采集的血液样本和另一组织活检样本,即匹配。

4.预处理。分析中使用的数据集需要适用于特定分子分析平台的标准方法先行进行预处理 ,包括质量控制和排除潜在异常值和/或非典型观测 。

3. 数据分析的方法

3.1?mQTL分析:代谢特性的遗传驱动因素

描述遗传变异(通常以单核苷酸多态性(SNPs)的形式)与代谢产物丰度之间的统计关联,为理解代谢的遗传驱动因素提供了手段。mQTL分析需要来自相同个体的代谢谱数据和基因分型数据(SNP阵列或DNA测序数据)。基于群体的mQTL研究采用类似于全基因组关联研究的统计方法,不同之处在于表型响应变量是代谢丰度 。mQTL分析通常是通过全基因组的单变量关联分析进行的 ,通常假设一个附加的遗传模型,其遗传效应主要由等位基因的数量编码 。对于每个代谢物或代谢特征,进行全基因组扫描 ,以测试与遗传变异的关联。mQTL分析的结果是关于影响代谢丰度的候选基因驱动因素的信息。

3.1.1?mQTL分析过程

1.预处理和质控SNP分析数据 ,去除具有低质量位点和具有次等等位基因频(MAF)的变体;

2.预处理和质控代谢组数据(取决于平台和样本类型);?

3.对于每一对代谢物—遗传变异位点:?

a)拟合一个统计模型来检验代谢物-遗传变异的关联 。通常使用线性模型,以代谢特征为响应变量,以遗传变异和相关协变量(如性别、年龄、批次)为预测变量;?

b)对与遗传效应有关的模型参数进行统计零假设检验(如Wald检验或似然比检验) ,以确定p值

c)保存与每个遗传变异-代谢物对儿的遗传效应相关的p值(和相关参数估计)。

4.调整保存的p值向量以进行多次测试,例如基于错误发现率(FDR)的方法。?

5.使用FDR调整的p值和可接受的FDR水平(通常<0.05)确定哪些mQTL模型具有统计显著性 。

6.对于重要的mQTL模型,对模型执行额外的质量控制(高杠杆点 ,检查残差分布),以确保没有异常值或其他非典型观测影响结果。?

7.以表的形式展示结果,表中列出了重要的SNP-代谢物对儿 ,并展示了排名最高的重要模型。典型图表类型包括曼哈顿图,对于每个重要的代谢物-SNP对儿,绘制代谢物丰度与主要等位基因数(通常编码为0 、1或2)的比较 。?

8.重要mQTL变异的功能解释可以通过确定变异体是否位于基因的编码区来进行 ,这将表明该基因与相关代谢物之间的功能关系。如果变异体不位于基因的编码区,则可以基于与mQTL变异的基因组距离来确定候选功能基因,在mQTL变异体附近定位的基因将被视为主要功能候选基因。

3.2?基于代谢途径的整合分析

代谢途径分析提供了一种方法来确定特定的分子路径或生物过程是否与特定的生物扰动相关 ,如疾病状态 。?

代谢途径分析提供了一个将更广泛的生物学功能分配给分子层面的机会 ,并且可以帮助对研究结果进行生物学解释。?

进行代谢途径分析的两个最常见的框架是基于过度代表(OR)(或)或基于秩的假设检验。?

这里我们采用基于秩的检验方法,其中基因集富集分析(GSEA)是在转录组数据背景下进行代谢路径分析的一个常见例子,它也可以应用于代谢组数据 。使用GSEA或OR分析的途径分析也可以通过结合代谢组学和转录组学数据来进行 ,好处是从这两种数据类型中收集信息以确定代谢途径富集程度 。?

代谢途径分析的结果是基于代谢组学和转录组学数据中的证据,给出关于哪些分子途径与所研究的表型相关的信息。

3.2.1?代谢途径分析过程

1.使用平台特定的方法对转录组和代谢组数据进行预处理和质控。?

2.将代谢物标识符分配给轮廓代谢物,然后可以将其映射到生物途径 。我们假设转录组数据已经有了带有变量标准标识符的注释信息(例如 ,Ensembl、Entrez或基因ID),它们也可以映射到路径。?

3.对每个带注释的代谢物和每个转录组变量进行单变量关联分析,以确定它们与感兴趣的表型或结果的关联 ,例如病例-对照状态。在基于秩的(GSEA)分析中,秩是由每个变量的估计效应大小(例如,固定效应模型中的系数)决定 。在OR分析中 ,重要的代谢物和/或基因集合由每个变量的统计零假设检验确定。

4.分别使用转录组和代谢组数据进行途径富集分析,例如GSEA,并存储与每个路径相关的p值。?

5.结合来自转录组和代谢组数据代谢途径丰度证据 ,确定两个数据集的组合路径显著性 。可以使用基于排列的测试来确定显著性。?

6.以表的形式显示结果 ,表中列出了与p值和FDR调整p值相关的重要途径。

3.3 结合代谢组学和其他组学数据进行预测建模

预测建模,例如分类或回归,是生物医学研究中的一个共同目标 ,可以针对疾病诊断、亚型或预后等的预测 。?

有时,这种模型的预测性能可以通过包含一种以上的分子表型(-omics)数据来提高。

如果额外的数据(即额外的分子表型)有助于提供补充与预测感兴趣的结果相关的信息,则预期会出现改进的预测性能。如果预测性能没有得到改善 ,这意味着添加的数据要么根本不是预测性的,要么只是在第一个数据集中捕获的内容上提供冗余信息 。?

这项分析的结果是哪个分子表型平台提供了最好的预测信息,如果差异在统计学上是显著的 ,并且如果两种分子层面数据的联合(组合)建模提供了一个改进的预测模型 。

3.3.1 预测模型过程

1.预处理和质控代谢组学数据和从同一个体收集的额外分子数据,例如转录组数据。

2.选择适合高维数据的多元预测模型(如PLS 、OPLS-DA或lasso)。在后续步骤中使用此模型 。?

3.应用(嵌套)交叉验证优化模型参数并评估预测性能,或使用外部测试集评估预测性能。在分类的情况下 ,受试者工作特征曲线(ROC)和ROC曲线下面积(AUC)通常用于确定分类性能。分别基于各分子表型平台的数据评价模型的预测性能 。?

4.基于来自两个分子分析平台的数据优化和评估模型的预测性能(参见步骤3),在这两个平台上,数据通过变量的直接连接进行组合。

5.比较单个数据集和组合数据集之间ROC曲线和ROC-AUC的差异。如果需要 ,统计零假设检验可用于确定ROC-AUC估计值是否存在显著差异 。?

6.可用于未来数据预测的最终预测模型使用优化模型参数(步骤3和4)使用数据集中的所有观测值进行拟合 ,而不是基于交叉验证训练集拟合的模型。?

7.以表格的形式呈现结果,表中分别包含每个数据和组合模型的交叉验证(或外部测试集)的AUC估计值。另外还包括相应ROC曲线的可视化和与AUC值比较相关的假设检验p值 。

关于“【代谢组学】代谢组学与其他组学数据的整合”这个话题的介绍,今天小编就给大家分享完了 ,如果对你有所帮助请保持对本站的关注!

本文来自作者[一条小晨萱]投稿,不代表天七号立场,如若转载,请注明出处:https://3g.net7.cc/tianqi/688.html

(17)

文章推荐

  • 3v电磁继电器有哪几种?

    网上有关“3v电磁继电器有哪几种?”话题很是火热,小编也是针对3v电磁继电器有哪几种?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。说到电磁继电器大家都应该熟悉吧,电磁继电器在平时使用的范围比较广一点,大多数一些小电器里面都会安装有电磁继电器,其实电磁继电器

    2026年03月05日
    15323
  • 有钱花突然涨了3万额度

    网上有关“有钱花突然涨了3万额度”话题很是火热,小编也是针对有钱花突然涨了3万额度寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。有钱花是度小满旗下的一项信贷服务,用户可申请提取借款额度,来帮助解决“燃眉之急”,但为什么会存在有钱花额度从4万变成1500的情况

    2026年03月07日
    18308
  • 失去双鱼女的后果

    网上有关“失去双鱼女的后果”话题很是火热,小编也是针对失去双鱼女的后果寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。失去双鱼女的后果 失去双鱼女的后果,利用星座来了解你身边的ta不失为一种好办法,星座的文化内涵是西式的

    2026年03月07日
    15322
  • 桑塔纳昕锐哪个省油

    网上有关“桑塔纳昕锐哪个省油”话题很是火热,小编也是针对桑塔纳昕锐哪个省油寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。汽车走进生活,选最适合自己的车。大家都知道,这几年我们自主品牌汽车进步很快,设计和造车工艺都有了质的提升,相比合资汽车会更有性价比,不过有

    2026年03月09日
    15305
  • 陕西有哪些城市

    网上有关“陕西有哪些城市”话题很是火热,小编也是针对陕西有哪些城市寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。陕西省辖10个地级市、30个市辖区、5个县级市、72个县。地级市:西安、宝鸡、咸阳、铜川、渭南、延安、榆林、汉中、安康、商洛。著名城市主要包括:1

    2026年03月09日
    18307
  • 雷士照明控股有限公司的雷士工业园

    网上有关“雷士照明控股有限公司的雷士工业园”话题很是火热,小编也是针对雷士照明控股有限公司的雷士工业园寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。2006年2月8日,惠州雷士光电科技有限公司进驻新工业园,至此斥资近亿兴建的雷士工业园一期工程正式投入使用。已

    2026年03月10日
    20302
  • 抖音上火箭最贵的多少钱一个?

    网上有关“抖音上火箭最贵的多少钱一个?”话题很是火热,小编也是针对抖音上火箭最贵的多少钱一个?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。直升机2999抖币,428元。抖音上是没有火箭的,在抖音上最直接的是宇宙之心。抖音礼物最贵第一名:宇宙之心18888

    2026年03月12日
    13312
  • 韩国人现在是如何看待朝鲜的?

    网上有关“韩国人现在是如何看待朝鲜的?”话题很是火热,小编也是针对韩国人现在是如何看待朝鲜的?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。我们中国是一个历史悠久地大物博的国家,56个民族在同一片土地上共同生活,风俗文化相互交流。其中,在我们国家,有这么一个

    2026年03月12日
    17314
  • 昆虫记重点阅读部分及原因

    网上有关“昆虫记重点阅读部分及原因”话题很是火热,小编也是针对昆虫记重点阅读部分及原因寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。《昆虫记》需要重点阅读的部分有昆虫的繁殖与生长、昆虫的社会行为、昆虫与人类的关系,原因如下:1、昆虫的繁殖与生长:这部分内容描

    2026年03月12日
    14318
  • 自主创新人才培养模式宣传语(精选35句)

    网上有关“自主创新人才培养模式宣传语(精选35句)”话题很是火热,小编也是针对自主创新人才培养模式宣传语(精选35句)寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。1、人人崇尚成功,事事成于创新。2、创新驱动未来,纳福传动世界。3、坚持科学发展,突出自主

    2026年03月13日
    13319
  • 成语中的名人故事

    网上有关“成语中的名人故事”话题很是火热,小编也是针对成语中的名人故事寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。1.三顾茅庐汉末,黄巾事起,天下大乱,曹操坐据朝廷,孙权拥兵东吴,汉宗室豫州牧刘备听徐庶(三国时著名谋土)和司马徽(三国时著名谋士)说诸葛亮

    2026年03月15日
    12311
  • 有哪些比较好的儿童百科全书?

    网上有关“有哪些比较好的儿童百科全书?”话题很是火热,小编也是针对有哪些比较好的儿童百科全书?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。1、《一读就懂的图画小百科》(全30册)适合年龄:5-8岁。作者:菲利浦·西蒙等著,科莱特·于斯·大卫等绘。推

    2026年03月16日
    13304

发表回复

本站作者才能评论

评论列表(3条)

  • 一条小晨萱的头像
    一条小晨萱 2026年03月07日

    我是天七号的签约作者“一条小晨萱”

  • 一条小晨萱
    一条小晨萱 2026年03月07日

    本文概览:网上有关“【代谢组学】代谢组学与其他组学数据的整合”话题很是火热,小编也是针对【代谢组学】代谢组学与其他组学数据的整合寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在...

  • 一条小晨萱
    用户030710 2026年03月07日

    文章不错《【代谢组学】代谢组学与其他组学数据的整合》内容很有帮助