香港六宝典免费
请输入网站标题
电话:13816913927

清空记录

历史记录

清空记录

历史记录

取消

清空记录

历史记录

香港六宝典免费
    当前位置:
  • 首页>
  • 产品中心>
  • 转录组测序>
  • 真核有参转录组测序>
  • 真核有参转录组测序
产品中心
Products
产品分类 Product Categories

真核有参转录组测序

分享到微信

×
真核有参转录组测序(RNA-seq)是针对有参考基因组的物种,通过二代测序平台,快速全方面获得动植物特定细胞或组织的转录本及基因表达信息,可进行基因表达水平、基因功能、可变剪切、SNP以及新转录本发现等方面的研究。
产品详情

  RNA测序(RNA-seq)自诞生起就应用于分子生物学,帮助理解各个层面的基因功能。RNA-seq中most commonly used分析方法就是找出差异基因表达(Differential gene expression, DGE),进而根据差异基因探索生物学意义或研究靶点。DGE分析的从未发生实质性的改变,其标准流程分为三步:

  提取RNA,富集mRNA或消除rRNA,逆转录成cDNA和构建测序文库。

  然后在高通量平台(通常是Illumina)上进行测序,每个样本测序reads深度为20-40 Million reads。

  比对/拼装测序reads到转录本上,对比对上的reads定量,样本标准化,样本组间基因/转录本统计差异分析。

  RNA-seq的应用和进步是由技术发展驱动的,相对于以前的基因芯片,RNA-seq这种方法产生更丰富并且偏见更小的信息。到目前为止,从标准的RNA-seq方法衍生而来的各种RNA-seq方法几乎有100种。Illumina的短读长(short-read)测序平台能对这些由大部分不同方法的RNA-seq构建的文库进行测序,但是most近长读长(longread)RNA-seq的进步已经能够解决以前研究人员使用短序列手段无法解决的一些问题,比如更准确的基因结构研究。

  由于Illumina的短序列读长测序技术生成了SRA(Short Read Archive)中95%已表达的数据,而且cDNA的短序列读长测序方法是一种常规的方法,故先来讨论这种测序方式主要流程与局限。

  1. Illumina技术原理

  Illumina测序技术基于桥式扩增和同步测序原理。首先,cDNA被酶切成小片段,接着每个DNA片段都会被复制形成一个桥,桥上的DNA被定向固定,然后通过引入荧光标记的核苷酸依次进行链延伸,每次加入一个核苷酸都会释放荧光信号,通过检测不同荧光信号的强度来确定具体的碱基序列。 视频链接:Illumina测序技术原理 注意:测序在建库之后

  2. Illumina优势与局限

  优势:

高通量:Illumina平台可以在单次测序中产生数十亿个读长短的测序数据,大程度提高了测序效率。 

高精度:Illumina采用的测序化学和光学检测技术,可以实现较高的碱基测序准确率,通常碱基错误率低于1%。 

成本低廉:随着技术的进步,Illumina测序的成本已大幅下降,使得大规模测序项目更加经济可行。 

广泛应用:Illumina平台广泛应用于基因组测序、转录组测序、表观遗传学等多个领域。

  局限:

读长较短:Illumina测序的读长一般在50-300bp之间,相对较短,在比如可变剪接中可能存在局限性。

    • 超过90%的人类基因存在可变剪接,它们会形成两个或更多的可表达异构体(转录本x与y)。

    • 短读长cDNA测序中增加了捕获信息的复杂性,短读长对异构体的检测会受到其读长的限制,从而无法精确地回贴到转录组上,而长读长测序方法则能直接鉴定异构体。

    • 在短读长cDNA测序中,有很大比例的读长会不明确地回贴到不同异构相同的外显子上;而那些跨越了外显子-外显子连接处的读长可以提高对异构体的分析效果,但是当不同的异构体都含有这个连接处时,这种操作意义不大。这些问题都加剧了数据分析的复杂性,以及无法对结果进行明确地解释。

    耗时较长:从样品准备到数据分析,Illumina测序整个流程需要较长的时间,不适合快速检测。

  综上所述:如果研究方向只是对差异基因感兴趣,则Illumina二代测序成本较低,测得的数据质量也高,是较好的选择;而如果研究方向是RNA结构方向则需要考虑是否采用三代长读长测序技术。

  3. 实验设计

  好的RNA-seq实验设计对获取高质量和有生物意义的数据是至关重要的。特别需要考虑的是生物重复的数目、测序深度、以及批次效应。 实验中必须包含足够的生物学重复以捕获组内样品自身存在的生物差异。定量分析的可信度更多地取决于生物重复,而非测序深度或reads长度。一般来说至少要大于每组至少要大于三个样本,更好达到6个样本以上。 此外,批次效应会导致差异分析的结果导致不可信,也就是无法区分差异来自生物学差异还是因为批次不同导致的差异。 实验设计如 first个批次:2个control,2个experiment 第二个批次:3个control,3个experiment 可以通过算法去除部分批次效应

但是实验设计是: first个批次:3个control 第二个批次:3个experiment 则无法通过算法去除部分批次效应,此外也无法区分差异来自生物学差异还是因为批次不同导致的差异。

  4. 数据分析

  拿到reads的counts数据,首先需要对样本进行标准化,其次进行数据探索性分析,接着对数据进行差异分析,进而对差异基因进行生物学意义探索

 4.1 样本标准化

  由于测序深度越深,在同一水平上表达的基因reads就会越多,导致样本之间不可比,基因越长,相同水平的reads会越多,样本内不可比。所以需要对数据进行标准化处理,现有FPKM和TPM两种方式皆可,TPM相对在二代测序中使用较多。

 4.2 数据探索性分析

  样本层面的质控,可以通过箱型图、样本hclust图、PCA图等等,来确定我们不同样本间确实是有差异的!

  箱型图

  为何在做差异分析时,发现组和组之间存在着明显的生物学差异,但箱式图中却没有表现出来呢? 这是因为基于前提假设:大多数情况下发生差异表达的基因只占整体基因的一小部分,不足以改变整体所有基因表达水平的分布; 如果发现样本的总体表达分布差异较大的情况,往往说明不是由于生物水平差异导致的,是批次效应导致的; 而只有一个样本表达分布差异较大,则可能是离群样本,可以考虑删除。

 样本聚类图

  PCA图

  样本聚类图、PCA图等图都可以看出组间聚集趋势,如没有批次效应,组内样本聚集在一起为更好。

  4.3 差异分析

  目前差异基因分析主要分为三个包DESeq2、edgeR、limma,每个包的前提假设均不相同, 差异基因也不尽相同,可以自行搜索其区别,常用的是DESeq2。

  此外,也有学者认为大样本下(每组8个样本及以上)可以直接使用t或者wilcox检验 链接https://doi.org/10.1186/s13059-022-02648-4

  火山图

  差异基因热图

  4.4 富集分析

  基因富集分析(gene set enrichment analysis)是在一组基因或蛋白中找到一类过表达的基因或蛋白。一般是高通量实验,如基因芯片,RNA-Seq,蛋白质组学(质谱结果)的后续步骤。 基因富集分析需要我们提供某一类功能基因的collection用于背景,常用的注释数据库如:

  The Gene Ontology Consortium: 描述基因的层级关系

  Kyoto Encyclopedia of Genes and Genomes: 提供了pathway的数据库。 

      转录组常见的富集分析有ORA富集分析与GSEA富集分析:

  1. ORA富集分析 通过对差异基因进行GO分析与KEGG分析

  2. GSEA富集分析 一般的差异分析(GO和KEGG)相对侧重于比较两组间的基因表达差异,集中关注少数几个明显上调或下调的基因,这容易遗漏部分差异表达不明显却有重要生物学意义的基因,忽略一些基因的生物特性、基因调控网络之间的关系及基因功能和意义等有价值的信息。而GSEA不需要指定明确的差异基因阈值,算法会根据实际数据的整体趋势, 为研究者们提供了一种合理地解决目前芯片分析瓶颈问题的方法,即使在没有先验经验存在的情况下也能在表达谱整体层次上对数条基因进行分析,从而从数理统计上把表达谱芯片数据与生物学意义很好地衔接起来,使得研究者们能够更轻松、更合理地解读芯片结果

  5. 研究方向与案例展示

  1. 与其他组学联合 Transcriptomic and metabolomic analysis reveals a protein module involved in preharvest apple peel browning

  简介:研究采用整合的转录组学和代谢组学分析,发现苹果果皮收获前褐变主要是由于苯酚类和类黄酮化合物的变化。详细分析确定了MdLAC7在苹果收获前果皮褐变过程中的作用

  2. 辅助疾病预后预测 Gene signature for the prediction of the trajectories of sepsis-induced acute kidneyinjury

  简介:纳入2020年11月至2021年12月参与中国多组学进展在败血症(CMAISE)中心收治的败血症患者进行研究,并在第1天测量外周血单核细胞的基因表达。通过SOFA评分的肾功能组分(SOFA肾)在第1天和第3天测量肾功能轨迹。比较这些肾功能轨迹在第1天的转录组情况,开发了一个支持向量机(SVM)模型,以区分短暂性AKI和持续性AKI。

  3. 探索机制 Targeting adipocytic discoidin domain receptor 2 impedes fat gain while increasing bonemass

  简介:肥胖与因骨量轻导致的疾病密切相关。寻找一个既能调节脂肪代谢又能调节骨量的treatment靶点具有重要意义。盘状结构域受体2(Ddr2)在骨骼代谢和脂肪代谢具有重要作用,但其调控机制仍不清晰。本文主要目的是解析Ddr2在肥胖和骨量低之间的调控机制,以及靶向Ddr2疗法是否可以成为treatment肥胖和骨量轻疾病的潜在策略

  一、 项目介绍

  转录组测序研究对象为特定细胞在某一功能状态下所能转录出来的所有RNA的总和,主要包括mRNA和非编码RNA。转录组研究是以基因功能及结构为基础和出发点,通过高通量测序,能够全方面快速地获得某一物种特定组织或organ在某一状态下的几乎所有转录本序列信息,已广泛应用于基础研究、临床诊断和药物研发、植物候选基因发掘、功能鉴定及遗传改良等领域。

 二、 项目内容

  真核有参转录组测序(RNA-seq)是针对有参考基因组的物种,通过二代测序平台,快速全方面获得动植物特定细胞或组织的转录本及基因表达信息,可进行基因表达水平、基因功能、可变剪切、SNP以及新转录本发现等方面的研究。该项目能够从整体水平研究基因表达差异及功能通路变化,揭示特定生物学过程的分子机制,为动植物生长发育、表型性状、逆境胁迫和抗病机制等的重要研究手段。

三、 送样要求

样本类型

组织

细胞

全血

植物组织

fungus

RNA

送样量

100mg/管

5×106个/管

2mL/管

100mg/管

100mg/管

Total RNA≥2μg;

浓度>100ng/μL;

RIN>7。

备份数量

≥3

≥3

≥3

≥3

≥3

≥3

其他类型样本:详询我司技术。


       参考文献

  1. Nature Reviews Genetics: RNA sequencing: the teenage years

  2. Wang, Hui et al. “Transcriptomic and Metabolomic Analysis Reveals a Protein Module Involved in Pre

  harvest Apple Peel Browning.” Plant physiology (2023).

  3. Zhang, Z., Chen, L., Liu, H. et al. Gene signature for the prediction of the trajectories of sepsis-induced

  acute kidney injury. Crit Care 26, 398 (2022).

  4. Yang, X., Li, J., Zhao, L. et al. Targeting adipocytic discoidin domain receptor 2 impedes fat gain while

  increasing bone mass. Cell Death Differ 29, 737–749 (2022).


真核有参转录组测序
真核有参转录组测序

真核有参转录组测序

分享到微信

×
真核有参转录组测序(RNA-seq)是针对有参考基因组的物种,通过二代测序平台,快速全方面获得动植物特定细胞或组织的转录本及基因表达信息,可进行基因表达水平、基因功能、可变剪切、SNP以及新转录本发现等方面的研究。
13816913927
产品详情

  RNA测序(RNA-seq)自诞生起就应用于分子生物学,帮助理解各个层面的基因功能。RNA-seq中most commonly used分析方法就是找出差异基因表达(Differential gene expression, DGE),进而根据差异基因探索生物学意义或研究靶点。DGE分析的从未发生实质性的改变,其标准流程分为三步:

  提取RNA,富集mRNA或消除rRNA,逆转录成cDNA和构建测序文库。

  然后在高通量平台(通常是Illumina)上进行测序,每个样本测序reads深度为20-40 Million reads。

  比对/拼装测序reads到转录本上,对比对上的reads定量,样本标准化,样本组间基因/转录本统计差异分析。

  RNA-seq的应用和进步是由技术发展驱动的,相对于以前的基因芯片,RNA-seq这种方法产生更丰富并且偏见更小的信息。到目前为止,从标准的RNA-seq方法衍生而来的各种RNA-seq方法几乎有100种。Illumina的短读长(short-read)测序平台能对这些由大部分不同方法的RNA-seq构建的文库进行测序,但是most近长读长(longread)RNA-seq的进步已经能够解决以前研究人员使用短序列手段无法解决的一些问题,比如更准确的基因结构研究。

  由于Illumina的短序列读长测序技术生成了SRA(Short Read Archive)中95%已表达的数据,而且cDNA的短序列读长测序方法是一种常规的方法,故先来讨论这种测序方式主要流程与局限。

  1. Illumina技术原理

  Illumina测序技术基于桥式扩增和同步测序原理。首先,cDNA被酶切成小片段,接着每个DNA片段都会被复制形成一个桥,桥上的DNA被定向固定,然后通过引入荧光标记的核苷酸依次进行链延伸,每次加入一个核苷酸都会释放荧光信号,通过检测不同荧光信号的强度来确定具体的碱基序列。 视频链接:Illumina测序技术原理 注意:测序在建库之后

  2. Illumina优势与局限

  优势:

高通量:Illumina平台可以在单次测序中产生数十亿个读长短的测序数据,大程度提高了测序效率。 

高精度:Illumina采用的测序化学和光学检测技术,可以实现较高的碱基测序准确率,通常碱基错误率低于1%。 

成本低廉:随着技术的进步,Illumina测序的成本已大幅下降,使得大规模测序项目更加经济可行。 

广泛应用:Illumina平台广泛应用于基因组测序、转录组测序、表观遗传学等多个领域。

  局限:

读长较短:Illumina测序的读长一般在50-300bp之间,相对较短,在比如可变剪接中可能存在局限性。

    • 超过90%的人类基因存在可变剪接,它们会形成两个或更多的可表达异构体(转录本x与y)。

    • 短读长cDNA测序中增加了捕获信息的复杂性,短读长对异构体的检测会受到其读长的限制,从而无法精确地回贴到转录组上,而长读长测序方法则能直接鉴定异构体。

    • 在短读长cDNA测序中,有很大比例的读长会不明确地回贴到不同异构相同的外显子上;而那些跨越了外显子-外显子连接处的读长可以提高对异构体的分析效果,但是当不同的异构体都含有这个连接处时,这种操作意义不大。这些问题都加剧了数据分析的复杂性,以及无法对结果进行明确地解释。

    耗时较长:从样品准备到数据分析,Illumina测序整个流程需要较长的时间,不适合快速检测。

  综上所述:如果研究方向只是对差异基因感兴趣,则Illumina二代测序成本较低,测得的数据质量也高,是较好的选择;而如果研究方向是RNA结构方向则需要考虑是否采用三代长读长测序技术。

  3. 实验设计

  好的RNA-seq实验设计对获取高质量和有生物意义的数据是至关重要的。特别需要考虑的是生物重复的数目、测序深度、以及批次效应。 实验中必须包含足够的生物学重复以捕获组内样品自身存在的生物差异。定量分析的可信度更多地取决于生物重复,而非测序深度或reads长度。一般来说至少要大于每组至少要大于三个样本,更好达到6个样本以上。 此外,批次效应会导致差异分析的结果导致不可信,也就是无法区分差异来自生物学差异还是因为批次不同导致的差异。 实验设计如 first个批次:2个control,2个experiment 第二个批次:3个control,3个experiment 可以通过算法去除部分批次效应

但是实验设计是: first个批次:3个control 第二个批次:3个experiment 则无法通过算法去除部分批次效应,此外也无法区分差异来自生物学差异还是因为批次不同导致的差异。

  4. 数据分析

  拿到reads的counts数据,首先需要对样本进行标准化,其次进行数据探索性分析,接着对数据进行差异分析,进而对差异基因进行生物学意义探索

 4.1 样本标准化

  由于测序深度越深,在同一水平上表达的基因reads就会越多,导致样本之间不可比,基因越长,相同水平的reads会越多,样本内不可比。所以需要对数据进行标准化处理,现有FPKM和TPM两种方式皆可,TPM相对在二代测序中使用较多。

 4.2 数据探索性分析

  样本层面的质控,可以通过箱型图、样本hclust图、PCA图等等,来确定我们不同样本间确实是有差异的!

  箱型图

  为何在做差异分析时,发现组和组之间存在着明显的生物学差异,但箱式图中却没有表现出来呢? 这是因为基于前提假设:大多数情况下发生差异表达的基因只占整体基因的一小部分,不足以改变整体所有基因表达水平的分布; 如果发现样本的总体表达分布差异较大的情况,往往说明不是由于生物水平差异导致的,是批次效应导致的; 而只有一个样本表达分布差异较大,则可能是离群样本,可以考虑删除。

 样本聚类图

  PCA图

  样本聚类图、PCA图等图都可以看出组间聚集趋势,如没有批次效应,组内样本聚集在一起为更好。

  4.3 差异分析

  目前差异基因分析主要分为三个包DESeq2、edgeR、limma,每个包的前提假设均不相同, 差异基因也不尽相同,可以自行搜索其区别,常用的是DESeq2。

  此外,也有学者认为大样本下(每组8个样本及以上)可以直接使用t或者wilcox检验 链接https://doi.org/10.1186/s13059-022-02648-4

  火山图

  差异基因热图

  4.4 富集分析

  基因富集分析(gene set enrichment analysis)是在一组基因或蛋白中找到一类过表达的基因或蛋白。一般是高通量实验,如基因芯片,RNA-Seq,蛋白质组学(质谱结果)的后续步骤。 基因富集分析需要我们提供某一类功能基因的collection用于背景,常用的注释数据库如:

  The Gene Ontology Consortium: 描述基因的层级关系

  Kyoto Encyclopedia of Genes and Genomes: 提供了pathway的数据库。 

      转录组常见的富集分析有ORA富集分析与GSEA富集分析:

  1. ORA富集分析 通过对差异基因进行GO分析与KEGG分析

  2. GSEA富集分析 一般的差异分析(GO和KEGG)相对侧重于比较两组间的基因表达差异,集中关注少数几个明显上调或下调的基因,这容易遗漏部分差异表达不明显却有重要生物学意义的基因,忽略一些基因的生物特性、基因调控网络之间的关系及基因功能和意义等有价值的信息。而GSEA不需要指定明确的差异基因阈值,算法会根据实际数据的整体趋势, 为研究者们提供了一种合理地解决目前芯片分析瓶颈问题的方法,即使在没有先验经验存在的情况下也能在表达谱整体层次上对数条基因进行分析,从而从数理统计上把表达谱芯片数据与生物学意义很好地衔接起来,使得研究者们能够更轻松、更合理地解读芯片结果

  5. 研究方向与案例展示

  1. 与其他组学联合 Transcriptomic and metabolomic analysis reveals a protein module involved in preharvest apple peel browning

  简介:研究采用整合的转录组学和代谢组学分析,发现苹果果皮收获前褐变主要是由于苯酚类和类黄酮化合物的变化。详细分析确定了MdLAC7在苹果收获前果皮褐变过程中的作用

  2. 辅助疾病预后预测 Gene signature for the prediction of the trajectories of sepsis-induced acute kidneyinjury

  简介:纳入2020年11月至2021年12月参与中国多组学进展在败血症(CMAISE)中心收治的败血症患者进行研究,并在第1天测量外周血单核细胞的基因表达。通过SOFA评分的肾功能组分(SOFA肾)在第1天和第3天测量肾功能轨迹。比较这些肾功能轨迹在第1天的转录组情况,开发了一个支持向量机(SVM)模型,以区分短暂性AKI和持续性AKI。

  3. 探索机制 Targeting adipocytic discoidin domain receptor 2 impedes fat gain while increasing bonemass

  简介:肥胖与因骨量轻导致的疾病密切相关。寻找一个既能调节脂肪代谢又能调节骨量的treatment靶点具有重要意义。盘状结构域受体2(Ddr2)在骨骼代谢和脂肪代谢具有重要作用,但其调控机制仍不清晰。本文主要目的是解析Ddr2在肥胖和骨量低之间的调控机制,以及靶向Ddr2疗法是否可以成为treatment肥胖和骨量轻疾病的潜在策略

  一、 项目介绍

  转录组测序研究对象为特定细胞在某一功能状态下所能转录出来的所有RNA的总和,主要包括mRNA和非编码RNA。转录组研究是以基因功能及结构为基础和出发点,通过高通量测序,能够全方面快速地获得某一物种特定组织或organ在某一状态下的几乎所有转录本序列信息,已广泛应用于基础研究、临床诊断和药物研发、植物候选基因发掘、功能鉴定及遗传改良等领域。

 二、 项目内容

  真核有参转录组测序(RNA-seq)是针对有参考基因组的物种,通过二代测序平台,快速全方面获得动植物特定细胞或组织的转录本及基因表达信息,可进行基因表达水平、基因功能、可变剪切、SNP以及新转录本发现等方面的研究。该项目能够从整体水平研究基因表达差异及功能通路变化,揭示特定生物学过程的分子机制,为动植物生长发育、表型性状、逆境胁迫和抗病机制等的重要研究手段。

三、 送样要求

样本类型

组织

细胞

全血

植物组织

fungus

RNA

送样量

100mg/管

5×106个/管

2mL/管

100mg/管

100mg/管

Total RNA≥2μg;

浓度>100ng/μL;

RIN>7。

备份数量

≥3

≥3

≥3

≥3

≥3

≥3

其他类型样本:详询我司技术。


       参考文献

  1. Nature Reviews Genetics: RNA sequencing: the teenage years

  2. Wang, Hui et al. “Transcriptomic and Metabolomic Analysis Reveals a Protein Module Involved in Pre

  harvest Apple Peel Browning.” Plant physiology (2023).

  3. Zhang, Z., Chen, L., Liu, H. et al. Gene signature for the prediction of the trajectories of sepsis-induced

  acute kidney injury. Crit Care 26, 398 (2022).

  4. Yang, X., Li, J., Zhao, L. et al. Targeting adipocytic discoidin domain receptor 2 impedes fat gain while

  increasing bone mass. Cell Death Differ 29, 737–749 (2022).


香港六宝典免费
选择区号