clusterProfiler包使用介紹

一、clusterProfiler包全稱

clusterProfiler是R語言中的一款生物信息學分析包,主要用於功能富集分析和基因集富集分析。

二、clusterProfiler怎麼讀

clusterProfiler的讀法是「克拉斯特-普羅費勒」。

三、clusterProfiler包介紹

clusterProfiler包依賴於其他幾個包,如DOSE和enrichplot等,用於分析大規模基因集的轉錄數據,可實現KEGG通路分析,維度縮減,維度可視化等功能。該包可以與絕大多數常用基因注釋器(如:org.Hs.eg.db、org.Mm.eg.db等)結合使用。

當然,為了方便用戶進行分析,官方還額外提供許多基因注釋信息和物種信息的包文件,如:DO.db、KEGGREST、ReactomePA、org.At.tair.db等,可在R中直接安裝。

四、clusterProfiler包弦圖

clusterProfiler包的弦圖(Chord Plots)可以用於展示基因組或轉錄組中不同注釋的基因集之間的相互作用情況,強調不同基因集之間的相互作用程度,以及它們之間的關係和交叉。

下面是一個用於KEGG通路分析結果的弦圖代碼示例:

kegg_enrich <- enrichKEGG(gene     = gene_list,
                          organism = 'mmu',
                          pvalueCutoff = 0.05,
                          qvalueCutoff = 1,
                          readable = TRUE)
kegg_enrichment <- ggplot(plotEnrich(kegg_enrich)) +
                     theme(legend.position = 'right',
                           axis.text = element_text(size = 8)) +
                     scale_fill_brewer(type = 'qual', palette = 6, direction = -1) +
                     ggtitle('KEGG enrichment analysis results') +
                     xlab('') + ylab('')
```
chordDiagram(mergeSig(kegg_enrich, sigLevel = 0.05), 
              sortFun= function(x) -log10(x[,2]), 
              direction = c('clockwise','counterclockwise'))
```

五、clusterProfiler進行GSEA

clusterProfiler的GSEA分析(Gene Set Enrichment Analysis)主要用於基因集在樣本中的富集分析,是一個非常常見的生物信息學方法,用於發現功能相似的基因集在生物實驗中的重要性。

下面是一個用於GSEA分析的代碼示例:

gse_result<-gseGO(gene = gene_list,
                  OrgDb = org.Hs.eg.db,
                  ont = "BP",
                  nPerm = 1000,
                  minGSSize = 10,
                  pvalueCutoff = 0.05,
                  maxSize = 500,
                  verbose = FALSE)
gse_plot<-ggplot(plotGSEA(gse_result,top=20,color = 'blue'),annotation = 'none')+
              theme(legend.position = 'bottom')+
              ggtitle('GSEA analysis results')+
              xlab('')+
              ylab('')+
              guides(colour=guide_legend(nrow=5,byrow=TRUE,title=NULL))
gse_plot

六、clusterProfiler自建庫

clusterProfiler還支持自建基因注釋信息庫,方便用戶更便捷的進行分析。

下面是一個自建庫的代碼示例:

library(AnnotationForge)
sample_species <- 'pombe'
columns <- c( "SYMBOL", "ENTREZID")
orgDb <- makeOrgPackageFromNCBI( 
                  dbname = sample_species, 
                  includeNCBISynonyms=TRUE, 
                  tax_id = as.integer(paste("28", 0, 1, sep = "")), 
                  columns=columns, 
                  version = '1.0.0', 
                  author = 'Your Name', 
                  maintainers = list(
                      maintainer = c("Name", ""),
                      email = "example@gmail.com"),
                  outputDir='~/Downloads'
                  )

以上就是本次clusterProfiler包使用介紹的內容,希望對大家有所幫助。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/302824.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-31 11:48
下一篇 2024-12-31 11:48

相關推薦

  • ClusterProfiler安裝指南

    ClusterProfiler是一款R軟體包,能夠幫助生物信息學家快速對基因表達數據進行生物學意義的分析和解釋。本文將從多個方面對ClusterProfiler的安裝方法進行詳細闡…

    編程 2025-04-02
  • ClusterProfiler包實現生物信息學數據聚類分析

    一、概述 ClusterProfiler是一個R包,主要用於功能富集分析的結果的可視化和解釋。它基於R語言的GOstats和ggplot2包,支持多種物種和GO分支的注釋和富集分析…

    編程 2025-04-02
  • ClusterProfiler安裝詳解

    一、ClusterProfiler安裝方法 ClusterProfiler是一個基於R語言的生物信息學工具包,主要用於富集分析,旨在幫助研究者對高通量基因表達數據進行生物學意義上的…

    編程 2024-10-04

發表回復

登錄後才能評論