一、簡介
cellranger是10x Genomics公司開發的一個基於Illumina測序平台的單細胞RNA測序(scRNA-seq)分析工具,主要用於處理10x Genomics的單細胞bead-based測序數據。它是一個完整的分析管道,可以執行從原始數據到表達矩陣、細胞聚類、細胞分型和單細胞基因表達分析等一系列分析,支持多種分析流程,包括 5’ gene expression、3’ gene expression、VDJ和feature barcode分析。
二、安裝
cellranger官方提供了Linux和MacOS的二進制安裝包,可在任何支持Bash的操作系統上安裝。安裝步驟如下:
1. 下載安裝包:https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest
2. 解壓縮安裝包:tar -xzvf cellranger-VERSION.tar.gz
3. 添加cellranger到PATH環境變量:export PATH=$PATH:/path/to/cellranger-VERSION
三、使用
1. 準備數據
在使用cellranger之前,需要將原始數據(fastq格式)拆分成多個樣本的fastq文件,每個樣本一個文件夾,文件夾名稱為樣本名稱。拆分後的文件夾存儲在一個主目錄下。
Main_directory/
├── Sample1/
│ ├── R1.fastq.gz
│ └── R2.fastq.gz
├── Sample2/
│ ├── R1.fastq.gz
│ └── R2.fastq.gz
└── Sample3/
├── R1.fastq.gz
└── R2.fastq.gz
2. 運行分析管道
在運行分析管道前,需要準備好參考基因組和注釋信息。cellranger支持多個物種的常見基因組和注釋信息。可以從10x Genomics網站中下載相應物種的參考數據,也可以使用自己的自定義參考數據。
cellranger count \
--id=Sample1_count \
--transcriptome=/opt/refdata-cellranger-GRCh38-3.0.0 \
--fastqs=Main_directory/Sample1 \
--sample=Sample1
3. 分析結果
cellranger會生成一個報告文件,包括不同質量控制步驟的圖表和統計信息。報告文件位於輸出目錄下的“outs/web_summary.html”。
同時,在輸出目錄還包含多個輸出文件:
- barcodes.tsv.gz: 包含每個細胞的唯一barcode。
- genes.tsv.gz: 包含所有基因的信息。
- matrix.mtx.gz: 包含每個細胞和每個基因的測序計數。
- web_summary.html: cellranger在分析過程中生成的報告文件。
四、擴展
1. Seurat和Scanpy
雖然cellranger可以執行許多重要的分析步驟,但不足以涵蓋整個單細胞RNA-seq數據分析的範圍。為了進一步分析和可視化結果,需要使用其他工具,例如Seurat(R語言包)和Scanpy(Python包)。Seurat可以幫助您執行聚類、圖形可視化和差異表達分析等操作,而Scanpy提供了與Scipy、Numpy和Pandas等Python庫的無縫集成,可以進行類似的分析。
2. 參考數據
當處理不同物種或具有不同基因組的樣本時,需要進行參考數據的自定義。cellranger提供了一個參考數據製作工具,可以幫助您準備自己的參考數據,以便用於分析同種類中的多個樣本。
cellranger mkref \
--genome=MyGenome \
--fasta=/path/to/genome.fa \
--genes=/path/to/genes.gtf
3. 結果後處理
在聚類後,可以使用Seurat對聚類結果進行可視化、交互式探索和差異表達分析。Seurat提供了多種應用和技術,包括降維、聚類、比較、集群顯著性分析和可視化。可以使用以下示例代碼從cellranger輸出創建Seurat對象:
library(Seurat)
counts <- Read10X(data.dir = 'path/to/outs/filtered_feature_bc_matrix')
seurat_obj <- CreateSeuratObject(counts, project = 'MyProject')
seurat_obj
原創文章,作者:XXHIB,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/360383.html