一、Rmats簡介
Rmats是一款基於RNA-seq數據的剪接分析工具,最初由中國科學院上海生命科學研究院計算生物學研究所研發,用於分析轉錄組水平的差異剪接事件。在實際應用中,Rmats可以用於檢測和分析細胞因子、激素調節機制、凋亡、腫瘤等多種生物學過程中的差異剪接事件。
二、Rmats的使用方法
使用Rmats進行剪接分析需要進行以下步驟:
- 使用拼接工具生成樣本RNA-seq reads(fasta或fastq文件)
- 使用Bowtie等工具將reads比對到基因組上
- 將比對.sam文件進行轉為.bam文件(同時去除duplicated reads)
- 將bam文件進行格式轉換成junctions文件
- 使用Rmats分析樣本間的差異剪接事件
三、Rmats結果解讀
Rmats分析結果會輸出許多差異剪接事件,其中最重要的是SS(skipping exon)、RI(retained intron)和MXE(mutually exclusive exon)類型。對於每種事件,Rmats都會輸出JCE(junction counts encompassing)、JC(junction counts)、psi值等一些重要的參數。
SS(skipping exon):表示一個外顯子被完全跳過的事件,其JCE值為0. JC值表示這個外顯子的長度(14nt~100000nt),psi值表示剪接事件發生的差異程度。psi=1表示剪接事件存在但不差異,psi=0表示剪接事件完全缺失,psi=0.5表示等量存在。
## 第一列:IID 陽性對照組ID## 第二列:SJC_SAMPLE_1 陽性對照組裡涉及這個剪接事件的reads數目## 第三列:IJC_SAMPLE_1 陽性對照組裡包含這個外顯子的reads數目## 第四列:SJC_SAMPLE_2 另一組實驗組裡涉及這個剪接事件的reads數目## 第五列:IJC_SAMPLE_2 另一組實驗組裡包含這個外顯子的reads數目## 第六列:IncFormLen 這個外顯子本身長度## 第七列:SkipFormLen 跳過這個外顯子後剩下的外顯子鏈長度## 第八列:PValue P值## 第九列:FDR FDR值## 第十列:IncLevel1 陽性對照組中這個外顯子的可變剪接水平## 第十一列:IncLevel2 實驗組中這個外顯子的可變剪接水平ID SJC_SAMPLE_1 IJC_SAMPLE_1 SJC_SAMPLE_2 IJC_SAMPLE_2 IncFormLen SkipFormLen PValue FDR IncLevel1 IncLevel2chr10:101851159-101851512:-@chr10:101850874-101851158:-@chr10:101785744-101785954:- 0 0 91 104 354 12835 4.97202E-5 0.0865156242292304 0 0.944444444444444chr10:101980228-101980505:+@chr10:101986914-101987124:+@chr10:101988460-101988721:+ 4 7 129 87 278 8654 7.61328E-5 0.111462348129411 0.363636363636364 0.854368932038835
RI(retained intron):表示一個內含子沒有被完全剪除的事件,其JCE值為0,JC值表示這個內含子的長度,psi值表示剪接事件發生的差異程度。psi=1表示剪接事件存在但不差異,psi=0表示剪接事件完全缺失,psi=0.5表示等量存在。
## 第一列:IID 陽性對照組ID## 第二列:SJC_SAMPLE_1 陽性對照組裡涉及這個剪接事件的reads數目## 第三列:IJC_SAMPLE_1 陽性對照組裡包含這個內含子的reads數目## 第四列:SJC_SAMPLE_2 另一組實驗組裡涉及這個剪接事件的reads數目## 第五列:IJC_SAMPLE_2 另一組實驗組裡包含這個內含子的reads數目## 第六列:IncFormLen 含有內含子的外顯子鏈長度## 第七列:SkipFormLen 去掉內含子後的外顯子鏈長度## 第八列:PValue P值## 第九列:FDR FDR值## 第十列:IncLevel1 陽性對照組中這個內含子的可變剪接水平## 第十一列:IncLevel2 實驗組中這個內含子的可變剪接水平ID SJC_SAMPLE_1 IJC_SAMPLE_1 SJC_SAMPLE_2 IJC_SAMPLE_2 IncFormLen SkipFormLen PValue FDR IncLevel1 IncLevel2chr17:29790607-29790736:+@chr17:29792043-29792276:+ 3 2 95 75 175 4 1442.1 0.25 0.6
MXE(mutually exclusive exon):表示兩個外顯子互相排斥的事件,其JCE值主要用於表示兩個外顯子互相排斥情況下的reads數目,JC值則表示兩個外顯子組成的完整轉錄本與其他轉錄本的比較,psi值表示剪接事件發生的差異程度。psi=1表示剪接事件存在但不差異,psi=0表示剪接事件完全缺失,psi=0.5表示等量存在。
## 第一列:IID 陽性對照組ID## 第二列:SJC_SAMPLE_1 陽性對照組裡涉及這個剪接事件的reads數目## 第三列:IJC_SAMPLE_1 陽性對照組裡包含這個內含子的reads數目## 第四列:SJC_SAMPLE_2 另一組實驗組裡涉及這個剪接事件的reads數目## 第五列:IJC_SAMPLE_2 另一組實驗組裡包含這個內含子的reads數目## 第六列:IncFormLen 第一個外顯子的長度## 第七列:SkipFormLen 跳過兩個外顯子後的剩餘外顯子鏈長度## 第八列:PValue P值## 第九列:FDR FDR值## 第十列:IncLevel1 陽性對照組中第一個外顯子的可變剪接水平## 第十一列:IncLevel2 實驗組中第一個外顯子的可變剪接水平## 第十二列:IncLevelDifference 可變剪接水平之差ID SJC_SAMPLE_1 IJC_SAMPLE_1 SJC_SAMPLE_2 IJC_SAMPLE_2 IncFormLen SkipFormLen PValue FDR IncLevel1 IncLevel2 IncLevelDifferencechr2:72228224-72229889@chr2:72236144-72238043 245 235939 222 194197 19437 4.87868e-45 1.45760e-40 0.097263685455848 0.838891329101846 0.741627643645
四、熱敏艾條分析
熱敏艾條是一種用於檢測溫度變化的精密儀器,在生物學實驗中常用於PCR反應和DNA測序等過程中對於溫度的精密控制。在RNA剪接分析中,熱敏艾條在比對和剪接的過程中都有很重要的作用,可以通過調整溫度參數來增強RNA剪接分析結果的準確性。
以下是熱敏艾條在Rmats分析中的代碼示例:
>> python rMATS.py --b1 bam_file1 --b2 bam_file2 --gtf gtf_file --tstat 0 --libType fr-firststrand --nthread 10 --cstat 0.05 --novelSS 1 --novelAS 1 -o output_folder
其中,–tstat 0參數表示利用T流子(T0、T1、T2)的比例來判斷差異剪接,–libType fr-firststrand參數表示數據集的測序方法為fr-fisrtstrand,–cstat 0.05參數表示選用2均值做差異剪接分析時的檢驗P值閾值,–novelSS 1參數表示使用novel splicing site開關,–novelAS 1表示使用novel alternative splicing分析開關。
五、小結
Rmats是一款基於RNA-seq數據的剪接分析工具,可以分析轉錄組水平的差異剪接事件。在使用Rmats進行剪接分析時,我們需要進行各個步驟的操作,同時還需要注意對分析結果的準確性評估。此外,在進行RNA剪接分析時,熱敏艾條的使用也有很重要的作用,可以通過調整溫度參數來增強剪接分析結果的準確性。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/289488.html