一、概述
Psipred是一種用於預測蛋白質二級結構和蛋白質結構中不規則區域的軟件。它基於神經網絡模型,可以進行高效準確的預測,並且已經在多個生物信息學領域得到了廣泛應用。
二、二級結構預測
Psipred使用BLAST來在數據庫中進行蛋白質序列比對,然後產生一個PSI(Position Specific Iterated)矩陣。該矩陣反映了不同位置的氨基酸殘基在多種不同蛋白質中出現的概率。然後,Psipred會使用這些數據來構建一個具有三層的神經網絡,用於預測蛋白質的二級結構。
其中,第一層是輸入層,第二層是一組隱含層,而第三層是輸出層。輸入層將蛋白質的PSI矩陣像素化,輸出層則輸出蛋白質二級結構的預測結果。隱含層通過調整不同的神經元之間的權重,從而將輸入轉換成輸出。
# Python示例代碼:
def loadblast(file):
"""
Load a psiblast file
"""
predictor = PsipredPredictor()
predictor.blastfile = file
def runpsipred(self, infile):
"""
Run PSIPRED: takes an input file and writes output files
"""
sequence = self.readSequence(infile)
# do blast search
self.doBlastSearch(sequence)
# do psipred prediction
self.doPrediction(sequence)
三、不規則區域預測
在蛋白質結構中,不規則區域指的是不屬於螺旋和β摺疊的其它區域。Psipred使用一個名為DisEMBL的軟件來預測這些區域。DisEMBL基於神經網絡算法,由兩層神經網絡組成,其中輸入層接收蛋白質序列,輸出層將給出蛋白質結構中不規則區域的可能性。
# Python示例代碼:
def observeddata(self, data, start):
"""
Record observed data and update statistics
"""
p = self.predictor
n = p.seqLength - start + 1
for i in range(1, n+1):
aa = data[start+i-1]
ss = p.sst[i]
p.w[ss][aa] = p.w[ss][aa] + 1
p.n[ss] = p.n[ss] + 1
p.isloadedobserveddata = True
def loadobserveddata(self):
"""
Load observed data (training data) from file
"""
p = self.predictor
fin = open(p.obsfile, "r")
data = fin.readlines()[1:]
fin.close()
四、模型參數設置
Psipred中有很多可調整的參數,包括輸入序列的長度,神經網絡的大小和深度,以及神經元之間的權重等。這些參數的設置通常是根據實驗結果和經驗知識來進行的。
# 配置文件中的參數設置: ### DIRECTORIES data_dir = /home/psipred/data/ work_dir = /temp/ ### NEURAL NETWORK ARCHITECTURE input_layer_size = 21 num_of_hidden_layers = 1 hidden_layer_size = 40 output_layer_size = 3 ### BLAST PARAMETERS blast_dir = /usr/bin/ blast_db = /blast/database/ ### PSI-PRED PARAMETERS psipred_dir = /home/psipred/ disopred_dir = /home/disopred/ blastpgp_iteration = 3 ### PATHS AND ACTUAL FILE NAMES blast_bin_name = psiblast dssp_bin_name = dsspcmbi
五、應用
Psipred的預測結果可以應用於許多不同的領域,例如藥物發現、結構生物學、分子動力學和蛋白質設計等。此外,Psipred還可以與其他生物信息學工具相結合,如3D-PSSM、Modeller和Robetta,以提高預測結果的準確性。
六、結論
在生物信息學領域中,Psipred是一種常用的工具,並已在許多實際應用中得到驗證。通過對數據進行深入分析和模型的不斷優化,未來將可以使Psipred在更廣泛的場景中實現更準確和高效的預測。
原創文章,作者:SNPU,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/147580.html
微信掃一掃
支付寶掃一掃