本文目錄一覽:
- 1、生信菜狗,各種軟件升級後前一版的包怎麼裝回來?
- 2、Miniconda使用體驗
- 3、生信常見腳本的命令行傳參方式–python,R,Perl,Shell
- 4、Perl,R,Python在生物信息學中是怎樣的角色?
- 5、【Linux】生物信息軟件安裝過程
- 6、生信軟件BUSCO安裝
生信菜狗,各種軟件升級後前一版的包怎麼裝回來?
可以先把現有的都卸載了
然後重裝miniconda,因為科學計算的包一般都選conda的比較好,
然後就是不知道你是否熟悉虛擬環境,為了避免每次把你的環境搞亂,創建虛擬環境是最保險的
使用類似這樣的命令
conda create -n vname
conda activate vname
Miniconda使用體驗
生信入門的第一步就是要學會安裝軟件,但有些軟件的安裝和編譯比較麻煩,這個時候就會懷念windows系統的方便。
根據生信技能樹和菜鳥團里的介紹,linux系統也有這種自動式的安裝軟件的方式,因此,開始體驗使用conda來安裝軟件。
安裝簡單,只需要在服務器上運行即可
此時會在home目錄下生成miniconda3的文件夾,並更新下環境變量。
註:如果安裝後不想在終端前顯示(base)
conda install fastqc(軟件名)
which fastqc 查看軟件安裝位置
conda list 可以查看已安裝軟件列表,conda默認安裝軟件的最新版本,如果想安裝指定版本的某個軟件,可以先用“conda search 軟件名”搜索軟件版本。
星號標記的表示是已經安裝的版本。要 安裝其他版本 ,輸入:
conda install 軟件名=版本號
這時conda會先卸載已安裝版本,然後重新安裝指定版本。
如果想要安裝列表中的軟件,可進入該軟件的conda主頁,比如cutadapt[ ]
裡面會告訴應該使用什麼命令~
安裝完後的軟件在miniconda2文件夾裡面的pkgs文件夾下面。
conda config –add channels
查看已經添加的channels
conda config –get channels
conda config –remove channels
conda update conda
conda remove 軟件名
source activate 軟件名 #把目錄添加進環境變量
source deactivate #從環境變量裡面 刪去
conda info -e
例子:
安裝snakemake,snakemake已經整理成Python包,可以直接使用 pip 進行安裝,不過需要的Python3的環境,利用 conda 進行安裝:
試試 snakemake -h 看看安裝成功沒有?
但是可能網絡會不太好,可能需要多幾次進行安裝。
參考:
用Miniconda,Bioconda來安裝常見的生物信息學軟件 | 生信菜鳥團 [ ] ;
。
生信常見腳本的命令行傳參方式–python,R,Perl,Shell
getopt
python 也可以使用getopt文件傳參
getopt 是很多語言都有的傳參函數,不過平時在寫Rscript的時候經常用到。
一般而言:
Perl,R,Python在生物信息學中是怎樣的角色?
應該說Python/Perl是相互替代的腳本語言,但個人推薦用Python, 雖然很多老的生物信息軟件是用Perl,Python學習曲線好,功能也更強大,是發展趨勢。這兩個語言主要是做數據預處理、文本處理和格式轉換、對算法效率要求不高的分析軟件開發,系統管理和pipeline搭建等工作。R語言主要的優勢是大量的統計包的支持,數據統計分析中非常常用。Python和R有良好的接口。關於繪圖很多人用R,其實Python的Matplotlib的繪圖效果比它漂亮很多,也更強大。對pipeline的搭建shell編程更適合,是一個不可缺少的技能。與數據庫相關的工作需要用到SQL, Linux : 操作系統,是基礎。 生物信息對Linux的要求其實並不高,並不是要做系統開發者或管理員,只需要會用就行。複製粘貼、處理數據、安裝軟件等。生物信息軟件:標準數據分析。 生物信息學的數據格式已經基本標準化,大部分工作可以直接用軟件完成。Perl和Python:處理個性化問題、軟件之間的對接。 這兩門語言至少應該熟練掌握一門自己寫程序用,另外一門要能看得懂。 寫點小腳本感覺差別不大,但是perl寫大程序不合適。 很多人認為python是趨勢,但至少截止目前更多生信軟件是用perl寫的。 所以,如果剛開始學,建議主打python, 看懂perl。R :數據處理、統計、繪圖、數據分析。 R語言的數據結構跟其他語言差異較大、而且總感覺語法比較散,不好記。但是R的軟件包卻異常強大。數據處理的reshape2, dplyr;繪圖的ggplot2;還有Bioconductor里的幾千個包。不得不會。
【Linux】生物信息軟件安裝過程
小炒:搜索 “conda cheatsheet”
好處:
添加channel
channel是有順序的,一般保持bioconda在第一個,conda-forge在第二個。-defaults放最後。
創建軟鏈接 ,相當於在桌面創建了快捷方式: ln -s
例: ln -s ~/miniconda3/envs/python2/macs2 ~/.local/bin
搜索生信軟件
-availiable packages
Tips
二進制版本
以 ncbi-blast ,’sra-toolkit’,’hisat2’為例
預編譯版本
以 zlib 為例,samtools依賴的軟件。
tree 的安裝只需後兩步,且最後一步的時候要做修改,記得去看 Read me 。
三部曲解讀:
如果沒有root權限要解決軟件依賴的問題:
修改makefile的變量名
python包軟件管理工具
conda 安裝deeptools
deeptools在python2下表現更好。
鏈接:
1.
2.
舉兩個例子:
參考:
bilibili:zhougengxu
生信軟件BUSCO安裝
現在得到一個文昌魚組裝基因組。我希望看看它的質量如何,也就是找組裝基因組是否包含許多完整基因、以及N50序列是否達標等問題。
我看到網上教程都是自己去搞配置,設置環境變量,但是conda安裝難道不香嗎?BUSCO官網也給出了conda安裝的方法:(最好是重新創造個python=3.8的conda環境)
conda install -y -c bioconda busco=4.1.2 augustus=3.3.3
安裝好之後,輸入busco
emm這是“biopython”出了問題了啊。然後我到上面提到的那個網址搜了一下,發現果然是conda安裝的有問題。
這時,只要把biopython從1.78降到1.77就可以了
命令:conda install -y -c conda-forge biopython=1.77 就可以覆蓋安裝了,而且神奇的是安裝完就可以使用了,輸入 busco -h 不會報錯。
註:本來想用cegma那個軟件,但好像六年前就停止運營了……(bilibili上看的教學視頻太久遠了)
如果你也遇到了同樣的問題,應該會有幫助,不過過一段時間應該就修復這個bug了。
2020 09 15 補充:
這樣即使安裝上了,也不能使用,會報錯。博主又嘗試了安裝busco 4.0.2的版本,和augustus 3.3.3 版本,發現可以使用。(還是需要biopython = 1.77)
注意這個軟件只是看測序質量怎麼樣,雖然調用了augustus,但是它生成的文件比較亂,想要做從頭基因注釋,還是再用一次augustus吧!
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/155025.html