❶ 求生物信息學軟體軟體包EMBOSS
介個不是網上直接有下載的么,求啥子嘛,ftp://emboss.open-bio.org/pub/EMBOSS/,
❷ 生信菜狗,各種軟體升級後前一版的包怎麼裝回來
可以先把現有的都卸載了
然後重裝miniconda,因為科學計算的包一般都選conda的比較好,
然後就是不知道你是否熟悉虛擬環境,為了避免每次把你的環境搞亂,創建虛擬環境是最保險的
使用類似這樣的命令
conda create -n vname
conda activate vname
❸ 生信自學網player是個什麼東東,哪裡能破解
這是一個視頻文件播放軟體,從圖中看不需要破解的,又沒有加密,是要你關聯相關格式的視頻文件而己
❹ 生物信息學一些基本的常用軟體有哪些
必學:1、計算機基礎(linux+perl+R 或者 python+matlab)
2、生信基礎知識(測序+資料庫+數據格式)
3、生信研究領域(全基因組,全轉錄組,全外顯子組,捕獲目標區域測序)
4、生信應用領域(腫瘤篩查,產前診斷,流行病學,個性化醫療)
分而治之:
一、計算機基礎,需要看三本書,一步步的學會學通,不需要刻意去找哪個書,一般linux是鳥哥私房菜,perl是小駱駝咯,R是R in action,但是看一本書只能入門,真正想成為菜鳥,必須每個要看五本書以上!我雲盤裡面有這基本上的高清列印版,大家可以去淘寶列印一下才幾十塊錢還包郵,對書比較講究的也可以買正版,也不過是一百多塊錢而已!
二、生信基礎知識,測序方面,在網路文庫找十幾篇一代二代三代測序儀資料仔細研讀,然後去優酷下載各大主流測序儀的動畫講解,再看看陳巍學基因的講解;資料庫先看看三大主流資料庫——NCBI,ENSEMBL,UCSC,還有一些也可以了解一些(uniprot,IMGT,KEGG,OMIN,TIGR,GO)同樣也是網路文庫自己搜索資料,但是這次需要自己去官網一個個頁面點擊看,一個個翻譯成中文理解吃透;數據格式講起了就多了,這個主要是在項目流程中慢慢學,或者你有機會去上課,不然你看來也是立馬忘記的,主要有sam,vcf,fasta,fastq,bed,gtf,gff,genbank,ensembl,psl等等
三、生信研究領域,各個領域主要是軟體繁多,合起來常用的估計有上百個軟體了,一般只有從業五六年以上的人才有可能把它們全部用過一遍,而且這也完全需要項目來訓練,而不能僅僅是看看軟體手冊,但是研究領域最重要的是背後的原理,需要看各大牛的綜述。
a) 生信基礎軟體(blast++套件,fastqc,flash,blast,solexaQA,NGS-QC-toolkit,SRA-toolkit,fastx-toolkit)
b) snp-calling相關軟體(bwa,bowtie,samtools,GATK,VarScan.jar,annovar)
c) 基因組相關軟體(velvet,SOAPdenovo2,repeatmasker,repeatscount,piler,orthMCL,inparanoid,clustw,muscle,MAFFT,quickparanoid,blast2go,RAxML,phyML)
d) 轉錄組相關軟體(trinity,tophat,cufflinks,RseQC,RNAseq,GOseq,MISO,RSEM,khmer,screed,trimmomatic,transDecoder,vast-tools,picard-tools,htseq,cuffdiff,edgeR,DEseq,funnet,davidgo,wego,kobas,KEGG,Amigo,go)
❺ 生物信息學常用的軟體有哪些
NCBI(www.ncbi.nlm.nih.gov)-GenBank資料庫
資料庫相似性搜索——核酸序列與核酸資料庫比較(BLASTN)
蛋白質序列與資料庫中蛋白質序列比較(BLASTP)
兩序列比對(Align two sequences)
DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html)
分析實驗序列外顯子部分——GENSCAN(http://genes.mit.e/GENSCAN.html)
分析實驗序列的可能酶切位點——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php)
註: Custom digest -- view gel
限制性內切酶資料庫——REBASE(http://rebase.neb.com/rebase/rebase.html)
設計引物擴增實驗序列——Genefisher
Primer 3
蛋白質序列分析及結構預測:
1.預測蛋白質的分子量及等電點:ExPASy(Compute pI/Mw)
2.分析蛋白質的基本物理化學性質:ExPASy(ProtParam)
3.分析蛋白質的親水性和疏水性:ExPASy(ProtScale)
4.分析蛋白質在各種蛋白酶和各種化學試劑處理後的內切產物:ExPASy(PeptideMass) [* :kinase K]
5.分析蛋白質的信號肽:ExPASy(SignalP)
6.預測蛋白質的二級結構:ExPASy(Jpred 3)
多物種分子系統發育分析:EMBL(www.ebi.ac.uk/embl/)--Toolbox--Clustal2W
人脂聯素蛋白質序列:NP_004788
人類胰島素生長因子IB前體:P05019
❻ 用於生物信息分析該如何安裝ubuntu系統
1. 生信軟體系統的選擇——Linux(ubuntu)
對於生信分析人員來說,日常工作,軟體運行,跑流程,均在linux下操作。當然,也有基於雲端的生信分析平台,如免費的Galaxy,或者某些 公司的一站式雲平台。
比較初學者學生物信息還是使用開源軟體、學原理、一步一步運行才有意思。這路子,一定要適應Linux的命令行界面。
選擇windows還是linux? 一定是linux,windows太多的生物軟體不兼容了。
選擇linux的哪個版本?推薦桌面版的Ubuntu——穩定,美觀,適合初學者之稱;次之,Centos——免費、穩定的伺服器linux版本之稱。
用那種方式安裝linux好?推薦虛擬機安裝。不太建議雙系統,雲端這種。因為,對於初學者在系統中,需要反復折騰,測試,搞垮系統是常事。
選擇開源的VMbox還是商業版VMware?兩者都可以,但各有缺點。VMbox更新比較快,經常更新後,可能會出現報錯,系統無法打開的現象,較低版本的反而比較穩定,如果用好了,不建議經常更新。還有一點是,VMbox在滑鼠控制上,沒有VMware流暢。VMware十分穩定,流程好用。最新版一般要收費。可以選擇比最新版版本稍低的,上網搜注冊碼,免費使用。還是那樣,用好了,不要經常更新。某些生信軟體會提供VMbox的鏡像,如qiime。
VMbox的鏡像能不能轉到VMware上使用?,答案是可以的,使用VMbox的鏡像導出功能,然後使用VMware進行導入,保持兩者格式相同。
❼ 生物信息學安裝哪個版本的linux
本人自大三就開始做生物信息,現在即將讀博士,希望我的經驗可以幫助到你。
既然你是想做生物信息學,那麼相關背景什麼的會了解一些,我在這就不多說了。
首先,確定你自己的背景專業,現在很多學校本科都沒有專門的生物信息學專業,都是掛靠在生命學院或者計算機學院的。所以背景專業一般都是生物學或計算機學,不同的專業將來做生信區別會很大。當然,做什麼方向和背景專業並沒有絕對關系。
如果是生物學背景,那麼將來大部分的工作將會是使用專門的生物信息學分析軟體。所以難度會降低。自學的話,主要學幾下幾點就好:
1、一門腳本語言,個人推薦Python(Perl也可以,各有利弊,Python更新興一些)。
2、Linux系統。這個也不是百分百要求,但是專業的生信人,都是用Linux的,而且很多軟體都是不支持Windows的。
3、常用的生物信息學資料庫,這里列出幾個,NCBI,Ensembl,EBI,GENEbank等等,這些資料庫下面還分子資料庫,像GEO,GWAS catalog等。當然,還有方向更細的,像miRBase(miRNA資料庫)等。
4、R,這也是一種編程語言,但更加側重結果的展示,實際上也就是畫圖。
5、常用生信分析軟體,這個沒必要專門去學,需要用到他們的時候再學也不晚,都是很簡單的東西。
如果是計算機背景,那麼以後的工作可能主要是演算法分析,創造新的生信分析軟體,做資料庫等。需要自學的就是以上的那些,再加一門工程語言,C,C++,C#,Java都可以。
❽ 生信軟體是不是詐騙
不是。生信軟體是生物信息學,是研究生物信息的採集、處理、存儲、傳播、分析和解釋等各方面的學科軟體,是經過專業機構審核的正規軟體,不是詐騙,用戶可以放心使用。
❾ 生信筆記2-fastqc的安裝和使用
fastqc是查看轉錄組數據質量的軟體
運行結束後生成兩個文件一個.html網頁文件,一個是.zip壓縮文件,只看html網頁文件就可以了
Filename:指的是進行質控的文件名
Encoding:指測序平台的版本和相應的編碼版本號
Total Sequences:指reads的數量
Sequence length:指測序的長度
%GC 指整體序列中的GC含量
此圖中的橫軸是測序序列第1個鹼基到第151個鹼基
縱軸是質量得分,Q = -10*log10(error P)即20表示0.01的錯誤率,30表示0.001,縱軸值越高代表質量越好
圖中紅線表示中值
圖中藍色的細線是各個位置的平均值的連線
序列長度為51bp,那麼這51個位置每個位置Q值的平均值就是這條reads的質量值
# 該圖橫軸是0-40,表示Q值
縱軸是每個值對應的reads數目
這個樣本數據,測序結果主要集中在30-36中,證明測序質量很好!
橫軸是1 - 51 bp;縱軸是百分比
圖中四條線代表A T C G在每個位置平均含量
理論上來說,A和T應該相等,G和C應該相等,但是一般測序的時候,剛開始測序儀狀態不穩定,很可能出現上圖開頭的情況。
橫軸是0 - 100%; 縱軸是每條序列GC含量對應的數量
藍色的線是程序根據經驗分布給出的理論值,紅色是真實值,兩個應該比較接近才比較好
當測序儀器不能辨別某條reads的某個位置都是ATCG哪個鹼基時,就會產生"N",對所有reads的每個位置統計N的比率。
每次測序儀測出來的長度在理論上應該是完全相等的,但是總會有一些偏差
比如此圖中,51bp是主要的,但是還是有少量的50和52bp的長度
當測序的長度不同時,如果很嚴重,則表明測序儀在此次測序不成功
統計序列完全一樣的reads的頻率。橫坐標是plication的次數,縱坐標是plicated reads的數目
橫坐標為reads位置,縱坐標為Adapter序列佔比;如果fastqc默認參數會將所有的常見的Adapter都列出
正常情況是趨於0的直線,也就是說序列兩端Adapter已經去除干凈;如果有Adapter,需要先用cutadapt去接頭
https://www.jianshu.com/p/fe6af418a8bc
❿ 生物信息軟體
還有像treeView,RNA structure 3.5,MACAW等等