Ⅰ MicroRNA靶基因的預測軟體有哪些
採用的演算法不同,第一代預測軟體大多都是從種子互補這一規則出發設計演算法,其次是考慮到miRNA靶基因跨物種間保守性;而第二代預測軟體更傾向於機器學習方法訓練參數進行靶基因預測。現在多採用第二代target預測方法。
Ⅱ 求助,哪些軟體可以預測轉錄因子靶基因
最近開始做實驗,我研究的是兩個目的蛋白A和B,初步估計兩者在組織中表達是呈相反的趨勢,即A的表達為上調,而B的表達是降低,那麼我想研究兩者的是否具有相互作用,我可否先通過一些生物信息學軟體(主要現在要開題了,來不及做實驗,怕被批說立論依據不足)來預測B就是A的靶基因,以及潛在的可能的作用位點,然後可以進一步通過實驗來證實(我所知道的只有染色質免疫共沉澱,還有哪些方法呢?)我看關於mirna的就有很多生物信息學軟體可以來預測下游靶基因,如果不是mirna,兩個都是轉錄因子的話,有哪些軟體可以用呢?
謝謝大家!
Ⅲ 誰用過Augustus基因預測軟體
Augustus的安裝和使用參數
AUGUSTUS is a program that predicts genes in eukaryotic genomic sequences.
1. Augustus的安裝
Augustus下載:bioinfuni-greifswaldde/augustus/binaries/
$ wget bioinfuni-greifswaldde/augustus/binaries/augustus.2.7.tar.gz
$ tar zxf augustus.2.7.tar.gz
$ cd augustus.2.7
$ cd src
$ make -j 8
$ export AUGUSTUS_CONFIG_PATH=$PWD/../config/ (可以加入到.bashrc中)
2. Augustus使用方法
2.1 基因預測例子
$ augustus --strand=both --genemode=partial --singlestrand=false --hintsfile=hints.gff --extrinsicCfgFile=extrinsic.cfg --protein=on --introns=on --start=on --stop=on --cds=on --codingseq=on --alternatives-from-evidence=true --gff3=on --UTR=on ----outfile=out.gff --species=human genome.fa
$ augustus --noprediction=true --species=SPECIES sequences.gb
2.2 Augustus使用參數
Usage:
augustus [parameters] --sepcies=SPECIES queryfilename
重要參數:
--strand=both, --strand=forward or --strand=backward report predicted genes on both strands, just the forward or just the backward strand.default is 'both'
--genemodel=partial, --genemodel=intronless, --genemodel=complete,
--genemodel=atleastone or --genemodel=exactlyone partial : allow prediction of incomplete genes at the sequence boundaries (default) intronless : only predict single-exon genes成都網路整合運營推廣http://www.yingtaow.com/wltg?like in prokaryotes and some eukaryotes
complete : only predict complete genes atleastone : predict at least one complete gene exactlyone : predict exactly one complete gene
--singlestrand=true predict genes independently on each strand, allow overlapping genes on opposite strands. This option is turned off by default.
--hintsfile=hintsfilename When this option is used the prediction considering hints (ex trinsic information) is turned on. hintsfilename contains the hints in gff format.
--extrinsicCfgFile=cfgfilename Optional. This file contains the list of used sources for the hints and their boni and mali. If not specified the file "extrin sic.cfg" in the config directory $AUGUSTUS_CONFIG_PATH is used.
--maxDNAPieceSize=n This value specifies the maximal length of the pieces that the sequence is cut into for the core algorithm (Viterbi) to be run. Default is --maxDNAPieceSize=200000.
AUGUSTUS tries to place the boundaries of these pieces in the intergenic region, which is inferred by a preliminary prediction. GC-content dependent parameters are chosen for each piece of DNA
if /Constant/decomp_num_steps > 1 for that species. This is why this value should not be set very large, even if you have plenty of memory.
--protein=on/off
--introns=on/off
--start=on/off
--stop=on/off
--cds=on/off
--codingseq=on/off Output options. Output predicted protein sequence, introns, start codons, stop codons. Or use 'cds' in addition to 'initial', 'internal', 'terminal' and 'single' exon.
The CDS excludes the stop codon (unless stopCodonExcludedFromCDS=false) whereas the terminal and single exon include the stop codon.
--AUGUSTUS_CONFIG_PATH=path path to config directory (if not specified as environment var iable)
--alternatives-from-evidence=true/false report alternative transcripts when they are suggested by hints
--alternatives-from-sampling=true/false report alternative transcripts generated through probabilistic sampling
--sample=n --minexonintronprob=p --minmeanexonintronprob=p --maxtracks=n --proteinprofile=filename Read a protein profile from file filename. See section 7 below.
--predictionStart=A, --predictionEnd=B A and B define the range of the sequence for which predictions should be found. Quicker if you need predictions only for a small part.
--gff3=on/off output in gff3 format.
--UTR=on/off predict the untranslated regions in addition to the coding sequence. This currently works only for human, galdieria, toxopl asma and caenorhabditis.
--outfile=filename print output to filename instead to standard output. This is useful for computing environments, e.g. parasol jobs, which do not allow shell redirection.
--noInFrameStop=true/false Don't report transcripts with in-frame stop codons. Otherwise, intron-spanning stop codons could occur. Default: false
--noprediction=true/false
If true and input is in genbank format, no prediction is made.
Useful for getting the annotated protein sequences. Augustus也可以以 genebank格式文件為輸入文件,進行基因預測,並將預測結果和genebank的結果進行比較後 得出一個精確性的統計結果。
當然,由於genebank格式文件中有些sequences沒有cds的注釋結果,因此可以使用該 參數進行檢測,從而得到沒有cds的序列號,在人為去去除這些沒有cds注釋的序列,再去進行 預測准確性的評估。
--contentmodels=on/off If 'off' the content models are disabled (all emissions unif ormly 1/4). The content models are; coding region Markov chain (emiprobs),
initial k-mers in coding region (Pls), intron and int ergenic regin Markov chain. This option is intended for special applications that require judging gene structures from the signal models only,
e.g. for predicting the effect of SNPs or mutations on splicing. For all typical gene predictions, this should be true. Default: on
--paramlist For a complete list of parameters, type "augustus --paramlist"
Ⅳ 有誰知道預測基因甲基化應該用什麼軟體
http://www.51qe.cn/pic/55/13/11/006.htm
http://www.hyper.com/
http://www.buygood.net/soft/Catalog35/34671.html
http://www.51qe.cn/pic/55/13/11/006.htm
http://www.hyper.com/
http://www.buygood.net/soft/Catalog35/34671.html
http://www.51qe.cn/pic/55/13/11/006.htm
http://class.ibucm.com/zyhuaxue/5/con5_5213.htm http://www.51qe.cn/pic/55/13/11/006.htm
http://www.hyper.com/
http://www.buygood.net/soft/Catalog35/34671.html
http://www.51qe.cn/pic/55/13/11/006.htm
http://www.hyper.com/
http://www.buygood.net/soft/Catalog35/34671.html
http://www.51qe.cn/pic/55/13/11/006.htm
http://class.ibucm.com/zyhuaxue/5/con5_5213.htm
Ⅳ 基因組分析軟體
樓主的基因組序列是真核還是原核的?真核和原核的分析軟體不一樣:
glimmer 預測系統先用 build-icm 程序對該物種已知的基因序列生成一個馬爾可夫模型參數集合,glimmer2 再應用這個參數集對 DNA 序列進行基因預測。此軟體適合對原核生物進行預測;http://www.cbcb.umd.e/software/glimmer/glimmer302.tar.gz
GlimmerM 是 TIGR 開發的用於真核生物基因預測的軟體。該 軟 件 包 可 以 從 TIGR 的 網 站 上 免 費 下 載 , 下 載 網 站 鏈 接 :
ftp://ftp.tigr.org/pub/software/GlimmerM/
GenScan 是由美國麻省理工大學的 Burge 和 Karlin 於 1997 年開發的,基於廣義隱馬爾可夫模型的人類及脊椎動物基因預測軟體。它不依賴於已有的蛋白庫,是一種"從頭預測"的軟體。目前還開發了適用於果蠅、擬南芥和玉米的專用版本,對於其他物種可以先採用相近的物種版本來預測。 總體來說,對中間外顯子預測的准確性高於起始外顯子和末端外顯子,外顯子的准確性高於 polyA 或啟動子。該 軟 件 的 可 執 行 版 本 可 以 從 Burge 實 驗 室 的 網 站 上 免 費 下 載 , 下 載 網 站 鏈 接 :
http://genes.mit.e/GENSCAN.html
還有很多我就不一一列舉了,要熟練使用這些軟體,要需要多多訓練,祝好
Ⅵ 深度測序的主要軟體有哪些華大基因測序的結果一般要怎麼處理
主要有兩類,一類是基於overlap graph的組裝軟體,有CABOG、ARACHNE、RePS、phrap及newbler等; 另一類是基於de bruijn graph的組裝軟體,有SOAPdenovo、Velvet、ALLPATHS、ABySS等。
說的華大基因測序的主要分析方法要看您做什麼了。。。高通量測序現在國內做的人多了去了,如果被人店大欺客的話,可以找我們
Ⅶ 基因預測還有哪些軟體,各有什麼有特點
4 種真核生物基因預測軟體: Genscan,HMMgene,Fgenesh,Twinscan 3 種原核生物基因預測軟體 : Genemark,Glimmer,fgenes。
Ⅷ 生物信息學常用的軟體有哪些
NCBI(www.ncbi.nlm.nih.gov)-GenBank資料庫
資料庫相似性搜索——核酸序列與核酸資料庫比較(BLASTN)
蛋白質序列與資料庫中蛋白質序列比較(BLASTP)
兩序列比對(Align two sequences)
DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html)
分析實驗序列外顯子部分——GENSCAN(http://genes.mit.e/GENSCAN.html)
分析實驗序列的可能酶切位點——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php)
註: Custom digest -- view gel
限制性內切酶資料庫——REBASE(http://rebase.neb.com/rebase/rebase.html)
設計引物擴增實驗序列——Genefisher
Primer 3
蛋白質序列分析及結構預測:
1.預測蛋白質的分子量及等電點:ExPASy(Compute pI/Mw)
2.分析蛋白質的基本物理化學性質:ExPASy(ProtParam)
3.分析蛋白質的親水性和疏水性:ExPASy(ProtScale)
4.分析蛋白質在各種蛋白酶和各種化學試劑處理後的內切產物:ExPASy(PeptideMass) [* :kinase K]
5.分析蛋白質的信號肽:ExPASy(SignalP)
6.預測蛋白質的二級結構:ExPASy(Jpred 3)
多物種分子系統發育分析:EMBL(www.ebi.ac.uk/embl/)--Toolbox--Clustal2W
人脂聯素蛋白質序列:NP_004788
人類胰島素生長因子IB前體:P05019