❶ 求生物信息学软件软件包EMBOSS
介个不是网上直接有下载的么,求啥子嘛,ftp://emboss.open-bio.org/pub/EMBOSS/,
❷ 生信菜狗,各种软件升级后前一版的包怎么装回来
可以先把现有的都卸载了
然后重装miniconda,因为科学计算的包一般都选conda的比较好,
然后就是不知道你是否熟悉虚拟环境,为了避免每次把你的环境搞乱,创建虚拟环境是最保险的
使用类似这样的命令
conda create -n vname
conda activate vname
❸ 生信自学网player是个什么东东,哪里能破解
这是一个视频文件播放软件,从图中看不需要破解的,又没有加密,是要你关联相关格式的视频文件而己
❹ 生物信息学一些基本的常用软件有哪些
必学:1、计算机基础(linux+perl+R 或者 python+matlab)
2、生信基础知识(测序+数据库+数据格式)
3、生信研究领域(全基因组,全转录组,全外显子组,捕获目标区域测序)
4、生信应用领域(肿瘤筛查,产前诊断,流行病学,个性化医疗)
分而治之:
一、计算机基础,需要看三本书,一步步的学会学通,不需要刻意去找哪个书,一般linux是鸟哥私房菜,perl是小骆驼咯,R是R in action,但是看一本书只能入门,真正想成为菜鸟,必须每个要看五本书以上!我云盘里面有这基本上的高清打印版,大家可以去淘宝打印一下才几十块钱还包邮,对书比较讲究的也可以买正版,也不过是一百多块钱而已!
二、生信基础知识,测序方面,在网络文库找十几篇一代二代三代测序仪资料仔细研读,然后去优酷下载各大主流测序仪的动画讲解,再看看陈巍学基因的讲解;数据库先看看三大主流数据库——NCBI,ENSEMBL,UCSC,还有一些也可以了解一些(uniprot,IMGT,KEGG,OMIN,TIGR,GO)同样也是网络文库自己搜索资料,但是这次需要自己去官网一个个页面点击看,一个个翻译成中文理解吃透;数据格式讲起了就多了,这个主要是在项目流程中慢慢学,或者你有机会去上课,不然你看来也是立马忘记的,主要有sam,vcf,fasta,fastq,bed,gtf,gff,genbank,ensembl,psl等等
三、生信研究领域,各个领域主要是软件繁多,合起来常用的估计有上百个软件了,一般只有从业五六年以上的人才有可能把它们全部用过一遍,而且这也完全需要项目来训练,而不能仅仅是看看软件手册,但是研究领域最重要的是背后的原理,需要看各大牛的综述。
a) 生信基础软件(blast++套件,fastqc,flash,blast,solexaQA,NGS-QC-toolkit,SRA-toolkit,fastx-toolkit)
b) snp-calling相关软件(bwa,bowtie,samtools,GATK,VarScan.jar,annovar)
c) 基因组相关软件(velvet,SOAPdenovo2,repeatmasker,repeatscount,piler,orthMCL,inparanoid,clustw,muscle,MAFFT,quickparanoid,blast2go,RAxML,phyML)
d) 转录组相关软件(trinity,tophat,cufflinks,RseQC,RNAseq,GOseq,MISO,RSEM,khmer,screed,trimmomatic,transDecoder,vast-tools,picard-tools,htseq,cuffdiff,edgeR,DEseq,funnet,davidgo,wego,kobas,KEGG,Amigo,go)
❺ 生物信息学常用的软件有哪些
NCBI(www.ncbi.nlm.nih.gov)-GenBank数据库
数据库相似性搜索——核酸序列与核酸数据库比较(BLASTN)
蛋白质序列与数据库中蛋白质序列比较(BLASTP)
两序列比对(Align two sequences)
DNA序列分析——ORF Finder(www.ncbi.nlm.nih.gov/gorf/gorf.html)
分析实验序列外显子部分——GENSCAN(http://genes.mit.e/GENSCAN.html)
分析实验序列的可能酶切位点——NEBcutter2.0 (http://tools.neb.com/NEBcutter2/index.php)
注: Custom digest -- view gel
限制性内切酶数据库——REBASE(http://rebase.neb.com/rebase/rebase.html)
设计引物扩增实验序列——Genefisher
Primer 3
蛋白质序列分析及结构预测:
1.预测蛋白质的分子量及等电点:ExPASy(Compute pI/Mw)
2.分析蛋白质的基本物理化学性质:ExPASy(ProtParam)
3.分析蛋白质的亲水性和疏水性:ExPASy(ProtScale)
4.分析蛋白质在各种蛋白酶和各种化学试剂处理后的内切产物:ExPASy(PeptideMass) [* :kinase K]
5.分析蛋白质的信号肽:ExPASy(SignalP)
6.预测蛋白质的二级结构:ExPASy(Jpred 3)
多物种分子系统发育分析:EMBL(www.ebi.ac.uk/embl/)--Toolbox--Clustal2W
人脂联素蛋白质序列:NP_004788
人类胰岛素生长因子IB前体:P05019
❻ 用于生物信息分析该如何安装ubuntu系统
1. 生信软件系统的选择——Linux(ubuntu)
对于生信分析人员来说,日常工作,软件运行,跑流程,均在linux下操作。当然,也有基于云端的生信分析平台,如免费的Galaxy,或者某些 公司的一站式云平台。
比较初学者学生物信息还是使用开源软件、学原理、一步一步运行才有意思。这路子,一定要适应Linux的命令行界面。
选择windows还是linux? 一定是linux,windows太多的生物软件不兼容了。
选择linux的哪个版本?推荐桌面版的Ubuntu——稳定,美观,适合初学者之称;次之,Centos——免费、稳定的服务器linux版本之称。
用那种方式安装linux好?推荐虚拟机安装。不太建议双系统,云端这种。因为,对于初学者在系统中,需要反复折腾,测试,搞垮系统是常事。
选择开源的VMbox还是商业版VMware?两者都可以,但各有缺点。VMbox更新比较快,经常更新后,可能会出现报错,系统无法打开的现象,较低版本的反而比较稳定,如果用好了,不建议经常更新。还有一点是,VMbox在鼠标控制上,没有VMware流畅。VMware十分稳定,流程好用。最新版一般要收费。可以选择比最新版版本稍低的,上网搜注册码,免费使用。还是那样,用好了,不要经常更新。某些生信软件会提供VMbox的镜像,如qiime。
VMbox的镜像能不能转到VMware上使用?,答案是可以的,使用VMbox的镜像导出功能,然后使用VMware进行导入,保持两者格式相同。
❼ 生物信息学安装哪个版本的linux
本人自大三就开始做生物信息,现在即将读博士,希望我的经验可以帮助到你。
既然你是想做生物信息学,那么相关背景什么的会了解一些,我在这就不多说了。
首先,确定你自己的背景专业,现在很多学校本科都没有专门的生物信息学专业,都是挂靠在生命学院或者计算机学院的。所以背景专业一般都是生物学或计算机学,不同的专业将来做生信区别会很大。当然,做什么方向和背景专业并没有绝对关系。
如果是生物学背景,那么将来大部分的工作将会是使用专门的生物信息学分析软件。所以难度会降低。自学的话,主要学几下几点就好:
1、一门脚本语言,个人推荐Python(Perl也可以,各有利弊,Python更新兴一些)。
2、Linux系统。这个也不是百分百要求,但是专业的生信人,都是用Linux的,而且很多软件都是不支持Windows的。
3、常用的生物信息学数据库,这里列出几个,NCBI,Ensembl,EBI,GENEbank等等,这些数据库下面还分子数据库,像GEO,GWAS catalog等。当然,还有方向更细的,像miRBase(miRNA数据库)等。
4、R,这也是一种编程语言,但更加侧重结果的展示,实际上也就是画图。
5、常用生信分析软件,这个没必要专门去学,需要用到他们的时候再学也不晚,都是很简单的东西。
如果是计算机背景,那么以后的工作可能主要是算法分析,创造新的生信分析软件,做数据库等。需要自学的就是以上的那些,再加一门工程语言,C,C++,C#,Java都可以。
❽ 生信软件是不是诈骗
不是。生信软件是生物信息学,是研究生物信息的采集、处理、存储、传播、分析和解释等各方面的学科软件,是经过专业机构审核的正规软件,不是诈骗,用户可以放心使用。
❾ 生信笔记2-fastqc的安装和使用
fastqc是查看转录组数据质量的软件
运行结束后生成两个文件一个.html网页文件,一个是.zip压缩文件,只看html网页文件就可以了
Filename:指的是进行质控的文件名
Encoding:指测序平台的版本和相应的编码版本号
Total Sequences:指reads的数量
Sequence length:指测序的长度
%GC 指整体序列中的GC含量
此图中的横轴是测序序列第1个碱基到第151个碱基
纵轴是质量得分,Q = -10*log10(error P)即20表示0.01的错误率,30表示0.001,纵轴值越高代表质量越好
图中红线表示中值
图中蓝色的细线是各个位置的平均值的连线
序列长度为51bp,那么这51个位置每个位置Q值的平均值就是这条reads的质量值
# 该图横轴是0-40,表示Q值
纵轴是每个值对应的reads数目
这个样本数据,测序结果主要集中在30-36中,证明测序质量很好!
横轴是1 - 51 bp;纵轴是百分比
图中四条线代表A T C G在每个位置平均含量
理论上来说,A和T应该相等,G和C应该相等,但是一般测序的时候,刚开始测序仪状态不稳定,很可能出现上图开头的情况。
横轴是0 - 100%; 纵轴是每条序列GC含量对应的数量
蓝色的线是程序根据经验分布给出的理论值,红色是真实值,两个应该比较接近才比较好
当测序仪器不能辨别某条reads的某个位置都是ATCG哪个碱基时,就会产生"N",对所有reads的每个位置统计N的比率。
每次测序仪测出来的长度在理论上应该是完全相等的,但是总会有一些偏差
比如此图中,51bp是主要的,但是还是有少量的50和52bp的长度
当测序的长度不同时,如果很严重,则表明测序仪在此次测序不成功
统计序列完全一样的reads的频率。横坐标是plication的次数,纵坐标是plicated reads的数目
横坐标为reads位置,纵坐标为Adapter序列占比;如果fastqc默认参数会将所有的常见的Adapter都列出
正常情况是趋于0的直线,也就是说序列两端Adapter已经去除干净;如果有Adapter,需要先用cutadapt去接头
https://www.jianshu.com/p/fe6af418a8bc
❿ 生物信息软件
还有像treeView,RNA structure 3.5,MACAW等等