㈠ 融合转录本的检测软件对比(NGS)
融合转录本由融合基因(DNA水平)或可变剪切事件产生(RNA水平)。
Figure 1. Figures to explain terminology. (A) Intact exon (IE) type and broken exon (BE) type fusion transcripts; (B) spanning read, split read and anchor length; (C) short and long insert size of DNA fragment for sequencing.
1)Intact exon (IE) type fusion,是指融合后完整的保留了原来的外显子,未影响原来的外显子结构。如上图A中Gene A的Exon2和Gene B的Exon1融合后完整的保留了两个外显子的序列;
2)Broken exon (BE) type fusion,是指融合后没有保留原来完整的外显子序列。如上图A中 Gene A的Exon3的部分序列和Gene B的Exon2融合在一起,融合后的新基因中,来自Gene A的Exon3丢失了部分序列;
3)Breakpoint,是指两个融合基因在基因组上发生融合的位置,如上图B中Gene A(蓝色)和Gene B(绿色)融合的位点;
4)Spanning read,是指跨越融合位点分别匹配到两个融合基因的paired-end read,比如上图B中的匹配到Gene A(蓝色)和Gene B(绿色)的一对read;
5)Split read,是指恰好匹配到融合位点上的read,具体如上图B中右侧图所示;
6)Anchor length,是指跨越融合位点的read左端和右端的长度,具体如上图B中右侧图所示;
7)short insert size,一般是指双端测序paired-end sequencing中,两个read中间间隔的较短距离,一般为几百bp;
8)long insert size,一般是指双端测序mate-pair sequencing中,两个read中间间隔的较长距离,一般为几kb甚至更长;
基因融合鉴定软件的开发,一般就是基于上面提到的这些术语,采用相应的算法来设计的。
Liu S, Tsai W, Ding Y, et al. Comprehensive evaluation of fusion transcript detection algorithms and a meta-caller to combine top performing methods in paired-end RNA-seq data[J]. Nucleic Acids Research, 2016, 44(5).
https://zhuanlan.hu.com/p/84928559
㈡ 基因预测还有哪些软件,各有什么有特点
4 种真核生物基因预测软件: Genscan,HMMgene,Fgenesh,Twinscan 3 种原核生物基因预测软件 : Genemark,Glimmer,fgenes。
㈢ 最新最好用geNorm、normfinder、bestkeeper 内参基因软件使用方法
实时荧光定量PCR(RT-qPCR)由于具备灵敏度高、重复性好、特异性强及高通量等优点,已经成为研究基因表达分析的常用方法[1-2]。实时荧光定量PCR分为绝对定量和相对定量,在进行相对定量分析时不需要已知量的标准品,因而该方法被经常运用,但该方法需要用内参基因对目的基因进行数据校正,才能获得精确的结果[3-4]。
肌动蛋白基因(ACT)、3-磷酸甘油醛脱氢酶基因(GAPD H)、18S rRNA、转录延伸因子基因(EF-1α)、多聚泛素酶基因(UBQ)、α微管蛋白基因(TUA)和β微管蛋白基因(TUB)等看家基因在之前的研究中常常被当作内参基因进行使用[5-8]。然而,越来越多的研究表明,在某种试验稳定表达的内参基因,在另一种试验中有可能是变化的[9-11],而在任何试验条件下都能稳定表达的内参基因几乎不存在[12-13]。如果仅仅根据文献报道使用某个常用的内参基因,不仅可能导致试验结果的不准确性,甚至可能导致结论的错误。因此,本着严谨的科学态度,科研工作者首先必须从众多的内参基因中筛选出在各自试验条件下较为稳定的内参基因。
geNorm、NormFinder和BestKeeper是专门用于筛选内参基因稳定性的软件,但这3种软件的使用方法和分析的侧重点各不一样,为了让相关科研人员快速了解并掌握这3种软件的使用方法,笔者结合自身使用这些软件的经历,详细介绍了这3种软件的使用要点,以期为相关科研人员分析内参基因稳定性提供便利。
1geNorm软件
1.1软件概述
geNorm软件是Vandesompele等[14]在2002年编写的专门用于实时荧光定量PCR中筛选内参基因及确定最适内参基因数目的程序,该程序可以用于筛选任何试验的任意数目的内参基因,并最终挑选出2个或2个以上的内参基因组合来校正数据,可使相对定量的结果更为精确。geNorm 程序通过计算出每个内参基因稳定性的M值来筛选出稳定性较好的内参基因,判定标准为M值越小内参基因稳定性越好,反之,则稳定性越差。该软件还可计算引入1个新的内参基因后标准化因子的配对变异V值,并根据V n/V n+1值来确定所需最适内参基因的数目。默认的V值为0.15(该值可以人为稍作调整),如果V n/V n+1值<0.15,则最适内参基因的数量是n个;而如果V n/V n+1值>0.15,则最适内参基因的数量是n+1个。
1.2操作流程
1.2.1修改Excel表格安全性级别。若geNorm软件打开后不能正常运行时,可能是由于Excel表格默认宏的安全性级别设置的比较高,这时需要将Excel表格安全性级别更改到最低级别。更改方法为点击Excel表格中的“工具”按钮,然后点击其下拉菜单“宏”的子菜单“安全性”选项,在弹出来的“安全性”对话框中将安全级别设置为最低。
1.2.2计算△Ct值。先找到该基因在所有样品中最小的Ct (Cycle threshold)值(表达量最高),再用其他样品的Ct值减
利用geNorm、NormFinder和BestKeeper软件进行内参基因稳定性
分析的方法
吴建阳1何冰1杜玉洁1李伟才2魏永赞2*
(1岭南师范学院基础教育学院,广东湛江524037;2农业部热带果树生物学重点实验室,中国热带农业科学院南亚热带作物研究所)摘要实时荧光定量PCR(RT-qPCR)由于具备灵敏度高、重复性好、特异性强及高通量等优点,已经成为研究基因表达分析的常用方
法,但其结果的准确性取决于内参基因。在任何试验条件下都能稳定表达的内参基因几乎不存在,科研工作者为了获得精准的试验结果,首先必须从众多的内参基因中筛选出稳定的内参基因。geNorm、NormFinder和BestKeeper等是专门用于筛选稳定性内参基因的软件,但这3种软件使用方法差异很大,为了让更多的科研人员了解这些软件、节省时间,笔者结合自己的科研经验详细介绍了这3种软件的使用方法,以期为相关科研人员利用这些软件筛选内参基因提供便利。
关键词内参基因;稳定性分析;geNorm;NormFinder;BestKeeper
中图分类号S60文献标识码A文章编号1007-5739(2017)05-0278-04
㈣ Corset轻松搞定无参转录组差异基因(转载)
原文: http://www.novogene.com/tech/suppor/gene-calss/comprehensive/1651.html
Corset特点
无参考基因组的转录组项目分析中,常用方法是 利用Trinity软件进行 de novo * 组装拼接,经过“茧-蛹-蝶”三个步骤,获得转录本序列,这些转录本序列作为后续分析的参考序列。取每条基因中最长的转录本作为unigene,以此进行后续的注释、定量、差异表达分析。再使用获得的差异表达基因,进行GO、KEGG等富集分析,就可以获知与表型相关的信号通路及基因了。*但是仅用最长的一条转录本,不能代表全部的isoform,也不能反映出不同样品间isoform的表达变化。unigene的方法甚至会漏掉一些差异表达的isoform, Corset [1] 可以解决这个问题(图1)。
Corset的优势
以图3为例,ATP5J和GABPA两个基因有一段重叠的部分。当使用无参拼接时,会得到8条转录本,其中3条最长的转录本为拼接引起的假阳性转录本(如cluster b中的转录本)。若使用unigene的方法,根据unigene最长转录本原则,会选取假阳性转录本进行后续分析,这并不准确。而使用Corset聚合“Gene”的方法,可以将这些真实的转录本分离出来(如cluster a和cluster d)(图3)。
此外Corset在差异表达分析中也有亮点。表1是以有参考基因组数据为标准,将 de novo 拼接数据与该标准进行相关性分析 [1] ,结果越接近1,则数据越接近基于参考基因组的结果(即真实结果)。通过比较 de novo 拼接的三种处理,No Clustering为全部转录本数据,unigene为最长的转录本数据,“Gene”为用Corset聚合转录本数据。结果显示“Gene”提供了更准确的差异表达分析结果,尤其是在鸡 [2] 、人 [3] 等转录组复杂的物种,而对最小可变剪切酵母 [4] 影响较小,表明”Gene”的方法对isoform多的物种更具优势(表1)。
Corset的原理
Corset是Trinity官方推荐的软件。其在Trinity拼接基础上,根据转录本间Shared Reads将转录本聚合为许多cluster,再结合不同样本间的转录本表达水平及H-Cluster算法,将样本间有表达差异的转录本从原cluster分离,建立新的cluster,最终每个cluster被定义为“Gene”。该方法聚合冗余转录本,并提高差异表达基因的检出率(图2)。
Corset的应用
Corset已经被用于解决高等动物如转录组复杂生物,海洋生物如三刺鱼、红螯虾,昆虫如白蛉等无参物种的科学研究问题(表2)。
参考文献
[1] Davidson N M, Oshlack A. Corset: enabling differential gene expression analysis for de novo assembled transcriptomes[J]. Genome Biology, 2014, 15(7):1-14.
[2] Ayers K L, Davidson N M, Demiyah D, et al . RNA sequencing reveals sexually dimorphic gene expression before gonadal differentiation in chicken and allows comprehensive annotation of the W-chromosome[J]. Genome Biology, 2013, 14(3):1-17.
[3] Trapnell C, Hendrickson D G, Sauvageau M, et al . Differential analysis of gene regulation at transcript resolution with RNA-seq[J]. Nature Biotechnology, 2013, 31(1):46-53.
[4] Nookaew I. A comprehensive comparison of RNA-Seq-based transcriptome analysis from reads to differential gene expression and cross-comparison with microarrays: a case study in Saccharomyces cerevisiae[J]. Nucleic Acids Research, 2012, 40(20):10084–10097.
[5] Hébert F O, Grambauer S, Barber I, et al . Transcriptome sequences spanning key developmental states as a resource for the study of the cestode Schistocephalus solis, a threespine stickleback parasite[J]. Gigascience, 2016, 5(1):1-9.
[6] Tan M H, Gan H M, Gan H Y, et al . Firstcomprehensive multi-tissue transcriptome of Cherax quadricarinatus (Decapoda:Parastacidae) reveals unexpected diversity of endogenous cellulase[J].Organisms Diversity & Evolution, 2016, 16(1): 185-200.
[7] Petrella V, Aceto S, Musacchia F, et al . De novo, assembly and sex-specific transcriptome profiling in the sand fly Phlebotomus perniciosus, (Diptera, Phlebotominae), a major Old World vector of Leishmania infantum[J]. Bmc Genomics, 2015, 16(1):1-15.
㈤ 全长转录本与参考基因组比对
长读长测序技术的突破使得转录本结构鉴定、可变剪切等分析更为准确。上一期我们介绍了Iso-seq方法鉴定全长转录本: 全长转录本鉴定 。全长转录本鉴定之后,如何更精确地对全长转录本进行参考基因组比对分析,精确识别出基因异构体,是Iso-seq下游分析的关键。近几年,已经开发出多款用于三代长读长reads的比对软件,如GMAP、minimap2、deSALT等软件,可以较好地用于比对分析,下面我们具体看一下这些比对软件的使用。
传统的使用比较多的长读长比对软件是GMAP,05年发表公布,最开始是用来比对低通量的est序列的,后来也有进一步升级为GSNAP支持高通量的二代测序。PacBio测序技术出现后,常用于Iso-seq转录本的鉴定,目前仍是相关研究引用量最高的比对软件,该软件也一直在持续更新升级。其可以将转录本序列与参考基因组序列比对,输出gff文件,比对速度稍慢,其使用方法如下:
Minimap2是生信大牛李恒18年用C语言开发的可以用于三代数据(subreads、iso-seq)比对的长序列比对软件,与传统的三代比对工具GMAP相比,其速度有非常显着的提升,当然同时消耗的内存也比较大。使用方法也比较简单,近几年引用次数增长的也很迅速,所以大家可以试试用minimap2进行Iso-seq的比对。其使用方法如下:
deSALT是19年底哈尔滨工业大学王亚东团队开发的一款专门针对于三代长reads测序的比对软件,主要可以处理四种数据类型:
该软件可以构造基于图的比对骨架以推断外显子,并使用它们来生成剪接的参考序列以产生精确的比对,更好的解决了小外显子和测序错误的问题。其使用方法如下:
还有两款软件,STAR以及BLAT也可以用于长读长reads的比对,这两款软件比较早,相信大家也有所了解,虽然可用于长读长reads的比对,但这两款软件并不是专门为三代测序reads比对开发的,所以大家在做Iso-seq分析时,可以更多考虑使用上文介绍的三款。
Wu T D, Watanabe C K. GMAP: a genomic mapping and alignment program for mRNA and EST sequences[J]. Bioinformatics, 2005, 21(9): 1859-1875.
Li, H. (2018). Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. doi:10.1093/bioinformatics/bty191
https://github.com/lh3/minimap2
Liu, B., Liu, Y., Li, J. et al. deSALT: fast and accurate long transcriptomic read alignment with de Bruijn graph-based index. Genome Biol 20, 274 (2019). https://doi.org/10.1186/s13059-019-1895-9
㈥ 求助,哪些软件可以预测转录因子靶基因
最近开始做实验,我研究的是两个目的蛋白A和B,初步估计两者在组织中表达是呈相反的趋势,即A的表达为上调,而B的表达是降低,那么我想研究两者的是否具有相互作用,我可否先通过一些生物信息学软件(主要现在要开题了,来不及做实验,怕被批说立论依据不足)来预测B就是A的靶基因,以及潜在的可能的作用位点,然后可以进一步通过实验来证实(我所知道的只有染色质免疫共沉淀,还有哪些方法呢?)我看关于mirna的就有很多生物信息学软件可以来预测下游靶基因,如果不是mirna,两个都是转录因子的话,有哪些软件可以用呢?
谢谢大家!
㈦ 基因转录与翻译的运载工具
你说的运载工具是不是说运载底物的物质?
转录的时候加入核糖核苷酸是不需要运载工具的,是靠底物分子本身的浓度,随机加入到延伸中的RNA中。加入的碱基可以和RNA中的碱基互补配对,相互识别,直接作用。
翻译就不同了,翻译是将RNA的碱基序列转换为氨基酸序列,这两者之间没有所谓的互补配对原则,因此需要有一种中间载体来完成一一配对。这个载体就是tRNA。TRNA一端识别氨基酸,一边识别对应的RNA密码子,这样就是RNA携带的信息正确的转入蛋白质中。