㈠ 融合轉錄本的檢測軟體對比(NGS)
融合轉錄本由融合基因(DNA水平)或可變剪切事件產生(RNA水平)。
Figure 1. Figures to explain terminology. (A) Intact exon (IE) type and broken exon (BE) type fusion transcripts; (B) spanning read, split read and anchor length; (C) short and long insert size of DNA fragment for sequencing.
1)Intact exon (IE) type fusion,是指融合後完整的保留了原來的外顯子,未影響原來的外顯子結構。如上圖A中Gene A的Exon2和Gene B的Exon1融合後完整的保留了兩個外顯子的序列;
2)Broken exon (BE) type fusion,是指融合後沒有保留原來完整的外顯子序列。如上圖A中 Gene A的Exon3的部分序列和Gene B的Exon2融合在一起,融合後的新基因中,來自Gene A的Exon3丟失了部分序列;
3)Breakpoint,是指兩個融合基因在基因組上發生融合的位置,如上圖B中Gene A(藍色)和Gene B(綠色)融合的位點;
4)Spanning read,是指跨越融合位點分別匹配到兩個融合基因的paired-end read,比如上圖B中的匹配到Gene A(藍色)和Gene B(綠色)的一對read;
5)Split read,是指恰好匹配到融合位點上的read,具體如上圖B中右側圖所示;
6)Anchor length,是指跨越融合位點的read左端和右端的長度,具體如上圖B中右側圖所示;
7)short insert size,一般是指雙端測序paired-end sequencing中,兩個read中間間隔的較短距離,一般為幾百bp;
8)long insert size,一般是指雙端測序mate-pair sequencing中,兩個read中間間隔的較長距離,一般為幾kb甚至更長;
基因融合鑒定軟體的開發,一般就是基於上面提到的這些術語,採用相應的演算法來設計的。
Liu S, Tsai W, Ding Y, et al. Comprehensive evaluation of fusion transcript detection algorithms and a meta-caller to combine top performing methods in paired-end RNA-seq data[J]. Nucleic Acids Research, 2016, 44(5).
https://zhuanlan.hu.com/p/84928559
㈡ 基因預測還有哪些軟體,各有什麼有特點
4 種真核生物基因預測軟體: Genscan,HMMgene,Fgenesh,Twinscan 3 種原核生物基因預測軟體 : Genemark,Glimmer,fgenes。
㈢ 最新最好用geNorm、normfinder、bestkeeper 內參基因軟體使用方法
實時熒光定量PCR(RT-qPCR)由於具備靈敏度高、重復性好、特異性強及高通量等優點,已經成為研究基因表達分析的常用方法[1-2]。實時熒光定量PCR分為絕對定量和相對定量,在進行相對定量分析時不需要已知量的標准品,因而該方法被經常運用,但該方法需要用內參基因對目的基因進行數據校正,才能獲得精確的結果[3-4]。
肌動蛋白基因(ACT)、3-磷酸甘油醛脫氫酶基因(GAPD H)、18S rRNA、轉錄延伸因子基因(EF-1α)、多聚泛素酶基因(UBQ)、α微管蛋白基因(TUA)和β微管蛋白基因(TUB)等看家基因在之前的研究中常常被當作內參基因進行使用[5-8]。然而,越來越多的研究表明,在某種試驗穩定表達的內參基因,在另一種試驗中有可能是變化的[9-11],而在任何試驗條件下都能穩定表達的內參基因幾乎不存在[12-13]。如果僅僅根據文獻報道使用某個常用的內參基因,不僅可能導致試驗結果的不準確性,甚至可能導致結論的錯誤。因此,本著嚴謹的科學態度,科研工作者首先必須從眾多的內參基因中篩選出在各自試驗條件下較為穩定的內參基因。
geNorm、NormFinder和BestKeeper是專門用於篩選內參基因穩定性的軟體,但這3種軟體的使用方法和分析的側重點各不一樣,為了讓相關科研人員快速了解並掌握這3種軟體的使用方法,筆者結合自身使用這些軟體的經歷,詳細介紹了這3種軟體的使用要點,以期為相關科研人員分析內參基因穩定性提供便利。
1geNorm軟體
1.1軟體概述
geNorm軟體是Vandesompele等[14]在2002年編寫的專門用於實時熒光定量PCR中篩選內參基因及確定最適內參基因數目的程序,該程序可以用於篩選任何試驗的任意數目的內參基因,並最終挑選出2個或2個以上的內參基因組合來校正數據,可使相對定量的結果更為精確。geNorm 程序通過計算出每個內參基因穩定性的M值來篩選出穩定性較好的內參基因,判定標准為M值越小內參基因穩定性越好,反之,則穩定性越差。該軟體還可計算引入1個新的內參基因後標准化因子的配對變異V值,並根據V n/V n+1值來確定所需最適內參基因的數目。默認的V值為0.15(該值可以人為稍作調整),如果V n/V n+1值<0.15,則最適內參基因的數量是n個;而如果V n/V n+1值>0.15,則最適內參基因的數量是n+1個。
1.2操作流程
1.2.1修改Excel表格安全性級別。若geNorm軟體打開後不能正常運行時,可能是由於Excel表格默認宏的安全性級別設置的比較高,這時需要將Excel表格安全性級別更改到最低級別。更改方法為點擊Excel表格中的「工具」按鈕,然後點擊其下拉菜單「宏」的子菜單「安全性」選項,在彈出來的「安全性」對話框中將安全級別設置為最低。
1.2.2計算△Ct值。先找到該基因在所有樣品中最小的Ct (Cycle threshold)值(表達量最高),再用其他樣品的Ct值減
利用geNorm、NormFinder和BestKeeper軟體進行內參基因穩定性
分析的方法
吳建陽1何冰1杜玉潔1李偉才2魏永贊2*
(1嶺南師范學院基礎教育學院,廣東湛江524037;2農業部熱帶果樹生物學重點實驗室,中國熱帶農業科學院南亞熱帶作物研究所)摘要實時熒光定量PCR(RT-qPCR)由於具備靈敏度高、重復性好、特異性強及高通量等優點,已經成為研究基因表達分析的常用方
法,但其結果的准確性取決於內參基因。在任何試驗條件下都能穩定表達的內參基因幾乎不存在,科研工作者為了獲得精準的試驗結果,首先必須從眾多的內參基因中篩選出穩定的內參基因。geNorm、NormFinder和BestKeeper等是專門用於篩選穩定性內參基因的軟體,但這3種軟體使用方法差異很大,為了讓更多的科研人員了解這些軟體、節省時間,筆者結合自己的科研經驗詳細介紹了這3種軟體的使用方法,以期為相關科研人員利用這些軟體篩選內參基因提供便利。
關鍵詞內參基因;穩定性分析;geNorm;NormFinder;BestKeeper
中圖分類號S60文獻標識碼A文章編號1007-5739(2017)05-0278-04
㈣ Corset輕松搞定無參轉錄組差異基因(轉載)
原文: http://www.novogene.com/tech/suppor/gene-calss/comprehensive/1651.html
Corset特點
無參考基因組的轉錄組項目分析中,常用方法是 利用Trinity軟體進行 de novo * 組裝拼接,經過「繭-蛹-蝶」三個步驟,獲得轉錄本序列,這些轉錄本序列作為後續分析的參考序列。取每條基因中最長的轉錄本作為unigene,以此進行後續的注釋、定量、差異表達分析。再使用獲得的差異表達基因,進行GO、KEGG等富集分析,就可以獲知與表型相關的信號通路及基因了。*但是僅用最長的一條轉錄本,不能代表全部的isoform,也不能反映出不同樣品間isoform的表達變化。unigene的方法甚至會漏掉一些差異表達的isoform, Corset [1] 可以解決這個問題(圖1)。
Corset的優勢
以圖3為例,ATP5J和GABPA兩個基因有一段重疊的部分。當使用無參拼接時,會得到8條轉錄本,其中3條最長的轉錄本為拼接引起的假陽性轉錄本(如cluster b中的轉錄本)。若使用unigene的方法,根據unigene最長轉錄本原則,會選取假陽性轉錄本進行後續分析,這並不準確。而使用Corset聚合「Gene」的方法,可以將這些真實的轉錄本分離出來(如cluster a和cluster d)(圖3)。
此外Corset在差異表達分析中也有亮點。表1是以有參考基因組數據為標准,將 de novo 拼接數據與該標准進行相關性分析 [1] ,結果越接近1,則數據越接近基於參考基因組的結果(即真實結果)。通過比較 de novo 拼接的三種處理,No Clustering為全部轉錄本數據,unigene為最長的轉錄本數據,「Gene」為用Corset聚合轉錄本數據。結果顯示「Gene」提供了更准確的差異表達分析結果,尤其是在雞 [2] 、人 [3] 等轉錄組復雜的物種,而對最小可變剪切酵母 [4] 影響較小,表明」Gene」的方法對isoform多的物種更具優勢(表1)。
Corset的原理
Corset是Trinity官方推薦的軟體。其在Trinity拼接基礎上,根據轉錄本間Shared Reads將轉錄本聚合為許多cluster,再結合不同樣本間的轉錄本表達水平及H-Cluster演算法,將樣本間有表達差異的轉錄本從原cluster分離,建立新的cluster,最終每個cluster被定義為「Gene」。該方法聚合冗餘轉錄本,並提高差異表達基因的檢出率(圖2)。
Corset的應用
Corset已經被用於解決高等動物如轉錄組復雜生物,海洋生物如三刺魚、紅螯蝦,昆蟲如白蛉等無參物種的科學研究問題(表2)。
參考文獻
[1] Davidson N M, Oshlack A. Corset: enabling differential gene expression analysis for de novo assembled transcriptomes[J]. Genome Biology, 2014, 15(7):1-14.
[2] Ayers K L, Davidson N M, Demiyah D, et al . RNA sequencing reveals sexually dimorphic gene expression before gonadal differentiation in chicken and allows comprehensive annotation of the W-chromosome[J]. Genome Biology, 2013, 14(3):1-17.
[3] Trapnell C, Hendrickson D G, Sauvageau M, et al . Differential analysis of gene regulation at transcript resolution with RNA-seq[J]. Nature Biotechnology, 2013, 31(1):46-53.
[4] Nookaew I. A comprehensive comparison of RNA-Seq-based transcriptome analysis from reads to differential gene expression and cross-comparison with microarrays: a case study in Saccharomyces cerevisiae[J]. Nucleic Acids Research, 2012, 40(20):10084–10097.
[5] Hébert F O, Grambauer S, Barber I, et al . Transcriptome sequences spanning key developmental states as a resource for the study of the cestode Schistocephalus solis, a threespine stickleback parasite[J]. Gigascience, 2016, 5(1):1-9.
[6] Tan M H, Gan H M, Gan H Y, et al . Firstcomprehensive multi-tissue transcriptome of Cherax quadricarinatus (Decapoda:Parastacidae) reveals unexpected diversity of endogenous cellulase[J].Organisms Diversity & Evolution, 2016, 16(1): 185-200.
[7] Petrella V, Aceto S, Musacchia F, et al . De novo, assembly and sex-specific transcriptome profiling in the sand fly Phlebotomus perniciosus, (Diptera, Phlebotominae), a major Old World vector of Leishmania infantum[J]. Bmc Genomics, 2015, 16(1):1-15.
㈤ 全長轉錄本與參考基因組比對
長讀長測序技術的突破使得轉錄本結構鑒定、可變剪切等分析更為准確。上一期我們介紹了Iso-seq方法鑒定全長轉錄本: 全長轉錄本鑒定 。全長轉錄本鑒定之後,如何更精確地對全長轉錄本進行參考基因組比對分析,精確識別出基因異構體,是Iso-seq下游分析的關鍵。近幾年,已經開發出多款用於三代長讀長reads的比對軟體,如GMAP、minimap2、deSALT等軟體,可以較好地用於比對分析,下面我們具體看一下這些比對軟體的使用。
傳統的使用比較多的長讀長比對軟體是GMAP,05年發表公布,最開始是用來比對低通量的est序列的,後來也有進一步升級為GSNAP支持高通量的二代測序。PacBio測序技術出現後,常用於Iso-seq轉錄本的鑒定,目前仍是相關研究引用量最高的比對軟體,該軟體也一直在持續更新升級。其可以將轉錄本序列與參考基因組序列比對,輸出gff文件,比對速度稍慢,其使用方法如下:
Minimap2是生信大牛李恆18年用C語言開發的可以用於三代數據(subreads、iso-seq)比對的長序列比對軟體,與傳統的三代比對工具GMAP相比,其速度有非常顯著的提升,當然同時消耗的內存也比較大。使用方法也比較簡單,近幾年引用次數增長的也很迅速,所以大家可以試試用minimap2進行Iso-seq的比對。其使用方法如下:
deSALT是19年底哈爾濱工業大學王亞東團隊開發的一款專門針對於三代長reads測序的比對軟體,主要可以處理四種數據類型:
該軟體可以構造基於圖的比對骨架以推斷外顯子,並使用它們來生成剪接的參考序列以產生精確的比對,更好的解決了小外顯子和測序錯誤的問題。其使用方法如下:
還有兩款軟體,STAR以及BLAT也可以用於長讀長reads的比對,這兩款軟體比較早,相信大家也有所了解,雖然可用於長讀長reads的比對,但這兩款軟體並不是專門為三代測序reads比對開發的,所以大家在做Iso-seq分析時,可以更多考慮使用上文介紹的三款。
Wu T D, Watanabe C K. GMAP: a genomic mapping and alignment program for mRNA and EST sequences[J]. Bioinformatics, 2005, 21(9): 1859-1875.
Li, H. (2018). Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. doi:10.1093/bioinformatics/bty191
https://github.com/lh3/minimap2
Liu, B., Liu, Y., Li, J. et al. deSALT: fast and accurate long transcriptomic read alignment with de Bruijn graph-based index. Genome Biol 20, 274 (2019). https://doi.org/10.1186/s13059-019-1895-9
㈥ 求助,哪些軟體可以預測轉錄因子靶基因
最近開始做實驗,我研究的是兩個目的蛋白A和B,初步估計兩者在組織中表達是呈相反的趨勢,即A的表達為上調,而B的表達是降低,那麼我想研究兩者的是否具有相互作用,我可否先通過一些生物信息學軟體(主要現在要開題了,來不及做實驗,怕被批說立論依據不足)來預測B就是A的靶基因,以及潛在的可能的作用位點,然後可以進一步通過實驗來證實(我所知道的只有染色質免疫共沉澱,還有哪些方法呢?)我看關於mirna的就有很多生物信息學軟體可以來預測下游靶基因,如果不是mirna,兩個都是轉錄因子的話,有哪些軟體可以用呢?
謝謝大家!
㈦ 基因轉錄與翻譯的運載工具
你說的運載工具是不是說運載底物的物質?
轉錄的時候加入核糖核苷酸是不需要運載工具的,是靠底物分子本身的濃度,隨機加入到延伸中的RNA中。加入的鹼基可以和RNA中的鹼基互補配對,相互識別,直接作用。
翻譯就不同了,翻譯是將RNA的鹼基序列轉換為氨基酸序列,這兩者之間沒有所謂的互補配對原則,因此需要有一種中間載體來完成一一配對。這個載體就是tRNA。TRNA一端識別氨基酸,一邊識別對應的RNA密碼子,這樣就是RNA攜帶的信息正確的轉入蛋白質中。