全長比較轉錄組

PHYLOTRANSCRIPTOME

全長比較轉錄組(Phylotranscriptome)

基于轉錄組測序的全長比較轉錄組是通過對同一科、屬內不同物種,尤其是復雜的或者無參考基因組的物種,提取mRNA后進行PacBio三代測序,從基因序列水平研究起源于共同祖先的不同物種間的系統發育關系以及分化時間等進化事件;同時挖掘明顯受到正向選擇或者負向選擇的基因,從而快速、全面地揭示選擇和適應機制。通過二代測序對三代序列進行校正后,不需要組裝即得到了高質量的全長轉錄本,從而避免了由于拼接引入的錯誤,分析更精準。

三代全長比較轉錄組的特點

.png

二代與三代轉錄組完整性比較

.png

材料選擇

有共同祖先的科、屬內不同物種

每科屬內典型材料1-2個即可

每個個體不同組織樣品混合,保證mRNA來源的全面性,獲得盡可能多的轉錄本。

文庫構建

二代測序:二代轉錄組小片段文庫。

三代測序:1-2K;2-3K;>3K。

樣品要求

三代測序要求:

樣品類型:總RNA、組織樣;

樣品濃度:總RNA濃度≥300?ng/ul;

樣品體積:>?10?ul;

樣品總量:總RNA用量>?3?ug?;

樣品純度:OD260/280為7~2.5,OD260/230為0.5~2.5,260nm處有正常峰值;

RNA完整性:總RNA的非植物RIN值≥8.0,植物RIN值≥7.5;28S/18S≥1.3;圖譜基線無上抬;5S峰正常。

 

二代測序要求:

總RNA電泳28s和18s條帶清晰,且28s亮度大于18s的兩倍,5s條帶亮度越弱越好。

樣品濃度:≥40?ng/μl(Qubit檢測)

樣品總量:≥3μg(Qubit檢測)

樣品體積:≥10μl

樣品純度:OD260/280為7~2.5,OD260/230為0.5~2.5

RNA完整性:植物RIN值≥5,非植物RIN值≥7.0;28S/18S≥1;圖譜基線無上抬;5s峰較低。

成功案例

全長轉錄組數據

某復雜多倍體無參物種:
Hiseq測序平臺;4G轉錄組數據
PacBio測序平臺;全長轉錄組
結果對比:三代全長獲得的轉錄本更長、更全。

2
.png

系統發育樹

用muscle軟件將獲得的每個直系同源基因的氨基酸序列進行比對,然后將所有直系同源基因的比對結果合并,使用jModelTest?2軟件進行模型選擇,根據模型選擇結果,用PhyML軟件進行似然樹的構建,獲得各個種間的系統進化樹。

分化時間估算

構建進化樹后,如有外群和化石標定時間,可以用PAML軟件的mcmctree方法計算各個物種的分化時間。如無法提供外群和化石標定時間,可以根據T=Ks/2r估計兩兩物種的分化時間,其中r為中性突變率,可以查閱相關文獻確定。

.png
ka-ks

基于Ka/Ks的選擇壓力分析

Ka/Ks或者dN/dS表示的是非同義突變頻率(Ka)和同義突變頻率(Ks)之間的比例。一般認為,同義突變不受自然選擇,而非同義突變則受到自然選擇作用。通過比較非同義替換率和同義替換率的相對比值可以確定這個基因在進化中受到的選擇壓力,即判斷是否有選擇壓力作用于這個蛋白質編碼基因。

做全長比較轉錄組的意義

1、從基因水平來開展對某(些)物種的研究是最直接、最有效、最易操作的途徑,而通過轉錄組測序是獲得基因的最為成熟的手段;
2、對于不同物種,尤其是無參考基因組或參考基因組不完善的同一科屬內不同種的進化地位的確定,可通過直系同源基因來實現;
3、對于基因組很復雜,或者同一科屬內物種差別大,無法通過重測序進行分析;
4、無需構建群體,研究對象為單獨的物種。

2代測序數據在全長比較轉錄組分析中的應用是什么?

2代數據主要是對3代數據進行糾錯,從而可以獲得更多有效的3代數據,來進行全長轉錄本的分析;另外,二代轉錄組數據還可以通過表達量的差異用于驗證那些受到正選擇的基因。

全長比較轉錄組分析內容能發表什么水平的文章?

目前依賴二代的轉錄組數據進行比較轉錄組分析的文獻有很多,如草莓,番茄,昆蟲等,早期發表文章IF比較高,例如番茄(2013?PANS),昆蟲(2014 Science),而全長比較轉錄組分析作為一種新技術去解析物種間進化關系,除了自身的準確性及優勢外,作為新技術更容易協助研究者發高層次文章,目前利用全長比較轉錄組發表的文章幾乎沒有;另外,全長比較轉錄組無需實驗驗證,可快速產出文章。

為什么全長比較轉錄組不做與表達量相關的分析?

(1)不同物種,多拷貝基因難以確定基因的一?一對應關系無法比較表達量;當然,單拷貝同源基因可以確定一一對應關系,但是;

(2)表達譜差異分析(例如?RPKM值比較)實際上使用的內參是?RNA總量。相同物種RNA總量穩定,所以沒有問題。但不同物種RNA總量未必相同,所以物種間的差異分析就失去了穩定的內參。因此強行比較的話,是不嚴謹的。

11选最强规律