全長(cháng)轉錄組測序
技術(shù)簡(jiǎn)介
基于Pacbio單分子實(shí)時(shí)測序技術(shù)(Single Molecule Real-Time Sequencing,SMRT),借助其超長(cháng)讀長(cháng)優(yōu)勢,無(wú)需組裝,直接獲得從5’末端到3’PolyA尾的高質(zhì)量的全長(cháng)轉錄本信息。利用全長(cháng)轉錄組測序,可獲取全長(cháng)mRNA序列,對基因異構體、可變剪切、融合基因進(jìn)行準確鑒定。
技術(shù)路線(xiàn)
送樣建議
濃度 (Qubit) | 總量 | 完整性及純度 | |
Total RNA | ≥300 ng/μL | ≥10 μg | RIN≥8.0,28S/18S≥1.3;基線(xiàn)平整,5S峰正常;OD260/280≥1.8,OD260/230≥1.8 |
測序策略 | 數據量 | 周期 | |
三代全長(cháng)轉錄組測序 | PacBio RS II | 15G data | 95 個(gè)自然日 |
案例分析
全長(cháng)轉錄組測序揭秘玉米轉錄組的復雜性[1]
研究背景
玉米(Zea mays)是全球重要的農作物,也是研究植物轉錄組代謝通路的遺傳模型。玉米基因組序列于2009年公布,后續利用EST和RNA-Seq轉錄組數據對其基因注釋進(jìn)行了補充。然而RNA-Seq中,短讀長(cháng)無(wú)法提供轉錄本全長(cháng)序列,限制了可變剪接形式的鑒定等。
研究方法
采集玉米自交系B73不同發(fā)育階段的6個(gè)組織(根、花粉、胚芽、胚乳、幼雌穗、幼雄穗),提取mRNA,構建6種插入片段文庫(<1, 1–2, 2–3, 3–5, 4–6 和>5 kb),進(jìn)行全長(cháng)轉錄組測序和二代RNA-Seq測序(每個(gè)樣品三個(gè)重復)。
圖1. 新鑒定LncRNA分析
研究結果
測序得到的全長(cháng)轉錄本序列,其中有94.2%能夠比對到玉米RefGen_v3參考基因組上。經(jīng)聚類(lèi)分析得到了來(lái)自53個(gè)家族(RefGen_v3總共57個(gè))的新的isoform,對應26,943個(gè)基因,轉錄因子5,423個(gè),其中155個(gè)與生長(cháng)激素應答功能相關(guān)。而鑒定的878個(gè)候選LncRNA中,867個(gè)(平均讀長(cháng)為1.1kb)為新發(fā)現的LncRNA,具有結構和組織特異性。進(jìn)一步對isoform、lncRNA和non-lncRNA區域進(jìn)行甲基化分析,發(fā)現non-lncRNA genes具有相對較高的CG甲基化水平,而lncRNAs具有相對較高的CHG甲基化水平,這些甲基化水平可能與玉米不同組織中基因的不同表達水平有關(guān)。
研究結論
PacBio超長(cháng)讀長(cháng)無(wú)需組裝即可得到全長(cháng)轉錄組信息,相比于Illumina短讀長(cháng)組裝的isoform而言,更能直接準確地獲得isoform信息,有助于解密玉米轉錄組復雜的基因表達信息。
參考文獻
[1]. Wang B, Tseng E, Regulski M, et al. Unveiling the complexity of the maize transcriptome by single-molecule long-read sequencing[J]. Nature Communications, 2016, 7:11708.
全國免費熱線(xiàn):400-6700-360
閩ICP備19023500號
閩公網(wǎng)安備 35010202001014號