首頁 >> 新聞 >> 科研進(jìn)展

科研進(jìn)展

水生所對魚類轉(zhuǎn)錄組相關(guān)數(shù)據(jù)庫的開發(fā)取得突破

發(fā)表日期:2023-10-25郭成來源:水生生物研究所放大 縮小

   隨著各種魚類的轉(zhuǎn)錄組研究的迅速開展,大量的RNA-seq數(shù)據(jù)開始公開,展現(xiàn)特定時間點下,目標(biāo)器官、組織或細(xì)胞中所有基因的表達(dá)情況,使得更為系統(tǒng)地理解魚類基因表達(dá)的概況和細(xì)節(jié)成為可能。  

  中國科學(xué)院水生生物研究所魚類功能基因組學(xué)學(xué)科組收集整理了魚類RNA-seq相關(guān)數(shù)據(jù),建立了魚類的常規(guī)轉(zhuǎn)錄組數(shù)據(jù)庫FishGETFish Transcriptome and Expression Database. http://bioinfo.ihb.ac.cn/fishget)、單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)庫FishSCTFish Single-Cell Transcriptome Database, http://bioinfo.ihb.ac.cn/fishsct)和空間轉(zhuǎn)錄組數(shù)據(jù)庫FishSEDFish Spatial Expression Database, http://bioinfo.ihb.ac.cn/fishsed  

  FishGET收錄了來自于斑馬魚、草魚和虹鱒等8種魚類的97項研究共1362個樣本的RNA-seq雙端數(shù)據(jù)(包括mRNAlncRNA),進(jìn)行了轉(zhuǎn)錄本組裝、加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(WGCNA)、NR/KEGG/GO注釋、臨近位置注釋、lncRNA類型注釋和同源性注釋等工作。網(wǎng)站還提供了多樣化的動態(tài)交互可視化服務(wù),用于查詢和展示魚類不同發(fā)育階段各組織器官內(nèi)的基因表達(dá)和共表達(dá)網(wǎng)絡(luò)等,以期促進(jìn)魚類基因在轉(zhuǎn)錄水平的相關(guān)研究(圖1)。  

1  FishGET功能模塊

  FishSCT收錄了包括斑馬魚等9種魚類的數(shù)據(jù),也是斑馬魚單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)最齊全的在線資源。數(shù)據(jù)庫基于發(fā)表于202210月之前的44項研究的129個數(shù)據(jù)集,經(jīng)過統(tǒng)一分析獲得了964個標(biāo)記基因和26,965個潛在標(biāo)記基因信息,以及單細(xì)胞分辨率下的表達(dá)圖譜(細(xì)胞數(shù)目:646,641),共涵蓋9種魚類的245種細(xì)胞類型。斑馬魚的相關(guān)數(shù)據(jù)構(gòu)成數(shù)據(jù)庫的主體,包括222種細(xì)胞類型的848個標(biāo)記和13,800個潛在標(biāo)記基因信息,所涉及的組織或器官涵蓋了斑馬魚生長發(fā)育時間線的各個階段(2)。FishSCT提供了一個用戶友好的網(wǎng)絡(luò)界面,方便用戶瀏覽目標(biāo)基因的表達(dá)模式和標(biāo)記信息等內(nèi)容(圖3 A-D,并且提供了細(xì)胞類型識別的功能(圖3 E-F),來幫助研究人員進(jìn)行scRNA-seq的相關(guān)分析。  

  

2  FishSCT數(shù)據(jù)庫中,斑馬魚及其它魚類各組織/器官中細(xì)胞類型和標(biāo)記基因的數(shù)量

3  FishSCT數(shù)據(jù)庫的基因表達(dá)可視化示例和細(xì)胞類型識別功能。A-D,tubb5基因表達(dá)模式的可視化與蛋白互作網(wǎng)絡(luò)展示;E-F,細(xì)胞類型識別功能

  FishSED整理了已公開發(fā)表的斑馬魚空間轉(zhuǎn)錄組相關(guān)的原始數(shù)據(jù),涵蓋了來自10個項目的56個數(shù)據(jù)集的空間表達(dá)譜數(shù)據(jù)(圖4 A)。樣本類型包括所有發(fā)育階段的胚胎和其他幾個組織,經(jīng)過分析和處理后,獲得了涵蓋5種測序技術(shù)的3D基因表達(dá)圖譜,建立了一個用戶友好、交互性強的斑馬魚空間轉(zhuǎn)錄組數(shù)據(jù)平臺。這是目前唯一的專門收錄斑馬魚空間轉(zhuǎn)錄組數(shù)據(jù)的數(shù)據(jù)庫。FishSED根據(jù)不同的測序技術(shù)提供了不同的可視化服務(wù),還可進(jìn)行跨數(shù)據(jù)集的多基因表達(dá)模式搜索與作圖,為研究者進(jìn)行比較分析提供了方便(圖4 B-G)。  

  

4  FishSED數(shù)據(jù)庫的內(nèi)容和可視化結(jié)果示例。A,FishSED數(shù)據(jù)庫的數(shù)據(jù)集分布統(tǒng)計;B-G,不同測序技術(shù)的可視化結(jié)果示例

  以上數(shù)據(jù)庫的論文發(fā)表在《iScience》和《Science China Life Sciences》,由博士研究生郭成、段攸、葉偉東等人共同完成,夏曉勤研究員和石米娟副研究員為并列通訊作者,點擊可閱讀原文:FishGET, FishSCT, FishSED。本研究得到國家重點研發(fā)計劃“鯉鯽、草魚優(yōu)異種質(zhì)資源鑒定”課題(2021YFD1200804)、“重要養(yǎng)殖魚類基因組選育與單性控制技術(shù)”任務(wù)(2018YFD0901201),以及中國科學(xué)院戰(zhàn)略先導(dǎo)科技專項(XDA24010206)課題“鯉模塊整合育種的生物信息學(xué)分析”任務(wù)的共同資助。

附件: