久久99精品亚洲乱码三区_午夜福利亚洲电影_日本一区二区三区欧美在线观看_5g在线视讯年龄确认18_久久久久久久久国产精品2

【醫(yī)學(xué)數(shù)據(jù)庫(kù)專欄】第二期-lncRNA數(shù)據(jù)庫(kù)的集大成者lncSEA數(shù)據(jù)庫(kù)
2022.01.12
1278次

長(zhǎng)鏈非編碼 RNA (lncRNA) 已被證明在轉(zhuǎn)錄過(guò)程和各種生物學(xué)功能中發(fā)揮重要作用。近年來(lái),隨著高通量測(cè)序技術(shù)的快速發(fā)展,lncRNA的研究也越漸火熱。許多l(xiāng)ncRNA數(shù)據(jù)庫(kù)和工具也隨之建立。

例如NONCODE、LNCipedia專注于為lncRNA提供基本注釋信息。LncRNADisease和Lnc2Cancer收集lncRNA與疾病之間關(guān)系的詳細(xì)信息。LncRNASNP和LncVar提供了與其他功能元件相互作用的lncRNA信息。StarBase和LncBase提供了lncRNA靶標(biāo)的信息。這些數(shù)據(jù)庫(kù)都是研究lncRNAs的寶貴資源。

但也存在一些行業(yè)痛點(diǎn),RNAdb、StarBase等網(wǎng)址相繼突然關(guān)閉;多個(gè)LncRNA數(shù)據(jù)庫(kù)停止更新,如曾經(jīng)號(hào)稱百科全書(shū)的LNCipedia數(shù)據(jù)庫(kù)也在2015年之后就停止更新,數(shù)據(jù)庫(kù)基層訓(xùn)練數(shù)據(jù)集偏小型,可靠度不足;缺乏lncRNA上游轉(zhuǎn)錄調(diào)控信息等。目前,lncRNA,沒(méi)有像mRNA有NCBI的Refseq Gene,miRNA有mirbase,建立唯一公認(rèn)ID,這樣大一統(tǒng)天下的LncRNA數(shù)據(jù)庫(kù),建立一個(gè)全面的人類lncRNA集集合尤為迫切。

這里給大家介紹一個(gè)目前l(fā)ncRNA數(shù)據(jù)庫(kù)的航母級(jí),多個(gè)lncRNA數(shù)據(jù)庫(kù)的集大成者。

2020年10月,哈爾濱醫(yī)科大學(xué)大慶校區(qū)的李春權(quán)教授課題組在國(guó)際著名雜志《Nucleic Acids Research》上發(fā)布了一項(xiàng)重磅數(shù)據(jù)庫(kù)LncSEA(https://doi.org/10.1093/nar/gkaa806)。

LncSEA(http://bio.liclab.net/LncSEA/index.php),旨在記錄人類 lncRNA 集的大量可用資源,并提供 lncRNA 的注釋和富集分析。LncSEA 支持超過(guò) 40 000 個(gè) lncRNA 參考集,涵蓋 18 個(gè)類別和 66 個(gè)子類別,涵蓋超過(guò) 50 000 個(gè) lncRNA。我們不僅收集了基于下游調(diào)控?cái)?shù)據(jù)源的lncRNA集,還通過(guò)整合TF ChIP-seq、DNase-seq、ATAC-seq和H3K27ac,鑒定了大量受上游轉(zhuǎn)錄因子(TFs)和DNA調(diào)控元件調(diào)控的lncRNA集芯片序列數(shù)據(jù)。重要的是,LncSEA 提供了與上游監(jiān)管者和下游目標(biāo)相關(guān)的 lncRNA 集的注釋和富集分析。綜上所述,LncSEA 是一個(gè)強(qiáng)大的平臺(tái),為用戶提供多種類型的 lncRNA 集,并支持 lncRNA 注釋和富集分析。


01.lncSEA_db.jpg


lncRNA 集的集合和 LncSEA 的用戶界面。LncSEA 提供 18 種參考集,包括 miRNA、藥物、疾病、甲基化模式、癌癥特異性表型、lncRNA 結(jié)合蛋白、癌癥標(biāo)志、亞細(xì)胞定位、存活、eQTL、細(xì)胞標(biāo)記、增強(qiáng)子和超級(jí)增強(qiáng)子、轉(zhuǎn)錄因子、可及染色質(zhì)、smORF、外泌體和保護(hù)。LncSEA 支持多種功能,包括搜索、下載、瀏覽和富集分析。LncSEA 中還提供了 ID 轉(zhuǎn)換、ceRNA 網(wǎng)絡(luò)、lncRNA 表達(dá)和統(tǒng)計(jì)。


02.lncSEA_db.jpg


LncRNA受不同的調(diào)控元件和 TF 的調(diào)控,它們與其調(diào)控區(qū)域結(jié)合。由于數(shù)據(jù)資源和技術(shù)限制,很少有數(shù)據(jù)庫(kù)提供 lncRNA 的上游監(jiān)管信息。我們通過(guò)收集和處理大量的 ChIP-seq/DNase-seq/ATAC-seq 數(shù)據(jù),構(gòu)建了四類具有上游調(diào)控信息的 lncRNAs,包括“增強(qiáng)子”、“超級(jí)增強(qiáng)子”、“無(wú)障礙染色質(zhì)”和“轉(zhuǎn)錄因子”。


03.lncSEA.png


重要的是,LncSEA 提供了與上游監(jiān)管者和下游目標(biāo)相關(guān)的 lncRNA 集的注釋和富集分析功能。

平常做lncRNA的注釋和功能富集時(shí),一直缺少一個(gè)像做基因富集分析時(shí)那樣的sets,對(duì)lncRNA進(jìn)行功能富集分析時(shí)常需要做lncRNA與基因間的共表達(dá),然后再根據(jù)共表達(dá)的基因去做富集分析。而這樣的操作也是無(wú)奈之舉會(huì)增加假陽(yáng)性的同時(shí),也會(huì)落下一些重要的結(jié)果。基于本批數(shù)據(jù)進(jìn)行預(yù)測(cè)基因間的共表達(dá),受本批測(cè)序中的樣本數(shù)量過(guò)少,會(huì)大大影響計(jì)算結(jié)果。而LncSEA通過(guò)收集全球數(shù)據(jù)集,正是解決了這一點(diǎn)。


一、實(shí)操演示1——lncRNA富集分析


04.lncSEA_db.jpg


1)輸入lncRNA的基因名稱列表,運(yùn)行;

2)生成富集在各個(gè)數(shù)據(jù)集的富集結(jié)果,結(jié)果為顯著富集在非小細(xì)胞肺癌中;如第一行,該數(shù)據(jù)集綜述為147個(gè)基因,現(xiàn)輸入的lncRNA在小細(xì)胞肺癌數(shù)據(jù)集中有31個(gè),計(jì)算Jaccard值,為相對(duì)于背景的富集因子;


05.lncSEA_db.jpg


3)生成富集的氣泡圖,圖片可下載;


06.lncSEA_db.jpg


4)生成富集的柱狀圖,圖片可下載;


07.lncSEA_db.jpg


5)其他上游因子,分子互作查看。如miRNA


08.lncSEA_db.jpg


二、實(shí)操演示2——IncRNA基因注釋


1)輸入lncRNA的基因名稱,運(yùn)行;


09.lncSEA_db.jpg


2)lncRNA預(yù)測(cè)結(jié)合的miRNA,來(lái)源數(shù)據(jù)庫(kù),Count為該miRNA同時(shí)影響的lncRNA種類總數(shù)量;


10.lncSEA_db.jpg


三、參考文獻(xiàn)


Jiaxin Chen, Jian Zhang, LncSEA: a platform for long non-coding RNA related sets and enrichment analysis, Nucleic Acids Research, Volume 49, Issue D1, 8 January 2021, Pages D969–D980, https://doi.org/10.1093/nar/gkaa806


— 彩 蛋 —

下期,可能介紹全球最大的癌癥突變數(shù)據(jù)庫(kù)COSMIC(https://cancer.sanger.ac.uk/cosmic),如果通過(guò)癌癥基因,找癌癥突變,癌癥藥物,在 3D 蛋白質(zhì)結(jié)構(gòu)的背景下理解癌癥突變。


11.cosmic.jpg


在線咨詢
在線咨詢
OA系統(tǒng)入口