近日,中國科學院分子細胞科學卓越創(chuàng)新中心石建濤研究員與上海交通大學醫(yī)學院附屬瑞金醫(yī)院方海研究員合作,通過全基因組亞硫酸鹽測序(WGBS)技術繪制了11種常見實體瘤的DNA甲基化單體圖譜(DNA methylation haplotype map)。研究團隊對110個原發(fā)性腫瘤樣本的全基因組DNA甲基化數據(WGBS)進行深度分析,共鑒定出81,567個非冗余的DNA甲基化單體水平上的共甲基化區(qū)域,稱為DNA甲基化單體區(qū)塊(Methylation Haplotype Blocks, MHBs),這些MHBs在癌癥類型中表現出高度特異性,并與基因表達調控、致癌通路密切相關,為癌癥檢測提供了新的生物標志物。相關研究成果以“Toward the DNA methylation haplotype map of 11 common solid cancers”為題發(fā)表于《Cell Reports》期刊。

標題:Toward the DNA methylation haplotype map of 11 common solid cancers(11種常見實體癌的DNA甲基化單體圖譜)
發(fā)表時間:2025.08.23
發(fā)表期刊:Cell Reports
影響因子:IF6.9/Q1
技術平臺:WGBS
作者單位:中國科學院分子細胞科學卓越創(chuàng)新中心石建濤、上海交通大學醫(yī)學院附屬瑞金醫(yī)院方海等
DOI:10.1016/j.celrep.2025.116197
在異質性腫瘤中,相鄰的CpG位點會形成甲基化單體區(qū)塊(MHBs),MHBs與基因表達失調有關,但其在泛癌中的動態(tài)變化特征和臨床意義仍然未知。研究人員對11種常見實體瘤的110個原發(fā)性腫瘤樣本進行DNA甲基化分析,共鑒定出81,567個MHBs。這些MHBs呈現高度的癌癥類型特異性,并富集于基因調控元件。整合的bulk和單細胞轉錄組分析揭示了MHBs與基因表達的相關性且和平均甲基化水平變化無關。此外,泛癌分析揭示了與MHBs相關的差異表達基因在致癌通路(如G2/M檢查點、MYC靶點和E2F信號)中的重要作用。最后研究驗證了MHBs可以作為癌癥檢測的有效生物標志物。本研究將MHBs確立為多模態(tài)表觀遺傳調控因子,可連接腫瘤異質性、轉錄調控和液體活檢等診斷領域。
研究亮點

研究摘要

圖1:癌癥中MHBs的鑒定

圖2:癌癥MHBs在開放染色質區(qū)域的富集
(C-D) MHBs在LMRs和PMDs中的富集分析。
(E) 當調控平均甲基化水平的情況下,含有MHBs的基因組區(qū)域在開放染色質區(qū)域中更富集。
(F) MHBs在疾病狀態(tài)特異性ChIA-PET數據中的富集分析。
(3)癌癥MHBs與基因表達失調相關
研究團隊通過整合分析,發(fā)現MHBs與基因表達的相關性不依賴于平均甲基化水平的變化,超過50%的MHBs與差異甲基化區(qū)域(DMRs)重疊。在食管鱗狀細胞癌(ESCC)中,研究團隊發(fā)現排除DMRs相關基因后,含有MHBs的基因更有可能上調表達。
通過轉錄調控網絡分析(CollecTRI數據庫),鑒定出52個在ESCC中活性顯著改變的調控因子,包括MYC、HIF1A、E2F家族等,這些因子在G2/M檢查點和WNT通路中富集。WGBS的讀長水平數據(read-level data)揭示了甲基化單體(mHaps)與基因表達的獨立關聯(lián),突破了傳統(tǒng)平均甲基化分析的局限性。

圖3:癌癥MHBs與基因表達失調相關
(B-C) MHBs在高甲基化和低甲基化DMRs中的富集分析。
(D) ESCC中MHBs與基因表達失調的關聯(lián)分析。ESCC數據集(GSE149612)包含10個腫瘤和匹配的10個正常WGBS和RNA-seq樣本的,ESCC MHBs(n=27,497),ESCC與鄰近正常組織間的DEGs(n=2,769)。
(E) 熱圖顯示含有MHBs的上調基因平均甲基化和表達情況。
(F) 熱圖顯示ESCC和正常食管組織之間的轉錄因子(TF)活性。
(G) ESCC TE5細胞系的ChIP-seq數據的KLF5結合譜。MHB區(qū)域分為ESCC腫瘤特異性(n=20,778)、正常特異性(n=10,501)或共有(n=7,368)。
(4)利用單細胞數據驗證結腸癌MHBs
研究團隊利用單細胞甲基化測序(scBS-seq)數據,驗證了結腸癌MHBs的調控作用。在單細胞水平上,MHBs在不同類型的惡性細胞中表現出顯著的一致性,表明這些MHBs在結腸癌中具有優(yōu)異的調控作用。此外,研究團隊發(fā)現含有MHBs的基因在單細胞中表現出更高的表達水平,進一步證實了MHBs在基因表達調控中的作用。

圖4:利用單細胞數據驗證癌癥MHBs及其調控作用
(A)單細胞DNA甲基化單體(sc-mHap)示意圖。上:CpG平均甲基化二元分類(甲基化>0.9;未甲基化<0.1)生成sc-mHaps。下:15個單細胞的示例mHap模式。
(B)CRC單細胞數據中鑒定出的COAD MHB示例。
(C)不同單細胞樣本類型中鑒定出的MHB重疊情況。
(D)以泛癌MHB為背景,對原發(fā)性腫瘤單細胞MHB與11種癌癥類型的bulk樣本MHB進行富集分析。
(E)基因表達與啟動子區(qū)域MHBs的相關性。每個單細胞根據平均甲基化水平將啟動子分為三組:高甲基化(>0.8)、中等甲基化(0.2–0.8)和低甲基化(<0.2)。組內比較了含有或不含有MHBs的啟動子對應的基因表達。
(F)中等、低甲基化啟動子組中MHB甲基化水平對基因表達的作用。
(G)單細胞CRC中MHBs與基因表達失調的關聯(lián)。
(H)Venn圖顯示PT和LN腫瘤中上調且啟動子區(qū)域含MHB但無DMRs的基因數量。PT:原發(fā)性腫瘤,n=581、LN:淋巴結轉移,n=346。
(I)PT和LN中共有的42個與MHB相關基因的通路富集分析。
(J)熱圖顯示含有MHB的42個共有基因在單細胞中的平均甲基化和表達水平。在MYC靶點和G2/M檢查點通路中注釋的基因用紅色標記。
(K)使用TCGA-COAD數據集驗證(J)中在不同病理階段突出顯示的10個基因的DNA甲基化和基因表達譜。
(L)TCGA-COAD數據集中,按CBX3基因高/低表達對患者亞組進行分層,比較無病生存(DFS)的Kaplan-Meier生存曲線。
(5)泛癌MHBs與差異表達基因相關
研究人員通過整合TCGA多組學數據發(fā)現,MHBs與11種癌癥中DEGs顯著相關,無論有或沒有DMRs基因。通過優(yōu)先級指數(Priority Index, Pi)分析,研究團隊篩選出8,852個泛癌MHB靶基因,其中53個基因構成通路交叉網絡,包括MYC靶點、G2/M檢查點和E2F通路等關鍵致癌通路。

圖5:癌癥MHBs與泛癌中差異表達基因相關

圖6:癌癥中DNA甲基化腫瘤間異質性表征

圖7:基于癌癥MHB的血漿DNA非侵入性癌癥檢測
結論和啟示
本研究通過WGBS技術,揭示了11種常見實體瘤中MHBs的特征和功能。研究結果表明,MHBs作為細胞身份的特征,不僅具有組織特異性,還具備疾病狀態(tài)特異性。MHBs在開放染色質區(qū)域中富集,表明其在基因表達調控中發(fā)揮重要作用。MHBs與基因表達顯著相關且不依賴于平均甲基化水平變化,這一發(fā)現通過單細胞數據得到進一步驗證。在臨床應用方面,MHBs作為生物標志物在非侵入性癌癥檢測中表現出優(yōu)越的性能,為早期癌癥檢測提供了新的工具。
WGBS技術在本研究中發(fā)揮了關鍵作用,使得研究團隊能夠以單堿基分辨率分析DNA甲基化模式,鑒定出與癌癥發(fā)生和發(fā)展密切相關的MHBs。未來的研究可以利用WGBS技術進一步探索其他癌癥類型中的DNA甲基化圖譜,開發(fā)更多基于表觀遺傳學的癌癥診斷和治療策略。
參考文獻:
Zhang Z, Hong Y, Zhang S, Zhu X, Liu L, Liao X, Gu H, Fang H, Shi J. Toward the DNA methylation haplotype map of 11 common solid cancers. Cell Rep. 2025 Aug 23;44(9):116197. doi: 10.1016/j.celrep.2025.116197.