腫瘤產生的一個關鍵標誌是癌細胞在其基因組中獲得了正常組織中不存在的體細胞突變。一些突變是驅動突變(driver mutation),有助於腫瘤細胞生長,但其他許多突變是乘客突變(passenger mutation),對腫瘤生物學沒有明顯影響。在過去的十年裏,通過分析成千上萬對腫瘤-正常組織的測序數據,驅動突變在蛋白編碼基因組區域(即編碼蛋白的基因組區域)中被全麵表征。對蛋白編碼基因組區域的這種表征產生了對腫瘤生物學的大量見解,包括許多受基因組啟發的藥物靶標。然而,體細胞突變在剩下98%的癌症基因組---非編碼基因組(noncoding genome)---中的作用仍未被完全理解。
許多統計學方法通過比較每個基因中對蛋白編碼序列有影響和無影響的突變數量,將驅動突變檢測為複發性突變事件。因此,這些方法不適用於蛋白編碼區域以外的地方,在那裏,體細胞突變的作用仍然不甚明了。非編碼基因組包括多種不同的序列元件,包括基因表達的調節區域,這些調節區域的位置和活性在不同的腫瘤類型中有所不同。在一項新的研究中,為了擴大對蛋白編碼區域以外的突變的理解,來自布羅德研究所、丹娜-法伯癌症研究所、哈佛醫學院、布萊根婦女醫院和烏特勒支大學醫學中心的研究人員設計並實施了一種全基因組的滑動窗口方法來檢測突變事件,而不考慮其在調節元件中的位置或對蛋白編碼序列的影響。相關研究結果發表在2022年4月8日的Science期刊上,論文標題為“Genome-wide analysis of somatic noncoding mutation patterns in cancer”。
人類癌症中體細胞突變模式的全基因組概要。
這些作者開發了三種方法的組合,以檢測含有6120萬個體細胞突變的19種癌症類型的3949名患者的全基因組中的複發性突變事件。這種方法根據突變事件在基因組中的位置,自動將其分為不同的類別。在蛋白編碼區域,他們發現每種癌症類型平均有7.5個事件,並獲得了公認的驅動突變。在非編碼基因組中,每種癌症類型有3.7個事件發生在特定組織類型中專門表達的基因附近(肝髒中的ALB基因,前列腺中的KLK3基因,肺部中的SFTPB基因,腎髒中的SLC5A12,甲狀腺組織中的TG基因,以及其他)。這些組織特異性事件不太可能是典型的驅動突變,因為它們源於隻在這些基因周圍活躍的誘變過程,而不是反映了腫瘤細胞起源的表達程序的可能印記。
此外,這些作者在每種癌症類型的表達調節區域發現了3.8個非編碼事件,其中許多涉及癌症相關的基因(BCL6、FGFR2、RAD51B、SMC6、TERT、XBP1和許多其他基因)。與調節區域中的大多數事件相反,XBP1附近的乳腺癌突變主要積累在它的啟動子之外的一個調節區域。他們通過進行CRISPR幹擾篩選和熒光素酶報告實驗驗證了它們對基因表達的調節作用,闡明了全基因組方法與協調測序隊列相結合以全麵捕捉非編碼基因組中已知和未知的序列元件中的突變模式的潛力。
綜上所述,這項新的研究建立了一個基因組範圍內的不同突變模式的概要,這些突變模式塑造了19種主要癌症類型的基因組,包括在腫瘤生物學中具有已知作用的基因附近發生的事件,以及一些對基因表達表現出實驗驗證的影響。這些研究結果表明非編碼突變與一係列不同的生物過程有關,它們在基因組中的位置對於準確解釋它們至關重要。廣義上講,這項新的研究為解釋全基因組測序數據提供了藍圖,並為未來研究非編碼突變在腫瘤產生中的作用奠定了基礎,最終為非編碼癌症基因組量身定製治療方法鋪平了道路。