在一項新的研究中,來自英國癌症研究學院、倫敦大學學院、弗朗西斯-克裏克研究所、美國加州大學聖地亞哥分校和瑞典隆德大學等研究機構的研究人員利用人工智能(AI)研究並分類了癌症起始和生長時基因組---細胞的完整遺傳密碼---中DNA變化的大小和規模。相關研究結果於2022年6月15日在線發表在Nature期刊上,論文標題為“Signatures of copy number alterations in human cancer”。
利用人工智能,這些作者確定了21種常見的缺陷,這些缺陷發生在癌症起始和生長時的DNA結構、順序和拷貝數上。一類稱為拷貝數標記(copy number signature)的常見缺陷可能幫助指導醫生進行反映腫瘤特征的治療。
當你觀看美國流媒體播放平台Netflix時,會產生關於你觀看的電影和電視劇類型的數據,你觀看它們的頻率,以及你是否給它們一個“大拇指”或“小拇指”。Netflix使用一種算法來分析這些大量的數據,在你觀看的內容中找到模式,然後在你滾動瀏覽Netflix時推薦新的電影和電視劇。
在倫敦大學學院的Nischalan Pillay博士和加州大學聖地亞哥分校的Ludmil Alexandrov博士的領導下,這些作者構建出一種類似的算法,可以篩選出成千上萬行的基因組數據,挑出染色體如何組裝和排列的共同模式。然後,該算法可以對出現的模式進行分類,並幫助科學家們確定癌症中可能出現的缺陷類型。
利用該算法,這些作者在9873名患有33種不同類型癌症的患者的完全測序的基因組中尋找模式。該算法確定了腫瘤中染色體結構和數量的21種常見缺陷,並將它們歸類為不同的拷貝數標記。
這21種拷貝數標記如今將被用來構建一個藍圖,科學家們可以用它來評估癌症的侵襲性,找到它的弱點並為它設計新的治療方法。
Alexandrov博士說,“癌症是一種複雜的疾病,但我們證實在它起始和如何生長時發生的染色體變化存在著顯著的相似性。就像Netflix可以預測你接下來會選擇狂看哪些節目一樣,我們相信我們將能夠預測你的癌症可能會如何表現,基於它基因組之前經曆的變化。我們希望達到這樣的程度:醫生可以查看患者的完全測序的腫瘤,並將腫瘤的關鍵特征與我們的基因組缺陷藍圖相匹配。掌握了這些信息,我們相信醫生在未來將能夠提供更好和更個性化的癌症治療。”
這些作者之前研究了這些大規模的基因組缺陷是如何在肉瘤中發生的,並希望找到方法來研究不同類型的癌症中的這些變化。
通過使用Alexandrov博士開發的一種名為SigProfilerExtractor的軟件,該算法使用複雜的數學方法來掃描癌症患者的測序數據,並識別不同類型癌症中染色體重組方式的共同模式。
這些作者進一步研究了對癌症患者的治療結果影響最大的拷貝數標記。在這種算法確定的21種拷貝數標記中,他們發現發生染色體破碎和重組(稱為染色體碎裂)的腫瘤與最差的生存結果有關。例如,這項新的研究發現,膠質母細胞瘤(一種侵襲性的腦瘤)患者,如果他們的腫瘤發生了染色體碎裂,其生存結果更差。平均而言,沒有發生染色體碎裂的膠質母細胞瘤患者比腫瘤發生染色體碎裂的膠質母細胞瘤患者多存活6個月。
這些作者希望他們能夠完善這一算法,使醫生能夠根據你的癌症在起始時獲得的遺傳特征以及它在生長過程中獲得的遺傳變化,找出你所患的癌症的可能表現。
Pillay博士說,“為了領先癌症一步,我們需要預測它如何適應和改變。突變是癌症的關鍵驅動因素,但我們的很多理解都集中在癌症中單個基因的變化上。我們一直忽略了一個更大的問題,即大量的基因如何複製、移動或缺失而不對腫瘤造成災難性的後果。了解這些事件如何產生將有助於我們重新獲得對癌症的優勢。由於基因組測序的進步,我們如今可以看到這些變化在不同的癌症類型中發生,並找出如何有效地應對它們的方法。”
拷貝數標記在人類癌症中的分布。
這些作者已經將SigProfilerExtractor和這項新研究中使用的其他軟件工具免費提供給其他科學家,這樣他們就可以根據從腫瘤測序中獲得的數據,使用該算法從DNA中建立自己的染色體變化庫。
論文第一作者、倫敦大學學院博士後研究員Christopher Steele博士補充說,“我們相信,將這些強大的計算工具免費提供給其他科學家,將加速為患者提供個性化的癌症藍圖的進展,使他們獲得最佳的生存機會。”
英國癌症研究學院首席執行官Michelle Mitchell說,“在我們慶祝英國癌症研究學院成立20周年之際,我們可以建立一個跨越多種腫瘤類型的藍圖,這可能有助於研究人員預測癌症的行為,並展示我們如何通過更精確的治療方法來對付它。”