基於CRISPR的基因編輯具有潛在的治療優勢,但也存在一些技術缺陷。在這些基因編輯工具中,堿基編輯器可以重寫組成DNA的四個堿基---腺嘌呤(A)、胞嘧啶(C)、胸腺嘧啶(T)和鳥嘌呤(G)---之一。
如今,在兩項新的研究中,來自美國布羅德研究所和霍華德休斯醫學研究所的研究人員發明了新的CRISPR工具,這些工具通過改進堿基編輯器的精確度和基因組靶向能力解決了它們麵臨的一些挑戰。相關研究結果於2020年2月10日在線發表在Nature Biotechnology期刊上的論文中,論文標題分別為“Evaluation and minimization of Cas9-independent off-target DNA editing by cytosine base editors”和“Continuous evolution of SpCas9 variants compatible with non-G PAMs”
堿基編輯器的工作原理是靶向DNA的特定區域,然後將某些堿基轉換為其他的堿基。在轉換之後,堿基編輯器,比如將C•G轉化為T•A的胞嘧啶堿基編輯器,有時會執行不必要的脫靶編輯。到目前為止,即便是最好的CRISPR工具---來自釀膿鏈球菌(Streptococcus pyogenes)的Cas9核酸酶(SpCas9),也僅能與DNA上16個位置中的大約一個結合,從而使得許多基因突變無法校正。
在第一項新的研究中,這些研究人員設計出新的胞嘧啶堿基編輯器,將一種難以捉摸的脫靶編輯減少了10~100倍,從而使得這些新的胞嘧啶堿基編輯器特別有望用於治療人類疾病。在第二項新的研究中,他們通過讓現有的Cas9蛋白進化而獲得了新一代CRISPR-Cas9蛋白,它們能夠靶向更大部分的致病突變,包括一種導致鐮形細胞貧血的突變。在此之前,這種突變仍然很難通過以前的CRISPR方法加以靶向。
這兩篇論文的通訊作者、布羅德研究員默金醫療變革技術研究所所長、哈佛大學化學與化學生物學教授、霍華德休斯醫學研究所研究員David Liu說,“鑒於人類基因組編輯時代尚處於脆弱的起步階段,因此,當我們開始將這些基因編輯器導入人體時,我們應盡一切努力將任何不良影響的風險降至最低,這一點很重要。將這種難以捉摸的脫靶編輯--- Cas9非依賴性編輯(Cas9-independent edit,即不依賴於Cas9的編輯)---減到最少是實現這一目標的重要一步。這種脫靶編輯可以在基因組的隨機位置上發生。當你進行10次實驗時,你會得到10個不同的答案。這使得研究這一點極具挑戰性。”
尋找脫靶編輯
一種檢測Cas9非依賴性編輯的方法是對整個基因組進行多次測序。但是,這樣的實驗既耗時又昂貴,需要耗費數萬美元。相反,Liu和他的團隊設計了五種新的測試,可以快速低成本地檢測到這些編輯,而無需全基因組測序。在一種測試中,他們遞送了一種不同的CRISPR蛋白來保持DNA雙螺旋鏈在人類基因組的六個不同位置打開。堿基編輯器強烈地偏好編輯單鏈DNA,因此開放的DNA鏈會吸引任何行為不端的堿基編輯器。Liu說,“通過讓DNA鏈保持開放,這種測定方法誘導堿基編輯器進入並編輯開放的DNA,如果它有這樣做的傾向的話。”
隨後,Liu和他的團隊搜索了6條開放的DNA鏈中發生的堿基編輯。他們對整個基因組進行了測序,以驗證他們的測定結果是否與之前的更慢更昂貴但經過驗證的方法(即前麵提及的多次基因組測序)的結果相匹配,並且它們確實匹配。
接下來,Liu團隊測試了所有主要類型的胞嘧啶堿基編輯器(總共14種),以確定哪種產生較少的脫靶編輯。
一種稱為YE1的胞嘧啶堿基編輯器勝出。Liu說,“即使我們把一堆DNA環誘人地打開讓它編輯,它也不會編輯”。鑒於YE1的編輯範圍比其他的胞嘧啶堿基編輯器小(當停在DNA上時,它隻能對三個最近的堿基進行編輯),他和他的團隊對它進行改造,使得它具有更大的編輯範圍,可對五個最近的堿基進行編輯。結果就是獲得一係列更加精確、更具選擇性和用途更廣泛的堿基編輯器。
更多的停靠點
CRISPR還有另一個要克服的障礙:它訪問整個人類基因組的能力有限。Liu說,“實際上,你不能將Cas9停靠在基因組的任何地方。你隻能將它停靠在有一小段稱為PAM的恒定DNA序列的地方。”
到目前為止,最常見的PAM是NGG,其中“N”是任意一個堿基。但是,兩個連續的堿基G僅出現在人類基因組中的大約16個位置上,僅占基因組的6.25%。Liu說:“十六分之一的概率很差。”
為了增加這種概率,Liu和他的實驗室讓SpCas9變體進行進化,從而能夠識別一些僅有一個堿基G的DNA序列,從而讓SpCas9變體停靠在基因組中的4個位置上。Liu說,“但是,在SpCas9未涉足的基因組區域中,有一些不含任何堿基G的PAM‘沙漠’。”
這些研究人員利用Liu實驗室先前的一項發明,即噬菌體輔助連續進化(phage-assisted continuous evolution, PACE),迫使SpCas9快速進化,從而在大約一周的時間內產生了許多新一代SpCas9變體。若沒有PACE,這一過程將花費數月甚至數年的時間。他們的目標是產生具有親本蛋白所有才能但用途更廣泛的新SpCas9變體。隻有能夠識別不含G的PAM序列的SpCas9變體才能在達爾文選擇中幸存下來。
Liu說,“由此獲得了三個SpCas9變體家族。”總體上,它們可以指導胞嘧啶堿基編輯器和腺嘌呤堿基編輯器,並讓它們停靠在基因組的幾乎所有NR位點上,其中R是A或G,這使得它們可以訪問大約一半的DNA位點。鑒於堿基編輯器可以在5堿基窗口(five-base window,即由5個堿基組成的DNA片段)進行編輯,所以沒有A或G的5堿基窗口的可能性僅為5%。 Liu說,“我們知道有95%的致病性點突變都有NR PAM在合適的位置以支持堿基編輯。”這意味著堿基編輯器如今可以找到並校正多達95%的致病性點突變。
這些研究人員還發現,他們的新SpCas9變體可以對導致大多數鐮狀細胞貧血病例的突變進行堿基編輯,而這一點在此之前很難實現。Liu說,“不幸的是,沒有位於合適位置的NGG來讓以前的SpCas9堿基編輯器最佳地作用於這種鐮形細胞貧血突變。因此,使用已發布的堿基編輯器來尋求這個位點是充滿挑戰性的。”
Liu補充道:“當然,通過使用這些經過進化的SpCas9變體之一,我們如今就可以非常有效地對這種突變進行堿基編輯。”