AI蛋白技術(shù)解析基因變異,個性化基因療法迎新機遇
(相關(guān)資料圖)
近期,由我國科學(xué)家牽頭發(fā)起,多國科學(xué)家共同參與的“靈長類基因組計劃”取得重大進展,相關(guān)研究成果在權(quán)威學(xué)術(shù)期刊《科學(xué)》上發(fā)表。其中,由時任基因測序巨頭Illumina Senior Fellow、分子之心創(chuàng)始人許錦波教授與Illumina人工智能實驗室聯(lián)合完成的《The landscape of tolerated genetic variation in humans and primates》一文,借助AI蛋白技術(shù)分析靈長類動物基因組的變異,了解個體的基因變異和遺傳風(fēng)險,為個性化基因醫(yī)學(xué)的發(fā)展帶來重要機遇。
“靈長類基因組計劃”由中國科學(xué)院昆明動物研究所率先提出,中、美、德、英等多個國家的100多位科學(xué)家共同參與,是一項跨國、跨學(xué)科的科學(xué)探索工程。該計劃擬通過測定地球上已知500多種靈長類動物的基因序列,繪制靈長類基因組圖譜,破譯人類“近親”的遺傳信息,為靈長類動物的保護及生命科學(xué)、醫(yī)學(xué)等領(lǐng)域的發(fā)展奠定基礎(chǔ)。
眾所周知,基因是決定遺傳特征的基本單位。人類基因組中有很多基因發(fā)生了微小的變異,但人們并不完全了解這些變異對人類健康的影響。由于基因組的復(fù)雜性和多樣性,這些變異中只有極小一部分被科學(xué)家們認(rèn)為與疾病相關(guān),其他的變異則一直沒有明確的解釋。科學(xué)家們一直在努力尋找方法來準(zhǔn)確解讀這些變異,以確定人類遺傳變異的影響及其對疾病風(fēng)險的影響,從而實現(xiàn)個性化醫(yī)療。為更好地理解人類基因組中的變異,科學(xué)家們轉(zhuǎn)向靈長類動物進行研究。多數(shù)靈長類物種的基因信息與人類基因密切相關(guān),比如黑猩猩和人類具有99.4%的蛋白質(zhì)序列同一性。因此,可以根據(jù)人類密切相關(guān)的靈長類物種信息來推斷與其直系同源的人類變異的致病性。
科學(xué)家們對來自211種靈長類動物的703個個體進行了測序,并將這些與之前研究的數(shù)據(jù)進行了匯總,確定了430萬個獨特的錯義(蛋白質(zhì)改變)變體。在靈長類動物中觀察到的錯義變異在ClinVar數(shù)據(jù)庫中的評估中更有可能被認(rèn)為是無害的,也就是說,這些變異并不會對人們的健康產(chǎn)生不良影響,這與自然選擇和基因組適應(yīng)性有關(guān),表明它們被自然選擇所容忍。這一發(fā)現(xiàn)為進一步研究人類基因組的變異提供了重要線索。
為了進一步分析和解釋人類基因組中的變異,研究團隊開發(fā)了PrimateAI-3D的深度學(xué)習(xí)網(wǎng)絡(luò)。該網(wǎng)絡(luò)利用蛋白質(zhì)的多序列比對和3D結(jié)構(gòu)作為輸入,通過3D卷積識別蛋白質(zhì)結(jié)構(gòu)中關(guān)鍵的變異區(qū)域,經(jīng)過AI訓(xùn)練,能夠準(zhǔn)確分類良性和未知的人類變異,預(yù)測基因變異的致病性。
據(jù)悉,PrimateAI-3D為科學(xué)家們解讀基因變異的功能和影響提供了新的工具。比如,研究人員利用PrimateAI-3D模型對STK11基因進行了深入分析,研究人員通過PrimateAI-3D模型的預(yù)測,可以對STK11基因中的變異進行分類,判斷其可能的致病性,便于進一步理解STK11基因的功能和與Peutz-Jeghers綜合征的關(guān)系,為臨床診斷和治療提供指導(dǎo)。而通過對靈長類動物基因的研究,科學(xué)家們將在個性化基因醫(yī)學(xué)領(lǐng)域取得重要突破。通過更準(zhǔn)確地解釋人類基因組中的變異,醫(yī)生和研究人員可以更好地理解患者的遺傳特征,并為其提供更加個性化和精準(zhǔn)的醫(yī)療護理,為全人類健康帶來福祉。
標(biāo)簽: