全球觀天下!生成式AI走紅,如何搭建生命科學的ChatGPT?
(資料圖)
“ChatGPT引起了廣泛的關(guān)注,我們有沒有可能在生命科學領(lǐng)域搭建一個類似ChatGPT的模型呢?”加拿大魁北克省人工智能研究中心(Mila)副教授、加拿大高等研究院(CIFAR)人工智能講席教授唐建在近日召開的《理解未來》科學講座AI for Science系列第三期上說。
這期講座主題為“AI4Science和ChatGPT,生物醫(yī)藥的契機?”,由未來論壇理事、北京大學李兆基講席教授謝曉亮主持。講座上,中國科學院院士、北京大學教授鄂維南和唐建分別圍繞“AI for Science科技革命”“生命科學中的生成式人工智能”話題分享了觀點。
唐建指出,人工智能和生物技術(shù)的研究正處于黃金時期。語言生成模型如ChatGPT在對話系統(tǒng)領(lǐng)域取得了很大的突破,研究者們正在探索是否能在生物制藥領(lǐng)域搭建類似的人工智能模型。目前,研究人員在人工智能與生物醫(yī)藥的交叉領(lǐng)域已有了諸多探索。他舉了一些例子:GeoDiff應用在小分子的三維構(gòu)象預測,E3Bind應用在蛋白質(zhì)-配體復合物結(jié)構(gòu)預測,ProtSeed同時生成新的蛋白質(zhì)結(jié)構(gòu)和序列等。
唐建認為,AI分析數(shù)據(jù)以及機器學習,為科學規(guī)律的表達提供了可能性。“AI將可能的文本、知識、代碼進行訓練,當AI能力達到一定強度后,我們就通過模型的開發(fā),對大量數(shù)據(jù)進行學習和訓練。其中,ChatGPT可以產(chǎn)生全新的原創(chuàng)內(nèi)容,具有一定的創(chuàng)造力,像一本百科全書,用戶可以很快從百科全書中獲取需要的知識。在蛋白質(zhì)設(shè)計領(lǐng)域,不論是小分子還是蛋白質(zhì)分子,本質(zhì)而言都需要生成一些新的結(jié)構(gòu),融入ChatGPT,可以提升蛋白質(zhì)設(shè)計的創(chuàng)新度和多樣性。”
謝曉亮在前瞻對話環(huán)節(jié)分享了他對于AI+生命科學領(lǐng)域應用的思考。他指出,基于技術(shù)上的突破,生命科學基因組學、冷凍電鏡等生命科學領(lǐng)域,逐漸從“數(shù)據(jù)缺乏學科”轉(zhuǎn)變?yōu)?ldquo;大數(shù)據(jù)科學”,從“定性學科”轉(zhuǎn)變?yōu)?ldquo;定量學科”。他還提到,AI需要大數(shù)據(jù),數(shù)據(jù)質(zhì)量非常重要。
以藥物設(shè)計為例,鄂維南介紹,“現(xiàn)在很多團隊都在通過將數(shù)據(jù)驅(qū)動的方法和模型驅(qū)動的方法有機結(jié)合,構(gòu)建更加系統(tǒng)、高效、自動化的藥物研發(fā)過程。”他指出,化學、材料、生物、工程等傳統(tǒng)領(lǐng)域都將成為AI的主戰(zhàn)場,同時也將催生新一代的產(chǎn)業(yè)模式。另一方面,在AI+Science的驅(qū)動下,科學研究將從“小農(nóng)作坊”模式轉(zhuǎn)變到“安卓”模式,“平臺科研”將成為全新的科研范式,“社區(qū)建設(shè)”將成為重要趨勢。
“希望我們有效地利用機會,將AI+Science的‘安卓’模式基礎(chǔ)設(shè)施建設(shè)起來,充分利用這一科學發(fā)展空間,讓中國走在全球科學領(lǐng)域的前沿。”鄂維南說。
《理解未來》科學講座是未來論壇面向公眾開放的高質(zhì)量公益科普講座。據(jù)了解,講座目前已成功舉辦70余場,超過140位科學家參與其中。