全球觀天下！生成式AI走紅，如何搭建生命科學的ChatGPT？

2023-02-15 08:34:32|

來源：科技日報作者：

(資料圖)

“ChatGPT引起了廣泛的關(guān)注，我們有沒有可能在生命科學領(lǐng)域搭建一個類似ChatGPT的模型呢？”加拿大魁北克省人工智能研究中心（Mila）副教授、加拿大高等研究院（CIFAR）人工智能講席教授唐建在近日召開的《理解未來》科學講座AI for Science系列第三期上說。

這期講座主題為“AI4Science和ChatGPT，生物醫(yī)藥的契機？”，由未來論壇理事、北京大學李兆基講席教授謝曉亮主持。講座上，中國科學院院士、北京大學教授鄂維南和唐建分別圍繞“AI for Science科技革命”“生命科學中的生成式人工智能”話題分享了觀點。

唐建指出，人工智能和生物技術(shù)的研究正處于黃金時期。語言生成模型如ChatGPT在對話系統(tǒng)領(lǐng)域取得了很大的突破，研究者們正在探索是否能在生物制藥領(lǐng)域搭建類似的人工智能模型。目前，研究人員在人工智能與生物醫(yī)藥的交叉領(lǐng)域已有了諸多探索。他舉了一些例子：GeoDiff應用在小分子的三維構(gòu)象預測，E3Bind應用在蛋白質(zhì)-配體復合物結(jié)構(gòu)預測，ProtSeed同時生成新的蛋白質(zhì)結(jié)構(gòu)和序列等。

唐建認為，AI分析數(shù)據(jù)以及機器學習，為科學規(guī)律的表達提供了可能性。“AI將可能的文本、知識、代碼進行訓練，當AI能力達到一定強度后，我們就通過模型的開發(fā)，對大量數(shù)據(jù)進行學習和訓練。其中，ChatGPT可以產(chǎn)生全新的原創(chuàng)內(nèi)容，具有一定的創(chuàng)造力，像一本百科全書，用戶可以很快從百科全書中獲取需要的知識。在蛋白質(zhì)設(shè)計領(lǐng)域，不論是小分子還是蛋白質(zhì)分子，本質(zhì)而言都需要生成一些新的結(jié)構(gòu)，融入ChatGPT，可以提升蛋白質(zhì)設(shè)計的創(chuàng)新度和多樣性。”

謝曉亮在前瞻對話環(huán)節(jié)分享了他對于AI+生命科學領(lǐng)域應用的思考。他指出，基于技術(shù)上的突破，生命科學基因組學、冷凍電鏡等生命科學領(lǐng)域，逐漸從“數(shù)據(jù)缺乏學科”轉(zhuǎn)變?yōu)?ldquo;大數(shù)據(jù)科學”，從“定性學科”轉(zhuǎn)變?yōu)?ldquo;定量學科”。他還提到，AI需要大數(shù)據(jù)，數(shù)據(jù)質(zhì)量非常重要。

以藥物設(shè)計為例，鄂維南介紹，“現(xiàn)在很多團隊都在通過將數(shù)據(jù)驅(qū)動的方法和模型驅(qū)動的方法有機結(jié)合，構(gòu)建更加系統(tǒng)、高效、自動化的藥物研發(fā)過程。”他指出，化學、材料、生物、工程等傳統(tǒng)領(lǐng)域都將成為AI的主戰(zhàn)場，同時也將催生新一代的產(chǎn)業(yè)模式。另一方面，在AI+Science的驅(qū)動下，科學研究將從“小農(nóng)作坊”模式轉(zhuǎn)變到“安卓”模式，“平臺科研”將成為全新的科研范式，“社區(qū)建設(shè)”將成為重要趨勢。

“希望我們有效地利用機會，將AI+Science的‘安卓’模式基礎(chǔ)設(shè)施建設(shè)起來，充分利用這一科學發(fā)展空間，讓中國走在全球科學領(lǐng)域的前沿。”鄂維南說。

《理解未來》科學講座是未來論壇面向公眾開放的高質(zhì)量公益科普講座。據(jù)了解，講座目前已成功舉辦70余場，超過140位科學家參與其中。

標簽：生命科學 ChatGPT