大模型“百軻爭流” 唯有“奮楫者”才能揚(yáng)帆遠(yuǎn)航

2023-07-10 13:56:10|

來源：證券日報(bào) 作者：

原標(biāo)題：大模型“百軻爭流” 唯有“奮楫者”才能揚(yáng)帆遠(yuǎn)航

近日，在多場重要的科技盛會上，大模型均占C位。數(shù)十個大模型悉數(shù)登場，相關(guān)應(yīng)用在各行業(yè)逐步垂直滲透，數(shù)字人、智能艙等“百花齊放”。國內(nèi)多模態(tài)等各類大模型技術(shù)路線并行突破，產(chǎn)業(yè)鏈芯片、算力等關(guān)鍵技術(shù)市場蓬勃發(fā)展，更多企業(yè)聯(lián)合探路。

隨著在國內(nèi)熱度持續(xù)上漲，大模型“百軻爭流”，呈現(xiàn)蓬勃發(fā)展態(tài)勢?？萍疾啃乱淮斯ぶ悄馨l(fā)展研究中心發(fā)布報(bào)告顯示，上半年我國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個。根據(jù)上海市人工智能學(xué)會數(shù)據(jù)，截至目前，我國大模型已近百個，可謂真正進(jìn)入了“百模大戰(zhàn)”。下半年國內(nèi)還將進(jìn)入大模型發(fā)布的密集期。

(資料圖)

熱鬧之下，國內(nèi)大模型也必須直面靈魂拷問。

首先，能否燒得起？大模型需要龐大的算力支持，同時也帶來巨大的成本壓力。有專家直言，ChatGPT大模型每訓(xùn)練一次，相當(dāng)于報(bào)廢了3000輛特斯拉汽車。眾多企業(yè)陷入一邊瘋狂燒錢短期內(nèi)難以覆蓋預(yù)訓(xùn)練成本，一邊模型商業(yè)化難以落地的困境之中。

其次，可否規(guī)模商用？當(dāng)下大模型仍有局限性，存在效率低、涉嫌侵犯數(shù)據(jù)隱私和知識產(chǎn)權(quán)、高端人才匱乏等問題。業(yè)內(nèi)認(rèn)為，大模型效率需得到10倍以上的提高，大規(guī)模商用才有可能。

再次，如何避免過度？在龐大的模型數(shù)量和種類之下，存在一些過度現(xiàn)象。部分企業(yè)追求炫技忽視應(yīng)用可行性，部分追求模型“規(guī)模大”而堆疊參數(shù)，更有部分企業(yè)或機(jī)構(gòu)追求“參數(shù)高”過度訓(xùn)練，導(dǎo)致大模型過擬合和泛化能力不足。

面對挑戰(zhàn)，國內(nèi)大模型“航船”該如何順利“渡江”？

其一，注重前端技術(shù)，勇攀“芯”高峰，深耕算力。企業(yè)在關(guān)鍵技術(shù)道路上勤耕不輟，探索新的預(yù)訓(xùn)練架構(gòu)、方法，進(jìn)一步提升大模型的性能和效率，推動國內(nèi)大模型與國際接軌，讓大模型真正成為企業(yè)參與全球AI大模型競爭的重磅“船票”。鼓勵創(chuàng)新創(chuàng)業(yè)，讓開發(fā)者設(shè)施可以站在巨頭肩膀上創(chuàng)造未來。

其二，推動產(chǎn)業(yè)鏈聯(lián)動，擴(kuò)大開放開源生態(tài)。大模型熱帶來了算力、國產(chǎn)芯“創(chuàng)新架構(gòu)+開源生態(tài)”的新機(jī)會。行業(yè)通過共建開放生態(tài)，鼓勵產(chǎn)業(yè)鏈共享和合作，從而減少重復(fù)建模。企業(yè)也可通過收購、孵化等方式，擴(kuò)大自身在行業(yè)影響力和市場份額。

其三，加強(qiáng)模型評估和驗(yàn)證。機(jī)構(gòu)及企業(yè)應(yīng)建立評估標(biāo)準(zhǔn)和機(jī)制，規(guī)范模型開發(fā)和應(yīng)用過程，避免過度夸大模型的能力，防止炒作，注重大模型可解釋性和可理解性，使其在實(shí)際應(yīng)用中更加可信、可靠。

大模型“百軻爭流”后是大浪淘沙，只有真正的“奮楫者”，才可以勇立潮頭揚(yáng)帆遠(yuǎn)航。（賈麗）

標(biāo)簽：