天天觀(guān)速訊丨通用認(rèn)知智能大模型有了能力評(píng)測(cè)體系

2023-06-12 16:41:27|

來(lái)源：科技日?qǐng)?bào) 作者：

6月3日，以“AI大模型時(shí)代的長(zhǎng)三角數(shù)字化之路”為主題的長(zhǎng)三角企業(yè)家聯(lián)盟產(chǎn)業(yè)數(shù)字化峰會(huì)在安徽合肥舉行。會(huì)上，認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室、中國(guó)科學(xué)院人工智能產(chǎn)學(xué)研創(chuàng)新聯(lián)盟和長(zhǎng)三角人工智能產(chǎn)業(yè)鏈聯(lián)盟共同發(fā)布了通用認(rèn)知智能大模型評(píng)測(cè)體系，旨在形成一套覆蓋多任務(wù)的大模型能力客觀(guān)評(píng)測(cè)體系，引導(dǎo)中國(guó)認(rèn)知智能大模型技術(shù)和產(chǎn)業(yè)健康發(fā)展。

認(rèn)知智能大模型或迎爆發(fā)式增長(zhǎng)

(資料圖)

伴隨著人工智能技術(shù)的進(jìn)步，認(rèn)知智能大模型或成為實(shí)現(xiàn)通用人工智能的“曙光”。

未來(lái)幾年，隨著業(yè)界長(zhǎng)期系統(tǒng)性推進(jìn)人工智能的技術(shù)研發(fā)，認(rèn)知智能大模型或?qū)⒂瓉?lái)爆發(fā)式增長(zhǎng)，傳統(tǒng)的內(nèi)容生產(chǎn)及傳播方式或被改寫(xiě)，人機(jī)協(xié)作將進(jìn)一步改變?nèi)藗兊纳a(chǎn)生活方式，甚至將改寫(xiě)現(xiàn)有的產(chǎn)業(yè)生態(tài)格局——一些傳統(tǒng)產(chǎn)業(yè)將“被迫”進(jìn)行轉(zhuǎn)型升級(jí)，認(rèn)知智能技術(shù)將創(chuàng)造出新的職業(yè)、崗位，為整個(gè)信息產(chǎn)業(yè)和數(shù)字經(jīng)濟(jì)帶來(lái)新的發(fā)展契機(jī)。

5月6日，科大訊飛股份有限公司（以下簡(jiǎn)稱(chēng)科大訊飛）正式發(fā)布訊飛星火認(rèn)知大模型。僅一個(gè)月后，科大訊飛宣布，星火認(rèn)知大模型“牽手”工業(yè)互聯(lián)網(wǎng)平臺(tái)，實(shí)現(xiàn)在“產(chǎn)、供、銷(xiāo)、服、管”等各流程的知識(shí)學(xué)習(xí)與人工智能賦能，有效助力企業(yè)降本增效。

從各大互聯(lián)網(wǎng)企業(yè)的發(fā)展路徑可以看出，工業(yè)互聯(lián)網(wǎng)建設(shè)和企業(yè)數(shù)字化轉(zhuǎn)型等或是實(shí)現(xiàn)認(rèn)知智能大模型規(guī)模化落地應(yīng)用的重要切入口。

然而，如何提前研判認(rèn)知智能大模型給各行各業(yè)帶來(lái)的顛覆性改變和創(chuàng)新性發(fā)展機(jī)遇，使得企業(yè)能夠及時(shí)且有針對(duì)性地作出相應(yīng)的調(diào)整？這就需要一套科學(xué)、系統(tǒng)的客觀(guān)評(píng)測(cè)體系，既可以綜合判斷現(xiàn)階段的技術(shù)進(jìn)展，還能夠明確認(rèn)知智能大模型多維度的發(fā)展路徑。認(rèn)知智能大模型領(lǐng)域“百花齊放”，效果度量和評(píng)價(jià)成為重點(diǎn)，覆蓋多維度、多任務(wù)的客觀(guān)評(píng)測(cè)成為驗(yàn)證認(rèn)知智能大模型能力的重要手段。

科學(xué)研判通用認(rèn)知智能大模型

針對(duì)現(xiàn)實(shí)需求，認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室牽頭設(shè)計(jì)，與中國(guó)科學(xué)院人工智能產(chǎn)學(xué)研創(chuàng)新聯(lián)盟、長(zhǎng)三角人工智能產(chǎn)業(yè)鏈聯(lián)盟一起，從產(chǎn)學(xué)研源頭技術(shù)創(chuàng)新和產(chǎn)業(yè)鏈應(yīng)用落地兩方面出發(fā)，組織多輪評(píng)測(cè)標(biāo)準(zhǔn)研討會(huì)議，邀請(qǐng)中國(guó)科學(xué)院科技戰(zhàn)略咨詢(xún)研究院、中科寒武紀(jì)科技股份有限公司、科大訊飛等產(chǎn)學(xué)研各界代表探討交流，共同形成了通用認(rèn)知智能大模型評(píng)測(cè)體系。

“評(píng)測(cè)體系根據(jù)底層認(rèn)知智能能力的智能涌現(xiàn)對(duì)通用認(rèn)知智能大模型的能力進(jìn)行分析，從而制定通用認(rèn)知智能大模型的評(píng)測(cè)標(biāo)準(zhǔn)與評(píng)測(cè)方法，更科學(xué)地衡量通用認(rèn)知智能大模型各個(gè)方面的能力和水平。”認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室副主任王士進(jìn)介紹說(shuō)。

王士進(jìn)表示，本次發(fā)布的評(píng)測(cè)體系覆蓋內(nèi)容生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力、編程能力、多模態(tài)7大能力維度，共計(jì)481個(gè)細(xì)分任務(wù)類(lèi)型，力求為大模型的研究、行業(yè)標(biāo)準(zhǔn)的制定提供參考和借鑒。

他表示，未來(lái)評(píng)測(cè)體系將致力于讓認(rèn)知智能大模型技術(shù)真正解決社會(huì)剛需，助力長(zhǎng)三角打造具有全球影響力的通用人工智能科技創(chuàng)新策源地和新興產(chǎn)業(yè)聚集地。“圍繞推動(dòng)通用人工智能評(píng)測(cè)體系共建，下一步，認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室希望與長(zhǎng)三角企業(yè)家聯(lián)盟單位基于通用評(píng)測(cè)體系持續(xù)合作優(yōu)化，共同推動(dòng)行業(yè)評(píng)測(cè)方案落地，促進(jìn)技術(shù)和產(chǎn)業(yè)健康發(fā)展。”王士進(jìn)說(shuō)。

標(biāo)簽：