網易數帆發(fā)布對話式BI產品試圖抓住垂類大模型的機會

2023-08-12 07:50:15|

來源：界面新聞作者：

8月10日，網易數帆發(fā)布了AIGC技術方向的對話式BI（商業(yè)智能）產品有數ChatBI，相較于目前正在流行的對話式產品，有數ChatBI主要想強調的屬性在于“數據的可信”。

網易數帆大數據產品線總經理余利華表示，數字化時代，多個經營環(huán)節(jié)需要用數據支撐決策已經成為常態(tài)，企業(yè)數據分析需求量大幅度上升。

以網易數帆某客戶為例，其月均數據分析需求量超過了200，策劃、運營、用戶體驗、QA等不同崗位都提出了用數的需求，其中運營相關的臨時或緊急的需求占比很高。但由于數據分析流程的專業(yè)性和分析人才的稀缺性，傳統數據分析顯得耗時而低效。

【資料圖】

AI產品盡管可以幫助提升效率，其答案的可信度卻很成問題。網易數帆方面表示，類ChatGPT產品并不能帶來完全準確的回答，主要原因在于兩點，首先，類ChatGPT產品更擅長處理自然語言文本數據相關任務，并非專門為數據分析而設計；其次，通用大模型可能存在捏造事實，也即“AI幻覺”，在BI領域可能是捏造字段，這在數據分析中可能成為致命問題。

于是，在數據分析領域對抗“AI幻覺”出現的可能性，成為有數ChatBI團隊的首要任務之一。

余利華表示，“AI幻覺”的產生是由于訓練數據不足、文本與表示之間的編解碼錯誤等因素，于是團隊打造可信的ChatBI需要在需求理解、過程驗證、用戶干預和產品運營四個方面著手。

具體而言，網易數帆需要借助大模型的語言理解能力，先進行用戶的需求分析，并幫助BI初級使用者通過需求分析內容判斷系統的取數步驟是否正確；過程驗證指的是借助基于大模型的NL2SQL能力實現復核，余利華介紹，為了提升NL2SQL能力，網易數帆有針對性地定制生成和優(yōu)化了超過30萬不同類型的問法和SQL，目前調優(yōu)出的NL2SQL領域模型，效果已達到GPT-3.5的水平；用戶干預即將數據模型和查詢條件結構化，用戶可切換數據模型或者查詢條件；產品運營方面則構建了運營反饋機制，用戶可反饋數據準確性，管理員通過運營知識庫、標記及優(yōu)化badcase提升數據可靠性。

在實際應用中，以大型連鎖超市的銷售部門場景為例，產品人員輸入“我想看今年上半年華北地區(qū)每個月的利潤”，有數ChatBI可給出相應結果，并用自然語言描述了查詢的邏輯與步驟。掌握SQL的專業(yè)人員可以點擊“更多”按鈕查看對應的SQL。如果邏輯有誤，例如用戶想看“訂單日期”在上半年的數據，但是AI篩選的是“發(fā)貨日期”，用戶可點擊“修改查詢條件”進行對校正。

從產品發(fā)展的角度看來，網易數帆當下對于通用大模型和垂直行業(yè)大模型到底更偏向哪一方？

網易副總裁、網易杭州研究院執(zhí)行院長、網易數帆總經理汪源對界面新聞等媒體表示，“原則上來講，我們現在的實際情況是既做通用的大模型，也做垂直的大模型，這兩者之間是支撐的關系，（但）最終的出口是做垂類的模型，而且是應用在我們所最關注的兩個領域，一個是軟件開發(fā)、一個是數據分析?！?/p>

他表示，為了做好垂類模型，團隊本身需要一個“公共底座”，也就是網易“玉言”模型。目前，該模型由網易的核心實驗室和杭研的人工智能團隊兩個團隊為主，后期會加入更多集團其他團隊共同打造網易集團的大模型底座。

（文章來源：界面新聞）

標簽：