鄭緯民院士:大語言模型出現(xiàn)“幻覺”可用知識圖譜技術(shù)輔助解決

沈怡然2023-09-08 20:29

經(jīng)濟觀察網(wǎng) 記者 沈怡然 9月8日,在海致科技知識圖譜與大模型融合應(yīng)用平臺發(fā)布會上,中國工程院院士鄭緯民表示,建議將知識圖譜技術(shù)與大模型技術(shù)深度融合,有效解決大模型在企業(yè)級和工業(yè)界應(yīng)用中出現(xiàn)的“幻覺”問題。                     

鄭緯民是中國高性能計算和存儲系統(tǒng)等方面的泰斗和先行者,也是清華大學(xué)計算機科學(xué)與技術(shù)系教授。海致科技成立于2013年,專注知識圖譜和圖計算技術(shù),鄭緯民曾在該公司設(shè)立“高性能圖計算院士工作站”。

鄭緯民在會上演示發(fā)布了由海致科技與高性能圖計算院士工作站共同開發(fā)的“Atlas LLM知識圖譜與大模型融合應(yīng)用平臺”,該平臺面向廣大B端用戶,運用知識圖譜幫助大模型在企業(yè)級和工業(yè)界應(yīng)用中克服“幻覺”,實現(xiàn)基于行業(yè)與場景的精準推演。

大語言模型具備跨領(lǐng)域通用性、快速自主學(xué)習(xí)和自我改進能力,不僅用于內(nèi)容創(chuàng)作產(chǎn)業(yè),還被政府、金融、醫(yī)療機構(gòu)當(dāng)作新的生產(chǎn)工具。鄭緯民表示,目前大模型存在“幻覺”問題,難以應(yīng)用在容錯率低、精確度高、較為嚴謹?shù)墓ぷ黝I(lǐng)域。

簡單說,“幻覺”就是大模型在人機對話中給出一些事實錯誤、推理錯誤,難以實時更新信息、沒有時間概念,無法給專業(yè)領(lǐng)域提供可靠的回答。

鄭緯民具體解釋,由于大語言模型的基本工作方式是分析文本中的詞匯、句法結(jié)構(gòu)、語義信息等,并捕捉它們之間的模式和概率分布,因此,它更傾向于基于統(tǒng)計規(guī)律生成回答,而非進行深入的邏輯推理或形成高級的認知能力。另外,它在生成文本時可能會受限于訓(xùn)練數(shù)據(jù)中存在的偏見和誤導(dǎo)性信息,在某些情況下可能會產(chǎn)生不準確或不合理的回答。

鄭緯民表示,可以看出,模型并不能真正地理解語言,知識根據(jù)某些統(tǒng)計規(guī)律來連接它之前見過的片段,模型也不懂?dāng)?shù)據(jù),缺乏嚴格的演繹推理能力。短期來看,單純依靠大模型自身的迭代很難解決該問題。一個有效辦法是,利用知識圖譜技術(shù)幫助模型解決這些問題。

知識圖譜也是人工智能學(xué)術(shù)體系中的關(guān)鍵技術(shù)之一,自2012年開始流行,是一種用圖模型來描述知識和建模世界萬物之間的關(guān)聯(lián)關(guān)系的技術(shù)方法,這種技術(shù)具備可靠程度高、可解釋性強、復(fù)雜推理能力強等優(yōu)勢。

鄭緯民表示,知識圖譜技術(shù)作為公認“類腦”的知識表達方式,通過對語義網(wǎng)絡(luò)進行建模,以結(jié)構(gòu)化的形式描述客觀世界中實體及關(guān)系,已經(jīng)被廣泛用于知識推理。

可以說,知識圖譜具備精確的知識推導(dǎo)能力,可以與大模型技術(shù)形成互補。鄭緯民表示,在具體操作中,利用知識圖譜對大模型進行輔助訓(xùn)練,可提高大模型的可控性,給大模型做領(lǐng)域適配,提高模型在某些專業(yè)領(lǐng)域的推理能力。

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟觀察報》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟觀察報》社所有。未經(jīng)《經(jīng)濟觀察報》社授權(quán),嚴禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請致電:【010-60910566-1260】。
大科創(chuàng)新聞部記者
關(guān)注硬科技領(lǐng)域,包括機器人及人工智能、無人機、虛擬現(xiàn)實(VR/AR)、智能穿戴,以及新材料領(lǐng)域。擅長企業(yè)深度報道及上市公司分析報道。發(fā)現(xiàn)前沿技術(shù)、發(fā)展趨勢投資價值。

熱新聞

電子刊物

點擊進入