鄭緯民院士：大語言模型出現(xiàn)“幻覺”可用知識圖譜技術(shù)輔助解決

沈怡然2023-09-08 20:29

經(jīng)濟觀察網(wǎng) 記者沈怡然 9月8日，在海致科技知識圖譜與大模型融合應(yīng)用平臺發(fā)布會上，中國工程院院士鄭緯民表示，建議將知識圖譜技術(shù)與大模型技術(shù)深度融合，有效解決大模型在企業(yè)級和工業(yè)界應(yīng)用中出現(xiàn)的“幻覺”問題。

鄭緯民是中國高性能計算和存儲系統(tǒng)等方面的泰斗和先行者，也是清華大學(xué)計算機科學(xué)與技術(shù)系教授。海致科技成立于2013年，專注知識圖譜和圖計算技術(shù)，鄭緯民曾在該公司設(shè)立“高性能圖計算院士工作站”。

鄭緯民在會上演示發(fā)布了由海致科技與高性能圖計算院士工作站共同開發(fā)的“Atlas LLM知識圖譜與大模型融合應(yīng)用平臺”，該平臺面向廣大B端用戶，運用知識圖譜幫助大模型在企業(yè)級和工業(yè)界應(yīng)用中克服“幻覺”，實現(xiàn)基于行業(yè)與場景的精準推演。

大語言模型具備跨領(lǐng)域通用性、快速自主學(xué)習(xí)和自我改進能力，不僅用于內(nèi)容創(chuàng)作產(chǎn)業(yè)，還被政府、金融、醫(yī)療機構(gòu)當(dāng)作新的生產(chǎn)工具。鄭緯民表示，目前大模型存在“幻覺”問題，難以應(yīng)用在容錯率低、精確度高、較為嚴謹?shù)墓ぷ黝I(lǐng)域。

簡單說，“幻覺”就是大模型在人機對話中給出一些事實錯誤、推理錯誤，難以實時更新信息、沒有時間概念，無法給專業(yè)領(lǐng)域提供可靠的回答。

鄭緯民具體解釋，由于大語言模型的基本工作方式是分析文本中的詞匯、句法結(jié)構(gòu)、語義信息等，并捕捉它們之間的模式和概率分布，因此，它更傾向于基于統(tǒng)計規(guī)律生成回答，而非進行深入的邏輯推理或形成高級的認知能力。另外，它在生成文本時可能會受限于訓(xùn)練數(shù)據(jù)中存在的偏見和誤導(dǎo)性信息，在某些情況下可能會產(chǎn)生不準確或不合理的回答。

鄭緯民表示，可以看出，模型并不能真正地理解語言，知識根據(jù)某些統(tǒng)計規(guī)律來連接它之前見過的片段，模型也不懂?dāng)?shù)據(jù)，缺乏嚴格的演繹推理能力。短期來看，單純依靠大模型自身的迭代很難解決該問題。一個有效辦法是，利用知識圖譜技術(shù)幫助模型解決這些問題。

知識圖譜也是人工智能學(xué)術(shù)體系中的關(guān)鍵技術(shù)之一，自2012年開始流行，是一種用圖模型來描述知識和建模世界萬物之間的關(guān)聯(lián)關(guān)系的技術(shù)方法，這種技術(shù)具備可靠程度高、可解釋性強、復(fù)雜推理能力強等優(yōu)勢。

鄭緯民表示，知識圖譜技術(shù)作為公認“類腦”的知識表達方式，通過對語義網(wǎng)絡(luò)進行建模，以結(jié)構(gòu)化的形式描述客觀世界中實體及關(guān)系，已經(jīng)被廣泛用于知識推理。

可以說，知識圖譜具備精確的知識推導(dǎo)能力，可以與大模型技術(shù)形成互補。鄭緯民表示，在具體操作中，利用知識圖譜對大模型進行輔助訓(xùn)練，可提高大模型的可控性，給大模型做領(lǐng)域適配，提高模型在某些專業(yè)領(lǐng)域的推理能力。

版權(quán)聲明：以上內(nèi)容為《經(jīng)濟觀察報》社原創(chuàng)作品，版權(quán)歸《經(jīng)濟觀察報》社所有。未經(jīng)《經(jīng)濟觀察報》社授權(quán)，嚴禁轉(zhuǎn)載或鏡像，否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請致電：【010-60910566-1260】。