度小滿”軒轅”系列發(fā)布12款金融大模型,金融實戰(zhàn)能力出色

2024-03-11 11:51

3月11日,度小滿宣布“軒轅”系列金融大模型新增開源6B、13B、70B三種參數(shù)12款金融大模型。這12款大模型具有“以小搏大”的實力,在用戶信息分析、業(yè)務數(shù)據(jù)洞察等十余種金融實際任務評測中,達到自身2倍甚至5倍參數(shù)量的模型水平。

三種參數(shù)的基座模型、對話模型、int4量化模型、int8量化模型完全開源,開發(fā)者可在GitHub、HuggingFace、Model Scope等開源社區(qū)內(nèi)下載使用。

在“軒轅”模型矩陣中,70B及以上模型適合針對需要深度分析、復雜指令執(zhí)行以及全方位Agent調用的場景,而6B、13B的模型則更加適用于對響應速度有高要求、面向小規(guī)模場景和單任務的應用?!避庌@”6B-4-bit量化Chat模型則以其低推理部署成本,進一步降低大模型的應用門檻。

專注中文金融領域任務FinanceIQ大模型金融自動評測集顯示,在注冊會計師(CPA)、銀行從業(yè)資格、基金從業(yè)資格、證券從業(yè)資格等多項金融領域考試中,“軒轅”展示出金融領域專家的水平。

(“軒轅”系列大模型擁有遠超同參數(shù)水平的金融能力)

“軒轅”系列大模型在訓練方式上進行了多項創(chuàng)新,例如將人類偏好對齊技術引入了金融大模型訓練。通常多數(shù)垂類大模型僅在微調階段引入特定領域數(shù)據(jù),但這種方法在實際應用中常常顯示出局限性,金融行業(yè)的復雜性要求模型能夠更深入地理解并適應行業(yè)特定的需求。為此,度小滿構建了涵蓋通用性、安全性和金融特性的Prompt數(shù)據(jù)集,并組織了專業(yè)的標注團隊對成對的回答進行偏好標注,從而收集到了一批高質量、廣覆蓋的偏好數(shù)據(jù),并通過一系列實踐、分析和改進成功完成了獎勵模型和后續(xù)的強化訓練。

度小滿在2023年5月開源國內(nèi)首個千億級中文金融大模型“XuanYuan-176B”。2023年9月,“XuanYuan-70B”大模型在C-Eval和CMMLU兩大權威榜單上位列所有開源模型榜首。本次度小滿”“軒轅””模型矩陣再次升級,十億-百億-千億參數(shù)全覆蓋,實現(xiàn)多場景任務適配。

業(yè)內(nèi)普遍認為,金融大模型的價值體現(xiàn)在其能否在核心業(yè)務場景中發(fā)揮實際作用,如通過綜合分析用戶信息以支持風險評估、刻畫客戶畫像等。目前,”軒轅”金融大模型已經(jīng)應用在度小滿各個業(yè)務場景,從營銷、客服、風控、辦公再到研發(fā),已經(jīng)初見成效。在代碼助手方面,用大模型輔助生成的代碼,采納率能夠達到 42%,幫助公司整體研發(fā)效率提升了20%;在客服領域,大模型推動服務效率提升了 25%。 

“軒轅”大模型Github下載地址:https://github.com/Duxiaoman-DI/XuanYuan

版權與免責:以上作品(包括文、圖、音視頻)版權歸發(fā)布者【度小滿】所有。本App為發(fā)布者提供信息發(fā)布平臺服務,不代表經(jīng)觀的觀點和構成投資等建議