開源模型還是商業(yè)模型?阿里云智能張翅提出金融企業(yè)選擇大模型的6大挑戰(zhàn)

2024-05-27 14:18

大模型發(fā)展背景與趨勢

大模型是DT時(shí)代標(biāo)志性產(chǎn)物

大模型是數(shù)字轉(zhuǎn)型(DT)時(shí)代的產(chǎn)物,標(biāo)志著人工智能技術(shù)的一次重大突破,尤其是在自然語言處理(NLP)、圖像識別、推薦系統(tǒng)等領(lǐng)域。這些大模型,如OpenAI的GPT系列、Meta的Llama、Google的Gemini,基于Transformer架構(gòu),通過消化海量數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,獲得了對人類語言、圖像等數(shù)據(jù)的深入理解和處理能力。

Image

AI大模型:人類知識存儲、傳承和使用方式的一次重構(gòu)

在數(shù)字轉(zhuǎn)型時(shí)代,大模型為企業(yè)提供了前所未有的機(jī)遇,使其能夠通過高效的數(shù)據(jù)分析和決策,實(shí)現(xiàn)業(yè)務(wù)流程的智能化、優(yōu)化客戶體驗(yàn)和創(chuàng)新產(chǎn)品服務(wù)。從金融行業(yè)的智能投顧和欺詐監(jiān)測,到醫(yī)療行業(yè)的智能診斷和藥物發(fā)現(xiàn),再到零售行業(yè)的個(gè)性化推薦,大模型的應(yīng)用正深刻改變著傳統(tǒng)行業(yè)的運(yùn)作模式和價(jià)值鏈。

在《全域數(shù)據(jù)“觀”》一書中,我們曾斷言:“數(shù)據(jù)的下一站是智能,數(shù)據(jù)最終會走向與業(yè)務(wù)系統(tǒng)的數(shù)智融合”,數(shù)據(jù)消費(fèi)正在由“人”變成“系統(tǒng)”。未來數(shù)據(jù)技術(shù)將與云原生和智能化全面融合,形成“云數(shù)智一體化”服務(wù)。云原生技術(shù)棧,為企業(yè)帶來了資源彈性、異構(gòu)算力、容器和微服務(wù)等技術(shù)手段,為業(yè)務(wù)創(chuàng)新和系統(tǒng)建設(shè)提供了高效、敏捷以及成本低、可擴(kuò)展的解決方案;數(shù)據(jù)中臺的興起,讓企業(yè)將數(shù)據(jù)庫里“不會說話”的表格,轉(zhuǎn)換成指標(biāo)、標(biāo)簽、因子、特征等數(shù)據(jù)資產(chǎn)形態(tài),并直接用于分析與業(yè)務(wù)決策。現(xiàn)如今,AI大模型正在以驚人的速度重構(gòu)各行各業(yè)的業(yè)務(wù)流程與系統(tǒng)產(chǎn)品,一方面云原生為大模型訓(xùn)練與推理提供了資源保障,數(shù)據(jù)中臺為大模型應(yīng)用提供高質(zhì)量語料和結(jié)構(gòu)化知識;另一方面在大模型全面“智能涌現(xiàn)”能力的驅(qū)動(dòng)下,將傳統(tǒng)偏零散化的數(shù)據(jù)能力進(jìn)一步體系化和智能化,加快BI+AI的融合,實(shí)現(xiàn)從“洞見”到“決策”,推動(dòng)企業(yè)加速走向“云數(shù)智一體化”的終極形態(tài),最終為客戶帶來更為全新的產(chǎn)品服務(wù)體驗(yàn)。

大模型發(fā)展的趨勢

趨勢一:“Cloud+AI”大模型與云的結(jié)合日益緊密

在信息技術(shù)領(lǐng)域,無疑地,云計(jì)算和人工智能(AI)大模型的快速發(fā)展正日益成為推動(dòng)現(xiàn)代社會進(jìn)步的兩大驅(qū)動(dòng)力。特別是在中國和美國,這兩種技術(shù)不僅誕生并蓬勃發(fā)展,還持續(xù)引領(lǐng)著全球技術(shù)革命的浪潮。隨著時(shí)間的推移,大模型與云計(jì)算的結(jié)合日益緊密,這種融合在推動(dòng)著科技界走向新的里程碑。

首先,觀察全球技術(shù)發(fā)展格局可以發(fā)現(xiàn),中國和美國無疑是云技術(shù)和AI大模型誕生與創(chuàng)新的兩大中心。這兩個(gè)國家不僅擁有領(lǐng)先的技術(shù)研發(fā)實(shí)力,還具備廣闊的市場應(yīng)用場景和成熟的產(chǎn)業(yè)生態(tài),促進(jìn)了云計(jì)算和AI大模型技術(shù)的飛速發(fā)展,并在全球范圍內(nèi)形成了巨大的影響力。

進(jìn)一步而言,大模型的迭代進(jìn)化主要發(fā)生在云端。這是因?yàn)樵朴?jì)算提供了高度可擴(kuò)展的計(jì)算資源,使得研究人員和開發(fā)者能夠在無需自建龐大物理基礎(chǔ)設(shè)施的情況下,進(jìn)行模型的訓(xùn)練和部署。云平臺上的彈性資源和高效管理工具為大模型的開發(fā)和優(yōu)化提供了理想的環(huán)境,極大地加速了AI大模型的迭代周期,使得模型能夠更快地進(jìn)化和優(yōu)化,更好地適應(yīng)各種復(fù)雜的應(yīng)用需求。

而且,大模型所遵循的scaling laws(規(guī)模定律)正重塑著算力基礎(chǔ)設(shè)施。隨著模型規(guī)模的不斷擴(kuò)大,其對計(jì)算資源的需求也呈指數(shù)級增長,這一現(xiàn)象催生了對更高性能、更高效率算力基礎(chǔ)設(shè)施的需求。云計(jì)算平臺通過部署先進(jìn)的硬件技術(shù)、優(yōu)化計(jì)算資源分配和加強(qiáng)數(shù)據(jù)處理能力來應(yīng)對這一需求,進(jìn)而推動(dòng)了算力基礎(chǔ)設(shè)施的快速進(jìn)化。這種進(jìn)化不僅滿足了當(dāng)前大模型對算力的高需求,也為未來AI技術(shù)的持續(xù)創(chuàng)新和應(yīng)用提供了堅(jiān)實(shí)的支撐。

大模型與云計(jì)算的緊密結(jié)合,不僅體現(xiàn)在中國和美國這兩個(gè)技術(shù)強(qiáng)國的快速發(fā)展上,更在于云端成為大模型迭代進(jìn)化的主戰(zhàn)場,以及大模型對算力基礎(chǔ)設(shè)施的重新塑形。這種趨勢預(yù)示著,未來科技的進(jìn)步將在這樣的融合與互動(dòng)中繼續(xù)加速,推動(dòng)人類社會進(jìn)入一個(gè)全新的智能時(shí)代。

趨勢二:“AI Everywhere”大模型無處不在,成為企業(yè)數(shù)字化標(biāo)配

在當(dāng)今的數(shù)字化時(shí)代,大模型技術(shù)以其強(qiáng)大的數(shù)據(jù)處理能力和智能化水平,正逐步成為企業(yè)數(shù)字化轉(zhuǎn)型的標(biāo)配。其廣泛的應(yīng)用不僅僅局限于傳統(tǒng)的計(jì)算中心,更是與小模型、新終端以及數(shù)據(jù)中臺結(jié)合,共同構(gòu)筑起一個(gè)多元化部署與互聯(lián)互通的新生態(tài),極大地深化了對數(shù)據(jù)資源的挖掘與運(yùn)用能力。

首先,大模型與小模型的結(jié)合體現(xiàn)了模型部署的多元化。大模型因其強(qiáng)大的學(xué)習(xí)和預(yù)測能力,成為許多復(fù)雜任務(wù)的首選。然而,針對一些對實(shí)時(shí)性、資源消耗有嚴(yán)格要求的場景,小模型以其輕量級、高效率的特性,更為適合。通過將大模型預(yù)訓(xùn)練的強(qiáng)大認(rèn)知能力與小模型的靈活部署結(jié)合,企業(yè)能夠更高效、更經(jīng)濟(jì)地解決廣泛的業(yè)務(wù)問題,實(shí)現(xiàn)智能決策和操作的優(yōu)化。

接著,大模型與新終端的結(jié)合拓展了模型鏈接的多元化。隨著物聯(lián)網(wǎng)(IoT)的蓬勃發(fā)展,智能終端遍布生活的每一個(gè)角落。大模型不再局限于服務(wù)器端的運(yùn)算,而是通過云計(jì)算和邊緣計(jì)算下沉至各種智能終端,如智能手機(jī)、智能家居、自動(dòng)駕駛車輛等。這種變化使得大模型的應(yīng)用場景得到極大拓展,為用戶帶來更加豐富、便捷、個(gè)性化的智能服務(wù)。

最后,大模型與數(shù)據(jù)中臺的緊密結(jié)合,促進(jìn)了圖像、音視頻、文本等數(shù)據(jù)集的多元化。數(shù)據(jù)中臺作為企業(yè)數(shù)據(jù)管理和運(yùn)營的核心平臺,為大模型提供了豐富、高質(zhì)量的數(shù)據(jù)支持。通過有效地聚合和整合企業(yè)內(nèi)外的各類數(shù)據(jù)資源,大模型可以在更加多元化的數(shù)據(jù)基礎(chǔ)上進(jìn)行訓(xùn)練和優(yōu)化,能夠處理和理解更加復(fù)雜多變的業(yè)務(wù)場景,如圖像識別、語音視頻處理、語言應(yīng)用等,從而極大地提高了企業(yè)的業(yè)務(wù)處理能力和用戶交互體驗(yàn)。

大模型正逐步滲透到企業(yè)數(shù)字化建設(shè)的各個(gè)層面,與小模型、新終端以及數(shù)據(jù)中臺等多元化的元素相結(jié)合,進(jìn)一步拓寬了其應(yīng)用范圍,提升了處理效率和智能水平。大模型無處不在,已經(jīng)成為推動(dòng)企業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵力量。

趨勢三:“AI  Native SaaS Rise”大模型企業(yè)級市場崛起,向深度化、產(chǎn)業(yè)化、垂直化方向發(fā)展

大模型技術(shù)的崛起已成為推動(dòng)企業(yè)級市場向深度化、產(chǎn)業(yè)化、垂直化方向發(fā)展的關(guān)鍵動(dòng)力。企業(yè)正越來越傾向于將這一技術(shù)作為核心驅(qū)動(dòng)力,深入挖掘其在特定行業(yè)中的應(yīng)用價(jià)值和潛力,進(jìn)而實(shí)現(xiàn)智能化升級與業(yè)務(wù)創(chuàng)新。

首先,大模型在企業(yè)級市場中的深度化應(yīng)用成為一種不可逆轉(zhuǎn)的趨勢。它們不僅被應(yīng)用于優(yōu)化傳統(tǒng)的數(shù)據(jù)處理和分析流程,更在預(yù)測分析、個(gè)性化服務(wù)、自動(dòng)決策制定等領(lǐng)域中展現(xiàn)出強(qiáng)大的能力。這種深度化應(yīng)用的背后,是企業(yè)對于數(shù)據(jù)價(jià)值認(rèn)知的提升以及對于操作效率和決策質(zhì)量改進(jìn)的需求。

“小切口,大縱深”的發(fā)展策略,正加速大模型在特定行業(yè)中的垂直化和產(chǎn)業(yè)化落地。企業(yè)通過聚焦于行業(yè)的細(xì)分領(lǐng)域,利用大模型深耕特定的痛點(diǎn)和需求,不僅提升了解決方案的適配性和有效性,也推動(dòng)了整個(gè)行業(yè)的智能化水平。這種策略的實(shí)施,充分顯示了大模型在解決復(fù)雜行業(yè)問題時(shí)的獨(dú)特優(yōu)勢,促進(jìn)了技術(shù)與行業(yè)深度融合,實(shí)現(xiàn)了產(chǎn)業(yè)升級。

企業(yè)間的開放新形態(tài),特別是在金融領(lǐng)域涌現(xiàn)的新的Open Banking模式,為大模型技術(shù)的應(yīng)用開辟了更加廣闊的舞臺。Open Banking帶來的數(shù)據(jù)共享和API開放不僅有利于現(xiàn)有金融服務(wù)的增值,還為金融科技創(chuàng)新和跨行業(yè)合作打開了大門。這為大模型技術(shù)的應(yīng)用和發(fā)展提供了更加廣闊的舞臺和應(yīng)用場景。

大模型技術(shù)在企業(yè)級市場的崛起,不僅預(yù)示著企業(yè)對于數(shù)據(jù)和智能的更深層次應(yīng)用和挖掘,也引領(lǐng)了向產(chǎn)業(yè)化、垂直化方向的戰(zhàn)略發(fā)展。

趨勢四:“AI API First”大模型功能性能力突破性增長

近段時(shí)間以來,大模型正在經(jīng)歷功能性能力的快速增長和重大突破,其中多模態(tài)、Agent模式以及Assistant API成為了推動(dòng)這一進(jìn)程的關(guān)鍵力量。這些技術(shù)革新不僅擴(kuò)展了大模型在不同領(lǐng)域的應(yīng)用范圍,還為人機(jī)交互和應(yīng)用開發(fā)帶來了新的可能。

多模態(tài)技術(shù)的出現(xiàn)和成熟拓展了大模型的廣度,讓機(jī)器能夠同時(shí)處理和理解文本、圖像、音頻等多種類型的數(shù)據(jù),實(shí)現(xiàn)了對人類溝通方式的更全面理解。這標(biāo)志著AI從處理單一類型數(shù)據(jù)向綜合理解不同數(shù)據(jù)類型的重大進(jìn)步。多模態(tài)大模型在提升信息獲取的全面性和準(zhǔn)確性方面展示了巨大潛力,極大地豐富了AI在自動(dòng)化內(nèi)容創(chuàng)作、跨媒體信息檢索、以及增強(qiáng)現(xiàn)實(shí)等方面的應(yīng)用場景。

Agent模式的崛起,成為人類與AI協(xié)作的一種重要方式。在這種模式下,AI可以作為一個(gè)個(gè)體(agent),擁有自我學(xué)習(xí)和自主決策的能力,在特定的環(huán)境中根據(jù)既定的目標(biāo)執(zhí)行任務(wù)。這不僅表明了AI的工作模式正變得更加智能化和個(gè)性化,也為人類提供了強(qiáng)大的助手,從簡單的數(shù)據(jù)分析到復(fù)雜的決策制定,AI Agent能夠有效地輔助人類完成各種任務(wù),推動(dòng)人機(jī)協(xié)作進(jìn)入新的階段。

Assistant API的推出,為開發(fā)者提供了全新的能力,大幅降低了開發(fā)門檻。通過簡單的API調(diào)用,開發(fā)者可以輕松地將大模型的強(qiáng)大功能集成到自己的應(yīng)用或服務(wù)中,無需深入了解模型內(nèi)部的復(fù)雜機(jī)理,即可搭建出智能化程度高、用戶體驗(yàn)好的應(yīng)用產(chǎn)品。這種開放的、低門檻的開發(fā)方式,不僅加速了創(chuàng)新應(yīng)用的推出,也讓更多企業(yè)和個(gè)人能夠享受到AI技術(shù)帶來的紅利。

趨勢五:“AI Cyber Security”大模型更重視隱私和數(shù)據(jù)安全

隨著大模型的廣泛應(yīng)用,對隱私和數(shù)據(jù)安全的重視程度日益增強(qiáng)。企業(yè)和研究機(jī)構(gòu)正在通過實(shí)施一系列措施,來加強(qiáng)對用戶數(shù)據(jù)的保護(hù),確保信息安全和隱私被妥善處理。這些措施的核心在于構(gòu)建一個(gè)有效、可靠的數(shù)據(jù)管理及隱私防護(hù)框架,確保大模型安全評估體系的全面性,并解決AI工作的可解釋性問題。

有效的數(shù)據(jù)分類分級制度成為奠定數(shù)據(jù)管理及隱私防護(hù)框架的基礎(chǔ)。通過對數(shù)據(jù)進(jìn)行系統(tǒng)的分類和分級,明確不同類別數(shù)據(jù)的處理要求和安全標(biāo)準(zhǔn),可以更加有針對性地制定保護(hù)措施。這種方法不僅有助于提升數(shù)據(jù)處理的效率和精準(zhǔn)度,也有利于識別和保護(hù)那些最敏感和價(jià)值最高的數(shù)據(jù),從而有效減少數(shù)據(jù)泄露和濫用的風(fēng)險(xiǎn)。

構(gòu)建一套全面的安全評估體系對于大模型體系至關(guān)重要。這套體系應(yīng)涵蓋大模型訓(xùn)練、部署、應(yīng)用生命周期的各個(gè)階段,從數(shù)據(jù)的收集、存儲、使用到銷毀等,每個(gè)環(huán)節(jié)都應(yīng)進(jìn)行嚴(yán)格的安全審查和評估。通過定期進(jìn)行安全審計(jì)、漏洞掃描和風(fēng)險(xiǎn)評估等活動(dòng),可以及時(shí)發(fā)現(xiàn)和修復(fù)安全漏洞,強(qiáng)化系統(tǒng)的安全防護(hù)能力,減輕外部攻擊和內(nèi)部泄露的風(fēng)險(xiǎn)。

隨著大模型應(yīng)用到越來越多的場景,其工作的可解釋性問題越來越受到重視。大模型,特別是transformer的架構(gòu)被認(rèn)為是“黑盒”,難以解釋其決策邏輯和過程。增強(qiáng)AI工作的可解釋性不僅有助于建立用戶對AI決策的信任,也是確保模型公平、無偏見的關(guān)鍵。通過開發(fā)和應(yīng)用新的解釋性技術(shù)和方法,讓AI的決策過程更加透明,可以有效提升模型的公正性和安全性,減少錯(cuò)誤決策和偏差帶來的風(fēng)險(xiǎn)。

金融企業(yè)擁抱大模型面臨的挑戰(zhàn)

“科技本質(zhì)上是工具,其真正價(jià)值在于解決我們面臨的各種問題,而非僅限于自我展示的華麗舞臺?!边@一觀點(diǎn)在大模型領(lǐng)域同樣適用且更具象化。我們可以定位大模型:“大模型之于問題,恰似鑰匙之于鎖,其存在的意義在于解鎖通往智慧殿堂的大門,而非僅供觀瞻的浮華裝飾?!?/p>

大模型在金融領(lǐng)域的廣泛應(yīng)用并非一片坦途,它在為金融機(jī)構(gòu)帶來顯著價(jià)值增益的同時(shí),亦暴露出一系列不容忽視的問題與挑戰(zhàn)。這些問題不僅關(guān)乎技術(shù)層面的可行性與穩(wěn)定性,更延伸至合規(guī)、安全、倫理等多個(gè)關(guān)鍵維度,對金融企業(yè)的穩(wěn)健運(yùn)營與長期發(fā)展構(gòu)成潛在考驗(yàn)。因此,深入探討金融企業(yè)采用大模型可能面臨的問題,對于理性評估其戰(zhàn)略價(jià)值,制定科學(xué)的應(yīng)對策略,乃至推動(dòng)整個(gè)行業(yè)在技術(shù)創(chuàng)新與風(fēng)險(xiǎn)管理之間找到平衡至關(guān)重要。

問題1: “有限算力+持續(xù)進(jìn)化的算力”,雙重制約下的算力資源

“有限算力+持續(xù)進(jìn)化的算力”,這種雙重制約下的算力資源現(xiàn)狀,體現(xiàn)了大模型時(shí)代中一個(gè)核心的矛盾和挑戰(zhàn):如何在當(dāng)前資源的限制之下,同時(shí)規(guī)劃和適應(yīng)不斷進(jìn)化和增強(qiáng)的計(jì)算能力。這對應(yīng)用場景選擇、資源投入、大模型部署方式等方面提出了復(fù)雜的要求。

1、算力永遠(yuǎn)短缺:隨著大模型參數(shù)量的持續(xù)膨脹,其對算力資源的消耗顯著增長。同時(shí),在AI持續(xù)“重塑”業(yè)務(wù)流程的過程中,對算力資源的需求也出現(xiàn)了急劇飆升。這兩方面因素相疊加,共同加劇了現(xiàn)有算力資源供不應(yīng)求的局面,使得算力短缺成為了一個(gè)常態(tài)性的挑戰(zhàn)。

2、硬件高速迭代:GPU每18到24個(gè)月,迭代出一代新產(chǎn)品,配備更先進(jìn)的架構(gòu)和更強(qiáng)大的計(jì)算能力,而通常采購周期都以年為單位,使得我們將不得不面對,剛上線的算力資源,就被新一代所淘汰,性價(jià)比下降,同時(shí)還要面對算力利用率不高,資源極度浪費(fèi)的情況。

3、資源兼容優(yōu)化配置:國內(nèi)外的不同廠商GPU算力水平參差不齊,技術(shù)框架互不兼容,整合這些異構(gòu)的資源,管理配置和優(yōu)化算力的使用,將是我們面臨的又一個(gè)挑戰(zhàn)。

問題2: “開源模型 vs 商業(yè)模型”,左右互搏的自建大模型之路

在大模型選型之路上,是選擇開源模型還是商業(yè)模型?開源大模型和開源軟件是一回事嗎?

成熟開源軟件與當(dāng)下開源模型區(qū)別:

1、成熟開源軟件通常是技術(shù)和能力相對成熟和穩(wěn)定的軟件應(yīng)用和系統(tǒng),分享的是完整的代碼庫和文檔,用戶可以自由地對與自身業(yè)務(wù)有關(guān)的代碼進(jìn)行修改,一般以使用核心能力為主定制為輔,版本迭代周期相對比較慢,同時(shí)也會規(guī)定了用戶使用軟件的權(quán)利和限制條件。

2、當(dāng)下開源模型是專注于數(shù)據(jù)科學(xué)、人工智能和相關(guān)領(lǐng)域,作為數(shù)據(jù)處理和分析的關(guān)鍵組件,正處于技術(shù)迭代的高速發(fā)展期,一般以月或季度為單位進(jìn)行新版本發(fā)布,并且技術(shù)和能力持續(xù)性攀升,一般版本開源是有限的,無法按照客戶業(yè)務(wù)進(jìn)行深度的定制,并且全局能力一般不建議調(diào)整。

開源模型與商業(yè)模型的優(yōu)勢與不足:

1、開源模型:通常允許用戶審查和驗(yàn)證模型的代碼和架構(gòu),不需要支付額外的許可費(fèi)用,能夠通過社區(qū)迭代升級。但需要專業(yè)人才研究和業(yè)務(wù)磨合嘗試,周期長見效慢,缺少專門維護(hù)和支持,不包含商業(yè)產(chǎn)品中的安全和穩(wěn)定性,文檔和易用性支持較弱,模型升級迭代周期一般6-12個(gè)月,業(yè)務(wù)集成應(yīng)用的時(shí)間會更長。我們不應(yīng)該拘泥于對種類繁多參數(shù)的基礎(chǔ)模型進(jìn)行訓(xùn)練或微調(diào),模型能力比對和測評,應(yīng)該把更多精力放在如何讓模型在業(yè)務(wù)中產(chǎn)生價(jià)值,因?yàn)椴煌哪P鸵蛴?xùn)練數(shù)據(jù)的差別,業(yè)務(wù)適配能力又有不同。

2、商業(yè)模型:提供商雖然提供全面的客戶支持和服務(wù),附帶明確的服務(wù)等級協(xié)議(SLA),模型迭代升級非???,公有云以月為單位小版本迭代,線下以季度訂閱更新,并提供對兼容性、穩(wěn)定性和安全性的保證,能夠滿足金融行業(yè)的法規(guī)和遵從性要求,也提供完整的解決方案,軟硬件產(chǎn)品的良好整合,降低業(yè)務(wù)場景落地的風(fēng)險(xiǎn)。但技術(shù)透明性較差,長期依賴特定的商業(yè)模型和平臺可能導(dǎo)致供應(yīng)商鎖定,降低切換供應(yīng)商的靈活性。

問題3: “大模型 vs 越來越大的模型”,模型size的軍備競賽

OpenAI的研究者在2020年發(fā)現(xiàn),大語言模型也遵循著規(guī)模定律(Scaling Law),模型參數(shù)數(shù)量的增加常常被看作是提高模型性能的一個(gè)關(guān)鍵因素。這導(dǎo)致了一種被業(yè)界戲稱為“模型參數(shù)的軍備競賽”的現(xiàn)象,即科研機(jī)構(gòu)和科技公司不斷推出參數(shù)量更大、計(jì)算需求更高的模型,以追求在特定任務(wù)上的最佳性能。然而,這種軍備競賽帶來了諸多挑戰(zhàn):

越來越大的模型通常具有更強(qiáng)的學(xué)習(xí)能力和泛化能力,因?yàn)橛懈嗟膮?shù)可以捕捉數(shù)據(jù)中的復(fù)雜特征和模式。能夠處理更復(fù)雜的任務(wù)和數(shù)據(jù)集,通常在各種基準(zhǔn)和實(shí)際問題上表現(xiàn)更好。隨著參數(shù)數(shù)量的增加,模型通常能夠更好地理解語言的細(xì)微差別或更精準(zhǔn)地識別圖像中的對象。   

但越來越大的模型帶來能力提升的同時(shí),也帶來了海量的算力消耗,如何根據(jù)不同的業(yè)務(wù)場景選擇合適的模型將是一個(gè)迫在眉睫的問題?

大模型推理運(yùn)行時(shí),核心消耗的資源是顯存,推理過程中除了要加載對應(yīng)參數(shù)的模型,還與輸入輸出的參數(shù)量有關(guān),輸入?yún)?shù)越多顯存消耗越大,輸出參數(shù)量越多模型響應(yīng)越慢,我們根據(jù)一個(gè)簡單的估算公式,來評估不同業(yè)務(wù)場景的資源消耗:

大模型推理的總顯存占用公式:  ≈1.2?

(詳見參考:Transformer Inference Arithmetic | kipply's blog)

以72B參數(shù)的模型,在BF16精度下(浮點(diǎn)數(shù)2個(gè)字節(jié))

≈1.2*(72億*2)≈172.8G

運(yùn)行一個(gè)72B的大模型至少需要3張A100(80G),現(xiàn)以企業(yè)知識庫和智能外呼場景為例進(jìn)行資源評估:

 知識庫檢索場景:典型的RAG增強(qiáng)檢索高并發(fā)場景,輸入少輸出多,每次問題請求處理時(shí)間在1-2s,峰值支持50并發(fā)(按照5000人的金融機(jī)構(gòu)有1%的并發(fā)率),需要的GPU卡的數(shù)量在150-300張A100(80G),如果想要更精準(zhǔn)的回復(fù),可以選擇200B或更大的模型,但200B大模型算力消耗會有2.7倍的增加。

 智能外呼場景:典型的高并發(fā)低延時(shí)場景,輸入多輸出少,每次意圖識別響應(yīng)時(shí)間200-300ms,峰值支持1000并發(fā),需要的GPU卡的數(shù)量在600-900張A100(80G)。

在正式生產(chǎn)業(yè)務(wù)應(yīng)用時(shí),業(yè)務(wù)是有典型的波峰波谷的,如果我們按照波峰要求建設(shè)算力池,勢必會帶來資源的低效使用,例如:知識庫檢索應(yīng)用的平均資源利用率在20%-30%;智能外呼應(yīng)用的平均資源利用率在5%-10%。如何提高算力資源利用率將是一個(gè)頗具挑戰(zhàn)的問題?

問題4: “大模型RAG一天入門 vs 365天的持續(xù)優(yōu)化”,RAG系統(tǒng)的修行

Retrieval-Augmented Generation (RAG) 技術(shù)巧妙融合了信息檢索與文本生成的雙重優(yōu)勢,為應(yīng)對復(fù)雜查詢和生成任務(wù)(如問答系統(tǒng)、內(nèi)容創(chuàng)造)提供了強(qiáng)有力的支持。盡管RAG技術(shù)展現(xiàn)出顯著提升模型效能與拓展應(yīng)用領(lǐng)域的潛力,它也遭遇了幾點(diǎn)核心挑戰(zhàn),制約著其性能的極致發(fā)揮:

1、語義檢索難關(guān):實(shí)現(xiàn)精準(zhǔn)的語義檢索面臨重重障礙,首要在于深入理解用戶查詢與文檔內(nèi)容的深層含義,并準(zhǔn)確評估兩者間的語義契合度。當(dāng)前普遍采用基于數(shù)據(jù)向量化的手段,在向量空間通過距離或相似度指標(biāo)來衡量語義接近度,但這種方法難以完美解決語義多義性、信息粒度不匹配、全局與局部相關(guān)性的權(quán)衡,以及向量空間分布不均帶來的檢索效率與效果問題。

2、 信息增強(qiáng)的精細(xì)度:整合檢索信息的過程中,若缺乏對上下文的把握,生成的文本容易顯得碎片化,連貫性缺失。特別是在處理來自多個(gè)來源、風(fēng)格迥異的段落時(shí),既要避免內(nèi)容重復(fù),又要依據(jù)查詢語境對檢索片段精挑細(xì)選并合理排序,以確保輸出的一致性和流暢度,這一過程考驗(yàn)著信息增強(qiáng)機(jī)制的智能化水平。

3、 延遲挑戰(zhàn):在即時(shí)交互場景,如在線客服對話系統(tǒng)中,檢索與生成的響應(yīng)時(shí)間直接關(guān)系到用戶體驗(yàn)。為了減少延遲,優(yōu)化模型效率與系統(tǒng)架構(gòu)成為迫切需求,要求RAG技術(shù)能在高時(shí)效性要求的應(yīng)用中穩(wěn)定運(yùn)行。

問題5: “殺手級通用大模型 vs 百花齊放專屬大模型”,企業(yè)級AI應(yīng)用的價(jià)值自證?

企業(yè)在利用大模型進(jìn)行業(yè)務(wù)升級改造時(shí),選擇使用一個(gè)殺手級通用大模型,還是百花齊放的專屬大模型,取決于您具體的業(yè)務(wù)需求、戰(zhàn)略目標(biāo)和資源限制。無論選擇哪種模式,都會面臨挑戰(zhàn)和價(jià)值自證。

殺手級通用大模型:選擇大參數(shù)的基礎(chǔ)模型,結(jié)合企業(yè)的數(shù)據(jù)進(jìn)行微調(diào),構(gòu)建企業(yè)級的殺手級通用大模型。其優(yōu)勢在于能快速處理多樣化的任務(wù)和應(yīng)用場景,更快的帶來直接的業(yè)務(wù)價(jià)值和經(jīng)濟(jì)收益;其挑戰(zhàn)在于越大參數(shù)的模型微調(diào)需要的數(shù)據(jù)量就越大,算力消耗也更大,而且也較難應(yīng)對特殊的高并發(fā)低延時(shí)場景。

百花齊放的專屬大模型:根據(jù)不同知識域的業(yè)務(wù)需要,選擇適合參數(shù)的大模型微調(diào)業(yè)務(wù)專屬大模型,能夠吸引和滿足更廣泛的客戶群體和個(gè)性化定制服務(wù)的需要。通常情況越小參數(shù)的大模型,微調(diào)的效果越好,越大參數(shù)的模型微調(diào)的效果越難保障。多樣化的模型和應(yīng)用需求,可以快速推動(dòng)企業(yè)在不同領(lǐng)域進(jìn)行技術(shù)和業(yè)務(wù)創(chuàng)新。但多樣化專屬大模型,貴在精不在多,如何決策需要構(gòu)建哪些專屬大模型呢?又如何解決多個(gè)專屬大模型統(tǒng)一運(yùn)維管理的挑戰(zhàn)?

無論選擇哪種方式,都要確保大模型構(gòu)建的AI應(yīng)用能夠與企業(yè)的長期戰(zhàn)略相契合,并在實(shí)現(xiàn)業(yè)務(wù)目標(biāo)的同時(shí),提升客戶體驗(yàn)和企業(yè)運(yùn)營效率。因企業(yè)的自身特有數(shù)據(jù)量有限,大模型的微調(diào)需量力而行,比如當(dāng)前千億參數(shù)以上的大模型就不適合微調(diào),不僅成本消耗大且能力提升有限,有可能還會影響原有大模型的推理能力。更為重要的是要建立收集反饋和定期評估應(yīng)用的機(jī)制,推動(dòng)大模型和業(yè)務(wù)應(yīng)用的優(yōu)化,在不斷調(diào)整和完善中體現(xiàn)出AI大模型的價(jià)值。

問題6: “大模型廣泛應(yīng)用 vs 應(yīng)用安全隱患”,大模型面臨的安全挑戰(zhàn)

隨著大模型深入應(yīng)用,一些因大模型關(guān)聯(lián)引發(fā)的安全問題讓大家重視起來,如大規(guī)模數(shù)據(jù)采集和應(yīng)用帶來的個(gè)人隱私泄露和濫用的問題,大模型生成內(nèi)容可能帶有的偏見歧視、違法違規(guī)、科技倫理類問題,以及利用大模型強(qiáng)大能力用于欺詐等惡意應(yīng)用場景的問題等??偟膩碚f,大模型在安全方面面臨大模型自身安全和模型應(yīng)用安全兩個(gè)方面的挑戰(zhàn)。

大模型自身安全的挑戰(zhàn):

1、大模型訓(xùn)練安全:如何使用數(shù)字加密技術(shù)和差分隱私技術(shù)在訓(xùn)練過程中保護(hù)敏感數(shù)據(jù)安全?如何清洗訓(xùn)練數(shù)據(jù),以避免潛在的惡意數(shù)據(jù)注入或偏差造成的訓(xùn)練問題?如何定期對訓(xùn)練數(shù)據(jù)和模型權(quán)重進(jìn)行審計(jì),以檢測潛在的安全隱患或異常模式?

2、大模型生成的風(fēng)險(xiǎn):涉及敏感知識點(diǎn)的問題不允許答錯(cuò):但大模型本身的幻覺問題嚴(yán)重,怎樣避免?隱晦風(fēng)險(xiǎn)和多輪對話上下文:傳統(tǒng)的防控手段很難應(yīng)對這么復(fù)雜的風(fēng)險(xiǎn),怎么辦?復(fù)雜的指令對抗:對于層出不窮的誘導(dǎo)、變種等攻擊,怎樣能做到全面的防控?

大模型應(yīng)用與部署安全的挑戰(zhàn):

1、大模型部署安全:如何針對模型抵抗對抗性攻擊做強(qiáng)化訓(xùn)練,例如將對抗性樣本加入訓(xùn)練集進(jìn)行魯棒性提升?如何對模型輸入實(shí)施嚴(yán)格的驗(yàn)證和過濾機(jī)制,以防止惡意輸入?如何實(shí)施訪問控制和身份驗(yàn)證機(jī)制,確保只有授權(quán)用戶才能訪問和使用模型?

2、模型應(yīng)用部署安全:如何針對模型應(yīng)用服務(wù)訪問控制和輸入輸出進(jìn)行安全防控?如何進(jìn)行防御DDoS攻擊、防范惡意勒索、大促安全風(fēng)控、遠(yuǎn)程辦公安全等風(fēng)險(xiǎn)的實(shí)時(shí)防護(hù)?如何持續(xù)監(jiān)控模型性能和行為,以及它們對輸入反饋的響應(yīng),以便及時(shí)發(fā)現(xiàn)問題,實(shí)施日志記錄和異常檢測系統(tǒng)來追蹤潛在的安全事件?如何構(gòu)建有效的大模型安全圍欄,制定安全措施和策略,保障大模型應(yīng)用的完整性、隱私、可控性和抵御外部攻擊?

金融級AI原生的要素與藍(lán)圖

金融級AI原生的發(fā)展

講到AI,業(yè)內(nèi)主要分為生成式AI(Generative AI)與判別式AI(Discriminant AI)這兩種不同類型的機(jī)器學(xué)習(xí)模型,它們在數(shù)據(jù)建模和應(yīng)用領(lǐng)域上存在顯著差異。

判別式AI,主要關(guān)注基于已有數(shù)據(jù)進(jìn)行分析和預(yù)測。它通過學(xué)習(xí)輸入和輸出之間的關(guān)系來建立決策邊界,對新的輸入數(shù)據(jù)進(jìn)行分類或回歸等任務(wù)。常見的判別式AI模型包括邏輯回歸、支持向量機(jī)和深度神經(jīng)網(wǎng)絡(luò)等。判別式AI在推薦系統(tǒng)、風(fēng)控系統(tǒng)等領(lǐng)域有廣泛應(yīng)用。

生成式AI則關(guān)注學(xué)習(xí)輸入數(shù)據(jù)的分布規(guī)律,并模擬出與輸入數(shù)據(jù)類似的新數(shù)據(jù)。它不僅能預(yù)測數(shù)據(jù)之間的關(guān)系,還能夠生成新的數(shù)據(jù)。

AI原生系統(tǒng)從一開始就被設(shè)計(jì)成能夠充分利用判別式AI和生成式AI技術(shù),以實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)、智能化決策和服務(wù)的自動(dòng)化。AI原生涵蓋了從數(shù)據(jù)處理、模型訓(xùn)練、推理應(yīng)用到迭代優(yōu)化的全過程,目的是讓AI技術(shù)如同操作系統(tǒng)一樣成為日常業(yè)務(wù)運(yùn)行的基礎(chǔ)。

Image

AI原生是一種全新的技術(shù)架構(gòu)和思維方式,將AI技術(shù)作為一種基礎(chǔ)能力,深度整合到企業(yè)的基礎(chǔ)設(shè)施、業(yè)務(wù)流程、產(chǎn)品設(shè)計(jì)和服務(wù)模式中。

金融機(jī)構(gòu)作為國民經(jīng)濟(jì)的中樞支柱,其運(yùn)作效能、風(fēng)險(xiǎn)管控及服務(wù)質(zhì)量對社會經(jīng)濟(jì)的整體穩(wěn)定與發(fā)展具有深遠(yuǎn)影響。金融級AI原生(Financial-Grade AI Native)是一個(gè)綜合性概念,旨在描述那些專為滿足金融行業(yè)最嚴(yán)格需求而設(shè)計(jì)和優(yōu)化的AI系統(tǒng)和應(yīng)用。這些系統(tǒng)不僅在技術(shù)層面上高度先進(jìn),還在安全性、可靠性、可擴(kuò)展性和合規(guī)性等方面達(dá)到了金融行業(yè)的高標(biāo)準(zhǔn)。

金融級AI原生的六大要素

AI技術(shù)在金融行業(yè)中扎根生長并深入應(yīng)用,必須嚴(yán)格遵循金融行業(yè)的業(yè)務(wù)規(guī)則與標(biāo)準(zhǔn),這就催生了專為金融領(lǐng)域打造的金融級AI原生。綜合考慮金融級行業(yè)要求、AI原生核心技術(shù),我們將金融級AI原生總結(jié)為如下6大要素:

Image

要素1:可靠性和穩(wěn)定性

當(dāng)前金融行業(yè)隨著數(shù)字化、智能化的轉(zhuǎn)型,越來越多的金融級AI原生應(yīng)用涌現(xiàn),大規(guī)模智算資源的統(tǒng)籌管理和編排調(diào)度,對于確保金融基礎(chǔ)設(shè)施的連續(xù)性與穩(wěn)定性成為至關(guān)重要的能力基石。下面從訓(xùn)練態(tài)和推理態(tài)兩個(gè)方面來說明智算平臺需要提供怎樣的能力來保證應(yīng)用的可靠性和穩(wěn)定性。

訓(xùn)練態(tài):

智算平臺需要大規(guī)模集群調(diào)度管理,洞察集群狀態(tài)與性能變化,掌控系統(tǒng)全貌。通過訓(xùn)練引擎自動(dòng)容錯(cuò)來屏蔽底層錯(cuò)誤,提升任務(wù)穩(wěn)定性和魯棒性。通過實(shí)時(shí)保存模型文件,大幅度提高訓(xùn)練任務(wù)的整體效率。通過云原生性能測試平臺, 完成一鍵測試系統(tǒng)性能,及時(shí)發(fā)現(xiàn)隱藏的瓶頸。

Image

推理態(tài):

目前大模型的推理部署還沒有一個(gè)事實(shí)標(biāo)準(zhǔn),一方面不斷有新的模型發(fā)布,另一方面也不斷有新的訓(xùn)練和推理方法被提出,再者國產(chǎn)化GPU硬件和軟件生態(tài)也在快速迭代,這給大模型推理服務(wù)生產(chǎn)上落地帶來不小挑戰(zhàn)。為了應(yīng)對上述挑戰(zhàn)在模型準(zhǔn)備和部署階段,我們建議遵從以下原則:

Image

分層設(shè)計(jì):由于模型本身文件較大,模型加載和啟動(dòng)時(shí)間往往以分鐘甚至小時(shí)計(jì)。在模型準(zhǔn)備階段,將運(yùn)行依賴環(huán)境、模型文件、推理代碼分層設(shè)計(jì)統(tǒng)一驗(yàn)證并推送到合適的存儲服務(wù)層;在模型部署階段,通過云平臺存算分離,共享掛載、緩存加速等方式實(shí)現(xiàn)模型的快速部署和加速啟動(dòng);

統(tǒng)一調(diào)度:基于K8S 對IaaS 云服務(wù)或者客戶 IDC 內(nèi)各種異構(gòu)的計(jì)算(如CPU,GPU,NPU)、存儲(OSS,NAS, CPFS,HDFS)、網(wǎng)絡(luò)(TCP, RDMA)資源進(jìn)行抽象,統(tǒng)一管理、運(yùn)維和分配,通過彈性和軟硬協(xié)同優(yōu)化,持續(xù)提升資源利用率。

云化部署:借助K8S調(diào)度框架和云化基礎(chǔ)設(shè)施,實(shí)現(xiàn)對大模型應(yīng)用的多實(shí)例高可用部署和故障自動(dòng)切換。

要素2:低延時(shí)與高并發(fā)

大模型在實(shí)現(xiàn)低延時(shí)和高并發(fā)處理方面是AI原生應(yīng)用的重大挑戰(zhàn)之一,尤其是在需要實(shí)時(shí)響應(yīng)和服務(wù)大量用戶的應(yīng)用場景中。

實(shí)時(shí)交易的場景下,系統(tǒng)需要幾乎實(shí)時(shí)地處理和響應(yīng)用戶的查詢或請求。如銀行行業(yè)客戶通話的場景中,需要應(yīng)用大模型實(shí)時(shí)識別用戶意圖,并實(shí)時(shí)反饋相應(yīng)的話術(shù),這個(gè)場景對大模型的時(shí)延要求非常高,需要在很短的時(shí)間來做出相應(yīng)的應(yīng)答。同樣在保險(xiǎn)行業(yè)中,利用大模型處理車險(xiǎn)、健康險(xiǎn)等理賠案件,需要迅速分析上傳的圖片、視頻及其他證據(jù)材料,快速準(zhǔn)確地完成初步定損工作。當(dāng)前,推理優(yōu)化、加速主要有幾種方式,如模型架構(gòu)(使用MoE架構(gòu))優(yōu)化、模型本身(剪枝、量化、知識蒸餾等)優(yōu)化,和利用多機(jī)多卡環(huán)境進(jìn)行數(shù)據(jù)并行、模型并行,分散模型負(fù)載,加速計(jì)算過程。

高并發(fā)場景是指在短時(shí)間內(nèi)有大量用戶請求涌入系統(tǒng),要求系統(tǒng)能快速響應(yīng)并處理這些請求,保證服務(wù)的穩(wěn)定性和用戶體驗(yàn)。如紅包發(fā)放的促銷活動(dòng)期間,大量用戶同時(shí)進(jìn)行請求,在紅包領(lǐng)取的同時(shí)需要應(yīng)用大模型做實(shí)時(shí)推薦。高并發(fā)可以通過調(diào)度優(yōu)化來支撐,調(diào)度系統(tǒng)可以根據(jù)請求狀態(tài)的動(dòng)態(tài)變化對調(diào)度決策進(jìn)行適應(yīng)性調(diào)整,并以此實(shí)現(xiàn)如負(fù)載均衡、碎片整理、請求優(yōu)先級、高效的實(shí)例擴(kuò)縮容等一系列調(diào)度特性和優(yōu)化。

我們來看一個(gè)實(shí)際的案例:一家互聯(lián)網(wǎng)金融企業(yè),在外呼過程中,通過大模型識別客戶意愿,完成多輪客戶對話交互。

Image

從當(dāng)前業(yè)務(wù)模式觀察,存在顯著的忙閑周期:在需求高峰時(shí)段,必須確保充足計(jì)算能力以維持業(yè)務(wù)運(yùn)營,確??蛻粝硎艿絻?yōu)質(zhì)的外呼體驗(yàn);而到了低谷期,則需釋放這些資源,以便供給其他業(yè)務(wù)利用。然而,當(dāng)這些釋放的計(jì)算資源無其他業(yè)務(wù)承接時(shí),便會造成極大的資源閑置。專為某特定業(yè)務(wù)保有大量計(jì)算資源是不切實(shí)際的,因?yàn)橥ǔG闆r下,這些資源的使用效率極低,僅能達(dá)到約10%。因此,尋找一種既能應(yīng)對峰值需求,又能高效利用資源的策略顯得尤為重要。而混合云架構(gòu)可以較好地解決這個(gè)問題,利用金融云的彈性資源來滿足波峰波谷的業(yè)務(wù)需求。

要素3:擴(kuò)展性與多樣性

大模型的擴(kuò)展性與多樣性是確保其在未來可持續(xù)發(fā)展和適應(yīng)新需求的關(guān)鍵屬性。這兩個(gè)概念在大模型的設(shè)計(jì)、開發(fā)、部署和維護(hù)過程中扮演著重要角色。

擴(kuò)展性是指為了滿足業(yè)務(wù)發(fā)展的需求,需要一種彈性的伸縮架構(gòu),滿足大模型應(yīng)用對不斷增長算力的需求。通過這種彈性的伸縮架構(gòu),來解決了前面提到的“有限算力”的問題。

對于金融客戶來說,目前有三種算力資源擴(kuò)展的形態(tài)可以選擇:

一、直接使用金融云的公共資源池。對于數(shù)據(jù)可以上云的客戶來說,企業(yè)無需自行構(gòu)建復(fù)雜的算力基礎(chǔ)設(shè)施或大模型開發(fā)平臺,而是直接利用公共資源池來進(jìn)行模型推理和高效微調(diào)。金融云提供了簡便的應(yīng)用開發(fā)平臺,開發(fā)完畢的應(yīng)用能夠便捷地通過API接口進(jìn)行業(yè)務(wù)集成與調(diào)用,在金融云環(huán)境中,可以按需隨意進(jìn)行算力資源的擴(kuò)縮容,從而極大地提升了效率和靈活性。

二、金融云客戶VPC方式。對于有數(shù)據(jù)安全管控需求的客戶,建議采用VPC方式。大模型應(yīng)用及知識庫部署在金融云客戶VPC環(huán)境中,確保推理過程中產(chǎn)生的數(shù)據(jù)及微調(diào)所用的數(shù)據(jù)均存儲在客戶VPC的區(qū)域內(nèi),以此加強(qiáng)數(shù)據(jù)的隱私性和安全性。應(yīng)用的開發(fā)工作在公共資源池的平臺進(jìn)行,同時(shí)該平臺支持大模型的微調(diào)及推理等功能。一旦應(yīng)用開發(fā)完成,便部署到客戶VPC區(qū)域,并通過API接口無縫對接公共資源池中的大模型服務(wù),實(shí)現(xiàn)高效、安全的資源調(diào)用與協(xié)同作業(yè)。在客戶VPC方式中,同樣可以根據(jù)需要對算力資源進(jìn)行動(dòng)態(tài)擴(kuò)縮容。

三、線下IDC與金融云混合方式。對于私有數(shù)據(jù)不能出域的客戶,可以采用線下數(shù)據(jù)中心(IDC)與金融云混合的方式。企業(yè)在其內(nèi)部的IDC中構(gòu)建智能計(jì)算集群,部署大模型及應(yīng)用開發(fā)平臺。應(yīng)用的開發(fā)全程在IDC內(nèi)完成,并在IDC環(huán)境中部署運(yùn)行。在面對業(yè)務(wù)高峰或IDC資源緊張的情況下,企業(yè)可以采取靈活策略,將大模型擴(kuò)展到金融云的資源池中,實(shí)現(xiàn)流量的智能分配,將部分業(yè)務(wù)負(fù)載轉(zhuǎn)移到金融云上進(jìn)行高效的模型推理,以應(yīng)對高并發(fā)需求。同時(shí),根據(jù)實(shí)際需要,可以選擇性地將微調(diào)數(shù)據(jù)遷移至金融云,利用其強(qiáng)大算力進(jìn)行模型的微調(diào),進(jìn)一步優(yōu)化性能和服務(wù)能力。

Image

混合云解決方案支持大模型在私有云和公共云之間無縫遷移和部署,用戶可以通過統(tǒng)一的云管理平臺對分布在不同環(huán)境下的計(jì)算資源進(jìn)行集中管理和調(diào)度,簡化運(yùn)維復(fù)雜性。在網(wǎng)絡(luò)互聯(lián)上,通過先進(jìn)的混合云網(wǎng)絡(luò)技術(shù),實(shí)現(xiàn)網(wǎng)絡(luò)的高速穩(wěn)定互聯(lián)。

我們來看一個(gè)實(shí)際的案例:某證券公司通過大模型將咨詢、公告、年報(bào)、研報(bào)、路演、業(yè)績通告視頻等多模態(tài)信息納入知識庫,滿足內(nèi)部分析師和機(jī)構(gòu)用戶的知識問答、觀點(diǎn)總結(jié)生成。應(yīng)用大模型準(zhǔn)確理解用戶搜索意圖并提供邏輯分析能力、歸納總結(jié)能力。

Image

1、客戶線下IDC進(jìn)行大模型微調(diào),對微調(diào)好后的模型在線下IDC和金融云兩套環(huán)境進(jìn)行模型部署;

2、業(yè)務(wù)調(diào)用時(shí),分為兩種情況:

1)業(yè)務(wù)流程正常的情況下,直接使用線下IDC的資源,為業(yè)務(wù)提供在線推理服務(wù)。

2)當(dāng)業(yè)務(wù)流量高峰期間,如果線下IDC資源不足以應(yīng)對業(yè)務(wù)調(diào)用,采用分流的方式,將用戶請求調(diào)撥至金融云,從而實(shí)現(xiàn)高效的SLA保障。在這種調(diào)用方式下,考慮到私有數(shù)據(jù)不能出域的情況下,需要在線下IDC完成敏感信息處理工作,將脫敏后的內(nèi)容調(diào)用金融云上的大模型。

大模型的多樣性體現(xiàn)在多個(gè)方面,包括模型尺寸的多樣性、多模態(tài)、模型部署形態(tài)的多樣性、和應(yīng)用場景的適配性。為順應(yīng)不同場景用戶的需求,有不同參數(shù)規(guī)模橫跨5億到1100億的多款大語言模型。在模型的部署形態(tài)上,小尺寸模型可便捷地在手機(jī)、PC等端側(cè)設(shè)備部署。在應(yīng)用場景的適配性上,大尺寸模型如千億能支持企業(yè)級和科研級的應(yīng)用;中等尺寸如30B左右的在性能、效率和內(nèi)存占用之間找到最具性價(jià)比的平衡點(diǎn)。

正是因?yàn)榇竽P偷亩鄻有?,使得在具體的業(yè)務(wù)場景,可以采用大小模型相結(jié)合,既能充分利用大模型的優(yōu)點(diǎn),又能保持成本效益。通過將任務(wù)分解,用大模型處理那些需要高準(zhǔn)確性的復(fù)雜分析,用小模型則快速處理那些對時(shí)效性要求高的任務(wù)。

以我們在財(cái)管領(lǐng)域的一個(gè)客戶為例,通過大模型來進(jìn)行問題規(guī)劃和任務(wù)分解,通過小模型來構(gòu)建各種Agent,實(shí)現(xiàn)了跟螞蟻支小寶相似的效果。通過大小模型相結(jié)合的方式,既滿足了需要,也降低應(yīng)用成本。

Image

大小模型相結(jié)合構(gòu)建理財(cái)機(jī)器人

 要素4:安全性與合規(guī)性

2023 年 8 月 15 日,國家網(wǎng)信辦聯(lián)合國家發(fā)展改革委、教育部、科技部、工業(yè)和信息化 部、公安部、廣電總局公布《生成式人工智能服務(wù)管理暫行辦法》開始正式施行,辦法對大模型訓(xùn)練數(shù)據(jù)、數(shù)據(jù)標(biāo)注、內(nèi)容生成規(guī)范、內(nèi)容生成標(biāo)識、算法備案機(jī)制、監(jiān)督和責(zé)任都提供了相應(yīng)的指引和要求。

生成式人工智能的安全管理需要貫穿產(chǎn)品的全生命周期,包括模型訓(xùn)練、服務(wù)上線、內(nèi)容生成、內(nèi)容傳播各階段。

●    在模型訓(xùn)練階段,奠定了模型的能力基礎(chǔ),也決定了模型自身的安全性;這個(gè)階段會涉及到數(shù)據(jù)和模型,不會和用戶發(fā)生關(guān)聯(lián)。相應(yīng)的風(fēng)險(xiǎn)治理工作包括:訓(xùn)練數(shù)據(jù)的篩選和過濾、模型安全評測、模型對齊與內(nèi)生安全增強(qiáng)、算法機(jī)制機(jī)理審核。

●    在算法服務(wù)上線階段,服務(wù)提供者需要選擇安全有效的模型作為基座構(gòu)建完整的算法服務(wù)。在這個(gè)階段并不涉及模型的訓(xùn)練、使用的數(shù)據(jù),但是會決定對模型的核驗(yàn)、對模型的使用方式、調(diào)用的工具集等。

●    在內(nèi)容生成階段,大模型生成的內(nèi)容是用戶和模型交互的結(jié)果。用戶的輸入,以及模型對用戶之前輸入的反饋,都影響到模型當(dāng)前的生成。用戶使用生成式人工智能服務(wù)的目的、是否主觀上給出惡意輸出和誘導(dǎo),很大程度上決定了模型輸出內(nèi)容的安全性。

●    在內(nèi)容傳播階段,內(nèi)容的傳播方式和途徑、范圍是風(fēng)險(xiǎn)的決定性因素之一。在傳播環(huán)節(jié)出現(xiàn)的風(fēng)險(xiǎn),需要建立相應(yīng)的風(fēng)險(xiǎn)治理技術(shù)手段和工作機(jī)制。

Image

在整個(gè)產(chǎn)品的全生命周期中,其中的模型安全和內(nèi)容安全是兩個(gè)最關(guān)鍵的點(diǎn)。模型安全關(guān)乎技術(shù)底層的堅(jiān)固與防御能力,是支撐系統(tǒng)運(yùn)行的根基;而內(nèi)容安全則側(cè)重于對外交互的信息質(zhì)量與合法性,是保障用戶體驗(yàn)和社會影響的表層防護(hù)。兩者相輔相成,共同構(gòu)建AI產(chǎn)品全生命周期的安全體系。

模型安全:通過自動(dòng)發(fā)現(xiàn)大模型有害的行為(red teaming)和安全增強(qiáng)(Safety Enhancement)來不斷增強(qiáng)模型安全。

Image

內(nèi)容安全:采用知識計(jì)算的風(fēng)險(xiǎn)防控模式(采用人機(jī)協(xié)同的方式定義計(jì)算框架),主要涉及到數(shù)據(jù)層、知識層、算子層三個(gè)層面的能力。

●    數(shù)據(jù)層匯聚了涉及內(nèi)容風(fēng)險(xiǎn)的原始數(shù)據(jù),以及針對不同風(fēng)險(xiǎn)領(lǐng)域精煉加工的結(jié)構(gòu)化數(shù)據(jù);

●    知識層包含預(yù)訓(xùn)練模型和知識圖譜,預(yù)訓(xùn)練模型用于實(shí)現(xiàn)對通用數(shù)據(jù)的歸納,知識圖譜實(shí)現(xiàn)對風(fēng)控專業(yè)知識的組織與沉淀,解決知識碎片化、數(shù)據(jù)獲取難的問題;

●    算子層拆解出目標(biāo)更明確的簡單任務(wù),構(gòu)建端到端的神經(jīng)算子,實(shí)現(xiàn)風(fēng)險(xiǎn)復(fù)雜判定邏輯簡化解耦。

Image

大模型的合規(guī)性關(guān)乎遵守相關(guān)法律、法規(guī)和內(nèi)部政策,確保大模型的應(yīng)用不違反任何法律規(guī)定,并保護(hù)消費(fèi)者的利益。

數(shù)據(jù)隱私與保護(hù),語言大模型的主要功能是模擬人類的思維活動(dòng)方式生成人類可以理解和使用的內(nèi)容,模型的訓(xùn)練對語料庫這一類知識性內(nèi)容有強(qiáng)烈的需求,但不依賴和使用用戶行為數(shù)據(jù)。

透明度和可解釋性,金融等行業(yè)的監(jiān)管機(jī)構(gòu)要求理解AI模型的決策過程,尤其在關(guān)系到重大決定如貸款審批或保險(xiǎn)索賠時(shí)。因此提高模型的透明度和可解釋性是一個(gè)重要的合規(guī)要求。

偏見和公平,消除這些偏見并確保模型對所有人群公平是模型合規(guī)性的重要部分。

持續(xù)監(jiān)管和審計(jì),合規(guī)性不是一次性的任務(wù),而是需要持續(xù)監(jiān)管和審計(jì)。金融機(jī)構(gòu)等需要確保使用的大模型在整個(gè)生命周期內(nèi)都符合監(jiān)管要求,并能適應(yīng)法規(guī)的變化。

大模型的合規(guī)性是一個(gè)多層面的、涉及多個(gè)利益相關(guān)者的挑戰(zhàn),需要綜合技術(shù)、法律和道德考慮來處理。金融機(jī)構(gòu)在使用大模型時(shí)需要密切關(guān)注相關(guān)法律法規(guī)的發(fā)展,并且可能需要專門的法律和技術(shù)專家團(tuán)隊(duì)來確保模型遵循所有適用的合規(guī)要求。

要素5:準(zhǔn)確性與嚴(yán)肅性

大模型的“準(zhǔn)確性”與“嚴(yán)肅性”是兩個(gè)評估模型性能和適用性的關(guān)鍵維度,特別是在涉及專業(yè)場景和重要決策時(shí)尤為重要。

準(zhǔn)確性是衡量大模型輸出結(jié)果與預(yù)期目標(biāo)或?qū)嶋H情況相符的程度。模型在處理給定任務(wù)時(shí),例如回答問題、分類文檔、翻譯文本或者識別圖像時(shí),其輸出與真實(shí)答案或標(biāo)準(zhǔn)標(biāo)簽的匹配程度。嚴(yán)肅性在大模型的語境下,更多指模型生成內(nèi)容的專業(yè)性、可靠性、責(zé)任性和道德規(guī)范性。在金融這個(gè)高度專業(yè)化和監(jiān)管嚴(yán)格的領(lǐng)域,大模型產(chǎn)出的信息必須是經(jīng)過嚴(yán)格篩選、無誤導(dǎo)性且遵循行業(yè)規(guī)范的。嚴(yán)肅性還包括模型不得濫用或傳播不實(shí)、不恰當(dāng)或有害的信息。

為了保證大模型的準(zhǔn)確性和嚴(yán)肅性,不僅要在技術(shù)層面提升模型的泛化能力和知識完備性,還要在訓(xùn)練數(shù)據(jù)、模型設(shè)計(jì)、后處理步驟等方面進(jìn)行嚴(yán)格控制,并結(jié)合領(lǐng)域?qū)<抑R、實(shí)時(shí)監(jiān)控和用戶反饋進(jìn)行持續(xù)優(yōu)化和修正。同時(shí),對于可能出現(xiàn)的倫理和社會影響問題,也要有相應(yīng)的政策和機(jī)制來預(yù)防和應(yīng)對。

下面是某證券公司的實(shí)施案例:

1、構(gòu)建知識庫:基于咨詢信息、專業(yè)內(nèi)容、投教百科研報(bào)、投研框架、指標(biāo)信息等,構(gòu)建基礎(chǔ)投研知識庫。并將以往歷史問答、專家經(jīng)驗(yàn)以投研框架的方式進(jìn)行回流,實(shí)現(xiàn)持續(xù)性的知識生產(chǎn)和知識庫運(yùn)營。

2、知識加工:將各種知識,經(jīng)過以下的步驟進(jìn)行處理,文本分段(chunking)、類目標(biāo)簽、實(shí)體抽取、質(zhì)量分、向量表示、item的時(shí)效性等,形成相應(yīng)的向量。

3、知識檢索:用戶的query進(jìn)來,經(jīng)過Query改寫、向量召回和相關(guān)性模型打分等幾個(gè)步驟,把得分高的知識送到大模型。

4、觀點(diǎn)打分:對與大模型生成觀點(diǎn),由專家進(jìn)行打分。作為RLHF的訓(xùn)練樣本,從而不斷優(yōu)化模型。

Image

要素6:開放性與兼容性

金融級AI原生開放性的核心,在于確保安全合規(guī)的基礎(chǔ)之上,借助先進(jìn)的技術(shù)架構(gòu)與廣泛的生態(tài)合作力量,驅(qū)動(dòng)金融服務(wù)向智能化方向轉(zhuǎn)型升級,加快創(chuàng)新步伐,滿足日益增長的市場需求。而大模型的開源實(shí)踐,則成為了實(shí)現(xiàn)這一開放性愿景最為直接且高效的戰(zhàn)略路徑。

開源對于創(chuàng)新活力、產(chǎn)業(yè)生態(tài)、行業(yè)發(fā)展、模型優(yōu)化都具有重大意義。開源模型可以降低技術(shù)門檻,使得更多的研究者和開發(fā)者能夠訪問最先進(jìn)的AI工具,受到啟發(fā),提升創(chuàng)新活力。開源大模型通過社區(qū)的方式,吸引開發(fā)者和研究人員共同改進(jìn)模型,以及在模型的基礎(chǔ)上構(gòu)建各種工具,推動(dòng)模型的深度應(yīng)用,打造產(chǎn)業(yè)生態(tài)。促進(jìn)行業(yè)發(fā)展,一方面,企業(yè)間開放共享可以減少重復(fù)開發(fā)相同功能的模型所浪費(fèi)的資源,使得企業(yè)能夠集中精力在差異性的研究上;另一方面,開源允許任何人在代碼級別檢查模型的行為和性能,增強(qiáng)了大模型的代碼透明度。最后,開源社區(qū)的使用者往往具有較高的技術(shù)水平,開源模型可以讓企業(yè)獲得來自社區(qū)的寶貴反饋,有助于改進(jìn)模型的性能和功能。

通過開源模型+商業(yè)版模型組合方式的積極實(shí)踐,得益于開源社區(qū)的生態(tài)支持和開發(fā)者反饋,使得模型可以在性能及能力上不斷優(yōu)化和增強(qiáng),另外商業(yè)版模型提供了持續(xù)的技術(shù)支持與咨詢服務(wù),以及企業(yè)級的安全與隱私保護(hù),所以金融企業(yè)在商業(yè)化大模型應(yīng)用時(shí),往往采購商業(yè)版本的基礎(chǔ)模型。

大模型相較于傳統(tǒng)深度學(xué)習(xí)模型,在規(guī)模上實(shí)現(xiàn)了顯著的擴(kuò)容,隨之而來的是對計(jì)算資源的大幅增長需求。在各種GPU資源出現(xiàn)時(shí),推理平臺能兼容各種芯片,成為了亟待解決的基本問題。與此同時(shí),開源領(lǐng)域的創(chuàng)新勢頭迅猛,不僅涌現(xiàn)出Llama、Qwen、Mistral/Mixtral、ChatGLM、Falcon等諸多新型模型,還在模型優(yōu)化方面不斷突破,例如發(fā)展出有損與無損的Attention算法、多種量化技術(shù)革新、投機(jī)采樣及LookAhead等新穎采樣策略,要能適應(yīng)算法的更新發(fā)展。推理層面上,主流的推理框架如vLLM、HuggingFace TGI (Text Generation Inference)、FasterTransformer以及DeepSpeed,引領(lǐng)了推理特性的新變革,對推理提出了新的要求。

針對上述挑戰(zhàn),一個(gè)綜合模型、系統(tǒng)、集群與應(yīng)用層面的協(xié)同優(yōu)化、兼容異構(gòu)GPU、各種大模型、推理框架的平臺顯得尤為重要,旨在實(shí)現(xiàn)卓越的性能與成本效益比。

模型層面:MQA(Multi Query Attention)和GQA(Group-Query Attention)是許多大模型推理優(yōu)化的核心探索方向,以及模型的MOE(Mixture-of-Experts)架構(gòu)。

系統(tǒng)層面:聚焦于高性能計(jì)算算子的開發(fā),優(yōu)化模型并行執(zhí)行、顯存管理與執(zhí)行框架,同時(shí)強(qiáng)化請求調(diào)度能力,確保系統(tǒng)運(yùn)行的高效與流暢。

集群層面:通過智能的請求調(diào)度機(jī)制,最大化集群處理能力,有效整合異構(gòu)資源,提升資源利用率至最優(yōu)狀態(tài)。

應(yīng)用層面:深入分析LLM的工作負(fù)載特性,將Prompt緩存等針對性優(yōu)化措施融入系統(tǒng)設(shè)計(jì),進(jìn)一步增強(qiáng)應(yīng)用的響應(yīng)速度與用戶體驗(yàn)。

構(gòu)建金融級AI原生的藍(lán)圖

AI原生,特別是大模型的發(fā)展對資源管理與調(diào)度、訓(xùn)練、推理提出了全方位的新要求。首先,在資源管理與調(diào)度層面,由于大模型訓(xùn)練所需的計(jì)算資源量龐大且計(jì)算密集,要求系統(tǒng)具備高效能計(jì)算資源的精細(xì)化管理和動(dòng)態(tài)調(diào)度能力,以適應(yīng)大規(guī)模訓(xùn)練任務(wù)和異構(gòu)硬件環(huán)境。這包括合理分配和調(diào)整計(jì)算資源、優(yōu)化存儲策略以降低存儲成本和提高數(shù)據(jù)訪問效率、支持異構(gòu)計(jì)算、實(shí)現(xiàn)彈性伸縮以應(yīng)對任務(wù)需求變化,以及關(guān)注能源效率以實(shí)現(xiàn)綠色計(jì)算。

其次,在模型訓(xùn)練環(huán)節(jié),大模型訓(xùn)練需要強(qiáng)大的大規(guī)模分布式訓(xùn)練能力,妥善處理數(shù)據(jù)并行、模型并行、流水線并行等策略下的通信開銷與數(shù)據(jù)同步問題,確保訓(xùn)練的穩(wěn)定性和收斂速度。同時(shí),混合精度訓(xùn)練、自適應(yīng)學(xué)習(xí)率調(diào)整技術(shù)的應(yīng)用有助于降低計(jì)算和內(nèi)存開銷,提高訓(xùn)練效率。對于超大規(guī)模模型,模型并行化與規(guī)?;囊笫沟媚P图軜?gòu)設(shè)計(jì)、通信優(yōu)化、梯度聚合等方面面臨更高挑戰(zhàn)。

最后,在推理階段,大模型應(yīng)用對實(shí)時(shí)性、低延遲響應(yīng)有嚴(yán)格要求,推理系統(tǒng)需配備高效的推理引擎,通過模型優(yōu)化、硬件加速等手段減少推理時(shí)間。推理服務(wù)化與部署靈活性是另一重要需求,要求模型易于部署到多種環(huán)境并支持服務(wù)化接口,同時(shí)具備模型版本管理、灰度發(fā)布等運(yùn)維功能。

金融級AI原生的平臺架構(gòu)

金融級AI原生的平臺架構(gòu)分為:智算設(shè)施、智算平臺、模型服務(wù)和應(yīng)用服務(wù)等4個(gè)領(lǐng)域。

Image

智算設(shè)施(IaaS):提供大模型所需的底層計(jì)算資源和基礎(chǔ)架構(gòu)的服務(wù)層,這些資源包括但不限于服務(wù)器、存儲、網(wǎng)絡(luò)以及相關(guān)的數(shù)據(jù)中心設(shè)施。對于運(yùn)行大模型來說,IaaS層提供了彈性伸縮性、靈活、高可靠性和安全性的基礎(chǔ)設(shè)施解決方案,可以大幅簡化模型開發(fā)和部署的過程,加快創(chuàng)新速度。

智算平臺(PaaS):提供資源調(diào)度與任務(wù)管理、訓(xùn)練框架、推理框架以及數(shù)據(jù)服務(wù)。資源調(diào)度與任務(wù)管理通過拓?fù)涓兄{(diào)度、多級配額資源模型、多種隊(duì)列策略、配額間資源共享等一系列核心能力,讓物理算力集群利用率逼近理論上限。模型訓(xùn)練包括訓(xùn)練快照、訓(xùn)練時(shí)自動(dòng)容錯(cuò)和作業(yè)的重啟、訓(xùn)練加速等功能。推理框架提供了模型兼容、推理加速、推理對抗和推理監(jiān)控等一系列功能。數(shù)據(jù)服務(wù)提供了向量數(shù)據(jù)庫、圖數(shù)據(jù)庫和云原生數(shù)據(jù)庫等數(shù)據(jù)服務(wù)。

模型服務(wù)(MaaS):一站式大模型生產(chǎn)平臺,提供從大模型開發(fā)、訓(xùn)練到應(yīng)用的全套解決方案。

全鏈路的模型訓(xùn)練及評估工具:全鏈路模型服務(wù)覆蓋數(shù)據(jù)管理、模型訓(xùn)練、評估和部署等關(guān)鍵環(huán)節(jié)。數(shù)據(jù)管理整合了離線和在線數(shù)據(jù)集,確保訓(xùn)練數(shù)據(jù)的質(zhì)量和完備性。模型訓(xùn)練允許用戶選擇各類開源大模型、多模態(tài)模型,并通過透明化工具監(jiān)控模型狀態(tài)。模型評估提供多種資源,包括單模型和多模型對比,以對標(biāo)行業(yè)標(biāo)準(zhǔn)。并提供一鍵化的模型部署功能。

集成豐富多樣的應(yīng)用工具:強(qiáng)調(diào)了開箱即用的特性,包括預(yù)置檢索增強(qiáng)、流程編排、Prompt模板應(yīng)用、插件中心支持接入企業(yè)系統(tǒng)、

基于大模型快速構(gòu)建業(yè)務(wù)應(yīng)用agent:智能體中心,并為企業(yè)和開發(fā)者提供智能體API的調(diào)用。其中,智能體應(yīng)用包含支持RAG、分析、創(chuàng)作等鏈路。同時(shí),為保持開放性,整合并優(yōu)化了開源框架如LlamaIndex,提供封裝的原子級服務(wù)和SDK。插件中心預(yù)設(shè)了多樣插件,并支持企業(yè)和開發(fā)者自定義插件,以提升大模型的調(diào)用效率。

應(yīng)用服務(wù)(SaaS):在應(yīng)用層上,考慮到金融領(lǐng)域的多方位需求,將應(yīng)用劃分為兩大類別以實(shí)現(xiàn)廣泛適用性與行業(yè)特異性。一類是通用應(yīng)用場景,跨越整個(gè)金融行業(yè),涵蓋諸如智能客服來提升服務(wù)體驗(yàn)、智能營銷以增強(qiáng)市場觸達(dá),以及工作助手以提高日常辦公效率。另一類則專注于金融細(xì)分市場的獨(dú)特需求,例如銀行業(yè)專注于信貸報(bào)告自動(dòng)化生成與嚴(yán)謹(jǐn)?shù)暮弦?guī)性審查;證券業(yè)則側(cè)重投資研究與顧問服務(wù)的智能化;而在保險(xiǎn)業(yè),致力于通過“保險(xiǎn)數(shù)字生產(chǎn)力”提升業(yè)務(wù)效能,具體體現(xiàn)為智能核保流程的優(yōu)化以及代理人培訓(xùn)系統(tǒng)的智能化。

智能客服:大模型憑借其強(qiáng)大的自然語言理解和生成能力,可以作為智能客服系統(tǒng)的核心組件,提供24/7全天候在線服務(wù)。用于客戶的咨詢、外呼和客戶交互過程中,識別客戶意圖,進(jìn)行更好的、貼心的服務(wù)。

智能營銷:大模型能夠根據(jù)不同的客戶群體特征和營銷目標(biāo),自動(dòng)生成具有吸引力的營銷文案、廣告創(chuàng)意、郵件推送、營銷視頻等個(gè)性化內(nèi)容。

工作助手:大模型可以集成到日常工作中,提供咨詢服務(wù)、編程輔助服務(wù)、數(shù)據(jù)分析、內(nèi)部公共助手、以及用于法律法規(guī)方面的審核工作,在減輕員工負(fù)擔(dān)的同時(shí),也可以提升工作效率。比如,知識助手、開發(fā)助手、用數(shù)助手、會議助手和審查助手。

信貸報(bào)告生成:大模型能夠自動(dòng)讀取和整合來自多個(gè)來源的數(shù)據(jù),包括財(cái)務(wù)報(bào)表、征信記錄、市場數(shù)據(jù)等,進(jìn)行快速而全面的信息分析。這不僅限于數(shù)值數(shù)據(jù),也包括文本信息,如征信報(bào)告、企業(yè)年報(bào)、行業(yè)報(bào)告等,從而形成一個(gè)綜合的信用視圖。

合規(guī)審核:大模型可以被訓(xùn)練來識別和分析各類交易、合同、報(bào)告中的合規(guī)風(fēng)險(xiǎn)點(diǎn)。通過模式識別和自然語言處理技術(shù),模型能夠迅速掃描文檔,比對監(jiān)管要求,自動(dòng)標(biāo)記潛在的不合規(guī)內(nèi)容。

投研投顧:在投資研究領(lǐng)域,大模型能夠分析海量的經(jīng)濟(jì)數(shù)據(jù)、新聞報(bào)道、社交媒體情緒等信息,輔助投資者識別市場趨勢,為投資策略提供數(shù)據(jù)支持。在投顧領(lǐng)域,大模型能根據(jù)個(gè)人投資者的風(fēng)險(xiǎn)偏好、資產(chǎn)狀況和投資目標(biāo),提供定制化的投資建議,優(yōu)化資產(chǎn)配置,提升投資組合的表現(xiàn)。

保險(xiǎn)數(shù)字生產(chǎn)力:通過分析保險(xiǎn)申請中的文本描述、圖片,大模型能基于保險(xiǎn)規(guī)則,自動(dòng)判斷核保申請,輔助保險(xiǎn)員加速申請審核流程,提升客戶滿意度。保險(xiǎn)公司利用大模型創(chuàng)建“數(shù)字員工”,來模擬不同的角色,幫助代理人快速上崗,提升工作效率。 

金融級AI原生應(yīng)用實(shí)踐

1、應(yīng)用場景與技術(shù)架構(gòu)選型

知識密集型數(shù)字化應(yīng)用

金融行業(yè)因其高度的專業(yè)性和對精確度的嚴(yán)格要求,成為一個(gè)知識密集型的領(lǐng)域。它涵蓋了廣泛的子領(lǐng)域,包括銀行業(yè)務(wù)、投資、保險(xiǎn)、資產(chǎn)管理等,每個(gè)領(lǐng)域都有其獨(dú)特的術(shù)語、規(guī)則和業(yè)務(wù)流程。在銀行行業(yè),理財(cái)產(chǎn)品經(jīng)理需要在充分理解監(jiān)管合規(guī)政策的前提下,設(shè)計(jì)有市場競爭力的產(chǎn)品;在證券行業(yè),投研人員需要閱讀大量的研報(bào)和資訊,做出對市場的判斷,給客戶提供有價(jià)值的投資建議;在保險(xiǎn)行業(yè),大量復(fù)雜的核保/核賠規(guī)則,業(yè)務(wù)員需要熟記于心并在展業(yè)時(shí)能高效查閱。

而大語言模型作為一個(gè)參數(shù)化的知識容器,其最突出的能力就是構(gòu)建世界模型、理解人類知識,并以自然語言的方式進(jìn)行交互。大模型通過學(xué)習(xí)廣泛的語料,能夠積累和反映不同領(lǐng)域的知識,包括金融行業(yè)特有的概念、術(shù)語和邏輯關(guān)系。這使得大模型能夠在上述金融行業(yè)各類知識密集型場景中,提供自然語言理解和生成、知識檢索與問答、信息總結(jié)摘要等能力。

以保險(xiǎn)行業(yè)為例,核保是一個(gè)非常重要的業(yè)務(wù)流程,保司有大量的業(yè)務(wù)員在外面做拓客,為C端用戶設(shè)計(jì)保險(xiǎn)方案。在這個(gè)過程中,還有一類角色叫核保員,在投保階段幫助業(yè)務(wù)員判斷是否能出保單,并給出建議方案。這里面涉及到大量的核保規(guī)則業(yè)務(wù)知識,我們希望能讓大模型學(xué)會理解這些并運(yùn)用在業(yè)務(wù)流程當(dāng)中,提高核保員工作效率。

Image

典型的用大模型來重構(gòu)核保的業(yè)務(wù)流程,如上圖示意:

原始核保規(guī)則:核保規(guī)則源于保險(xiǎn)公司內(nèi)部的核保政策,有集團(tuán)級別的、每個(gè)省市分公司也有自己特定的規(guī)則,需結(jié)合起來用,這是核保決策的依據(jù)。這類知識的特點(diǎn)是,內(nèi)容多、邏輯復(fù)雜、還有很多行業(yè)術(shù)語,一般核保員上崗后學(xué)習(xí)6個(gè)月,才能開展核保業(yè)務(wù)。

大模型核保知識構(gòu)建:核保政策的格式和來源非常多樣,有pdf、word,甚至是某分公司發(fā)的一封全員郵件。這些知識需要被構(gòu)建成一種層次化的知識體系,便于更新、維護(hù),以及被大模型理解與應(yīng)用。在業(yè)務(wù)流程中,大模型需要從與業(yè)務(wù)員的對話中提取出核保要素,例如:年齡、地域、工種。當(dāng)要素不完備時(shí),以反問等方式讓業(yè)務(wù)員提供,直到收集完整下一步推理決策所需信息。

大模型推理決策:基于上一步構(gòu)建的知識,大模型進(jìn)行不同的邏輯處理。簡單分有三種:a)準(zhǔn)入性判斷,一些關(guān)鍵要素若不符合,可直接拒保;b)條件性推理,依據(jù)各種核保規(guī)則,逐條檢查客戶提供的要素是否滿足;c)推薦投保方案,若有不符合的要素,大模型給業(yè)務(wù)員調(diào)整的建議,改變核保要素,直至承保。

在上述業(yè)務(wù)流程重構(gòu)過程中,面臨最大的兩個(gè)技術(shù)挑戰(zhàn)是:核保規(guī)則量多質(zhì)差、推理邏輯復(fù)雜。因此,在方案上采用金融知識增強(qiáng)+Multi-Agents框架來解決,如下圖所示:

金融知識增強(qiáng):原始核保政策來源非常多,上千頁的Word、復(fù)雜單元格結(jié)構(gòu)的Excel、甚至是一封核保政策調(diào)整的郵件。面對此類多源異構(gòu)數(shù)據(jù),需要先做格式和內(nèi)容的治理,形成一種分類、分級、分塊的立體化通用知識表示,便于長期維護(hù)更新,以及被下游大模型Agent理解與使用。在過程中,還需要引入金融領(lǐng)域?qū)S兄R做增強(qiáng),例如:對行業(yè)和工種的分級分類、專對保單版面的內(nèi)容識別算法。

Multi-Agents分治:在試驗(yàn)過程中我們發(fā)現(xiàn),大模型的能力也是有上限的,面對的知識太多或規(guī)則太復(fù)雜,也會有不穩(wěn)定輸出的情況。因此在通用知識表示之上,按任務(wù)類型把整個(gè)核保過程拆解到不同角色的Agent上完成,并由中控協(xié)調(diào)Agent統(tǒng)一協(xié)調(diào)和路由。最終面向業(yè)務(wù)員,大模型扮演“核保員”,以多輪會話的方式提提供推理決策和承保方案推薦。

Image

全鏈路數(shù)字化應(yīng)用

大模型在金融業(yè)務(wù)的全流程中扮演了重要角色,其支撐作用體現(xiàn)金融行業(yè)的不同業(yè)務(wù)場景。如客戶服務(wù)與關(guān)懷方面,大模型能夠提供24小時(shí)不間斷的客戶服務(wù),包括咨詢解答、產(chǎn)品介紹、客戶關(guān)懷、投訴處理等,提升用戶體驗(yàn)。 風(fēng)險(xiǎn)管理與信貸評估方面,大模型幫助金融機(jī)構(gòu)進(jìn)行信用報(bào)告生成、欺詐檢測和風(fēng)險(xiǎn)評估,提高貸款審批的準(zhǔn)確性和效率,減少人為錯(cuò)誤和潛在的信用風(fēng)險(xiǎn)。精準(zhǔn)營銷與客戶洞察方面,創(chuàng)造多樣化、創(chuàng)新且風(fēng)格連貫的跨媒體營銷內(nèi)容變得輕松自如,這包括社交媒體帖文、廣告標(biāo)語、宣傳海報(bào)、創(chuàng)意視頻劇本等,確保每項(xiàng)內(nèi)容都能精準(zhǔn)對接目標(biāo)受眾。通過對客戶數(shù)據(jù)的深度分析,大模型能夠構(gòu)建精準(zhǔn)的用戶畫像,幫助金融機(jī)構(gòu)設(shè)計(jì)個(gè)性化營銷策略,提升營銷活動(dòng)的轉(zhuǎn)化率和客戶滿意度。投資咨詢與資產(chǎn)管理方面,大模型能夠分析市場數(shù)據(jù)、新聞資訊和經(jīng)濟(jì)指標(biāo),生成投資建議和資產(chǎn)配置方案,輔助投資者做出決策。對于機(jī)構(gòu)投資者,它還能提供復(fù)雜的財(cái)務(wù)模型分析和投資策略優(yōu)化。自動(dòng)搜集、整理并分析大量研究報(bào)告、公司公告和宏觀經(jīng)濟(jì)數(shù)據(jù),為分析師和投資者生成深度研究報(bào)告,提高研究質(zhì)量和速度。運(yùn)營優(yōu)化與自動(dòng)化方面,在后臺運(yùn)營中,大模型可以自動(dòng)化處理交易結(jié)算、合規(guī)審查、文檔管理等工作,減少人工操作,提升運(yùn)營效率并降低成本。

風(fēng)控作為金融的基石,正遭遇多元化的挑戰(zhàn),這些挑戰(zhàn)隨技術(shù)演進(jìn)、市場波動(dòng)及欺詐策略的迭代而日新月異。以下是當(dāng)前尤為突出的幾個(gè)難題:

1.    業(yè)務(wù)冷啟動(dòng)沒經(jīng)驗(yàn),上線周期長:新業(yè)務(wù)上線,缺少相關(guān)的冷啟動(dòng)經(jīng)驗(yàn)和數(shù)據(jù)。上線周期長,容易錯(cuò)過商機(jī)。

2.    風(fēng)險(xiǎn)變化快,風(fēng)險(xiǎn)決策響應(yīng)慢:數(shù)據(jù)分析周期慢,業(yè)務(wù)人員給技術(shù)人員提需求經(jīng)常需要等排期。策略/模型構(gòu)建和迭代周期慢,無法跟上快速變化的風(fēng)險(xiǎn)

3.    模型的敏捷性與深度構(gòu)建:金融市場瞬息萬變,欺詐手段層出不窮,要求風(fēng)控模型不僅要具備高度的適應(yīng)力和靈活性,還需迅速掌握新興風(fēng)險(xiǎn)模式,同時(shí)維持對既有風(fēng)險(xiǎn)的嚴(yán)密監(jiān)控。這一挑戰(zhàn)促使模型復(fù)雜度與更新速度的需求不斷攀升。

通過大模型的風(fēng)控多agent體系,可以很好縮短風(fēng)險(xiǎn)決策周期,提升風(fēng)控人效,響應(yīng)快速變化的風(fēng)險(xiǎn)。

智能策略助手集成了專家的風(fēng)控策略知識庫,可以幫助業(yè)務(wù)實(shí)現(xiàn)快速冷啟動(dòng)。通過自然語言的形式,可以輕松進(jìn)行策略分析、上線測試、部署和生成報(bào)告,及時(shí)響應(yīng)快速變化的風(fēng)險(xiǎn)環(huán)境。

智能數(shù)據(jù)助手通過內(nèi)嵌的報(bào)表知識以及NL2SQL能力,使得用戶無需復(fù)雜的編程過程,只需通過自然語言的交互就能快速構(gòu)建所需的報(bào)表,進(jìn)行指標(biāo)查找和數(shù)據(jù)診斷。

智能建模助手提供建模功能、深度變量分析報(bào)告和一鍵部署功能,能夠大大提升工作效率和模型的準(zhǔn)確性。

Image

多模態(tài)數(shù)字化應(yīng)用

隨著大模型技術(shù)的高速發(fā)展,尤其OpenAI發(fā)布“Sora”后,加速從自然語言向多模態(tài)大模型的演進(jìn)。多模態(tài)大模型不僅能夠進(jìn)行圖像、視頻的要素識別和場景提取,還可以根據(jù)提取的信息創(chuàng)作出更多原創(chuàng)圖片和視頻;同時(shí)多模態(tài)在語音上支持人機(jī)交互語言接口,不需要轉(zhuǎn)文字,就可以在語境中識別復(fù)雜和抽象概念,加速智能客服擬人化服務(wù)和定制化服務(wù)效果。多模態(tài)大模型已經(jīng)開始在各種業(yè)務(wù)領(lǐng)域進(jìn)行探索,例如:智能催收、智能客服、智能推薦和智能運(yùn)營等領(lǐng)域,隨著多模態(tài)大模型與業(yè)務(wù)創(chuàng)新場景的持續(xù)性融合,展現(xiàn)其更高的用戶粘性和商業(yè)價(jià)值,必將開啟了企業(yè)構(gòu)建多模態(tài)數(shù)字化應(yīng)用的新時(shí)代。

Image

智能提醒:企業(yè)通過多模態(tài)大模型,將外呼語音通話進(jìn)行識別和數(shù)據(jù)抽取,構(gòu)建用戶意圖和客服話術(shù)的知識庫,同時(shí)通過語音特征分析,識別用戶的個(gè)性化特征,并與用戶特征知識庫進(jìn)行比對和更新。在實(shí)時(shí)和離線語音交互過程中,通過規(guī)則質(zhì)檢和風(fēng)控,確保人工或機(jī)器人的回復(fù)符合領(lǐng)域規(guī)范,如果存在輿情風(fēng)險(xiǎn),會提交人工復(fù)審,再進(jìn)行知識庫信息更新。如果符合規(guī)范,將進(jìn)入新一輪的智能語音交互,通過大模型判斷歷史交流的用戶意圖,結(jié)合用戶特征,進(jìn)行個(gè)性化語音話術(shù)播報(bào)(例如:方言定制化),直至達(dá)到本通外呼目的為止。

智能客服:企業(yè)可以通過多模態(tài)大模型,將語音客服、私域咨詢和售后交流的文字、圖片和視頻信息進(jìn)行識別和數(shù)據(jù)抽取,例如:將用戶提交的保單、病例等進(jìn)行識別和數(shù)字化,存儲到專屬客服知識庫和用戶特征知識庫,通過智能質(zhì)檢和風(fēng)控,確保提交和回復(fù)數(shù)據(jù)的準(zhǔn)確性和安全性。同時(shí)根據(jù)客戶意圖識別和個(gè)性化生成,滿足用需要的回復(fù)或報(bào)告,再根據(jù)用戶個(gè)性化特征生成專屬文字或語音和視頻回復(fù),最后根據(jù)用戶評價(jià)和人工抽檢,收納知識語料。

智能推薦:根據(jù)企業(yè)業(yè)務(wù)場景和市場規(guī)劃目標(biāo),通過多模態(tài)大模型快速生成文案,在公域或私域傳播,比如廣告語、微博文章、微信公眾號文章和抖音視頻等,同時(shí)與多模態(tài)圖片或視頻AI工具相結(jié)合,自動(dòng)生成宣傳海報(bào)、宣傳視頻等視覺內(nèi)容,提升營銷素材的生成效率。通過自然語言交互或私域數(shù)據(jù)運(yùn)營,為客戶提供個(gè)性化的產(chǎn)品推薦和購買建議。根據(jù)用戶特征數(shù)據(jù)分析客戶的需求、偏好、風(fēng)險(xiǎn)承受能力等信息,快速準(zhǔn)確地推薦適合客戶的產(chǎn)品,提高保險(xiǎn)銷售效率和客戶滿意度。

智能運(yùn)營:在企業(yè)和商戶私域運(yùn)營中,通過多模態(tài)數(shù)字化應(yīng)用方案能夠解決全鏈路高效運(yùn)營。在商戶入駐時(shí),通過多模態(tài)場景和內(nèi)容識別能力,完成攤位門頭照自動(dòng)化審核,同時(shí)識別商戶和銷售商品及價(jià)格;在商戶運(yùn)營中,通過多模態(tài)識別和生成能力,進(jìn)行菜單初始化和商品效果圖生成,降低門檻和成本;在日常運(yùn)營中,通過多模態(tài)營銷文案、圖片和視頻的生成能力,根據(jù)時(shí)節(jié)定制化營銷文案和營銷海報(bào),以及宣傳視頻等,增加商戶的收益和訂單成交量。

多模態(tài)數(shù)字化應(yīng)用基于企業(yè)外呼、客服、推薦、運(yùn)營等多模態(tài)業(yè)務(wù)場景,與多模態(tài)技術(shù)的豐富和靈活的AI服務(wù)進(jìn)行結(jié)合,快速實(shí)現(xiàn)業(yè)務(wù)效果。通常調(diào)用這類多模型API可以分為三步驟:準(zhǔn)備和優(yōu)化輸入提示(Prompt)、使用API進(jìn)行模型調(diào)用、處理和展示結(jié)果。

Image

Prompt優(yōu)化:明確通過多模態(tài)大模型實(shí)現(xiàn)什么樣的任務(wù),基于任務(wù)需求構(gòu)建有效的提示信息。對于文本任務(wù),這可能意味著撰寫清晰、具體的指令或問題;對于圖像相關(guān)任務(wù),則可能包括選擇適當(dāng)?shù)膱D像作為輸入。通過實(shí)驗(yàn)和反復(fù)測試,找到最能引導(dǎo)模型輸出期望結(jié)果的Prompt表達(dá)方式。調(diào)整文本提示的措辭或添加關(guān)鍵信息,改變圖像輸入的尺寸和質(zhì)量。

Assistant-API調(diào)用:

選擇API:確定適合你任務(wù)的API服務(wù)。不同的多模態(tài)大模型可能通過不同的API提供服務(wù),選擇合適的API是關(guān)鍵。

準(zhǔn)備請求:遵循所選API的文檔準(zhǔn)備請求。這通常涉及設(shè)置合適的HTTP請求頭、選擇正確的API端點(diǎn)、準(zhǔn)備必要的認(rèn)證信息以及構(gòu)建請求體。

發(fā)送請求:將準(zhǔn)備好的請求發(fā)送給API服務(wù)。這可以通過編程方式使用HTTP客戶端庫或使用命令行工具完成。

處理響應(yīng):對API返回的結(jié)果進(jìn)行處理。這可能包括解析JSON格式的響應(yīng)內(nèi)容、錯(cuò)誤處理以及轉(zhuǎn)換模型輸出以便進(jìn)一步使用。

結(jié)果召回展示:分析模型返回的數(shù)據(jù),對結(jié)果進(jìn)行質(zhì)量評估。根據(jù)需要,可能還要進(jìn)行后處理,比如圖像的裁剪或調(diào)整大小,文本的清理等。將處理過的結(jié)果以用戶友好的方式展示出來。根據(jù)應(yīng)用場景,這可能包括在網(wǎng)頁上顯示生成的文本或圖像、在應(yīng)用程序內(nèi)部展示音頻播放控件等。

2、AI原生應(yīng)用實(shí)施路徑

大模型技術(shù)仍在飛速發(fā)展,國內(nèi)外大模型廠商的產(chǎn)品快速推陳出新,在商業(yè)化大模型和開源大模型社區(qū),每個(gè)月、每周、甚至每天都有新的模型和框架出現(xiàn)。同時(shí),算力資源短期內(nèi)將持續(xù)緊張,大規(guī)模應(yīng)用的鋪開,直接導(dǎo)致對模型推理資源的需求持續(xù)上漲,而金融機(jī)構(gòu)不僅要解決資源的供給問題,還需要持續(xù)提升算力的使用效率,支撐企業(yè)大模型場景的全面落地。

金融機(jī)構(gòu)一直是IT技術(shù)的先行者,在數(shù)字化轉(zhuǎn)型和技術(shù)創(chuàng)新方面不斷尋求突破。如何能跟上大模型技術(shù)的快速發(fā)展,不掉隊(duì),客觀理解新技術(shù),快速識別合適場景,驗(yàn)證大模型的技術(shù)與業(yè)務(wù)價(jià)值,成為了企業(yè)面臨的首要問題?!鞍亵礌幜?,奮楫者先”,我們提出一條可行的路徑,在解決算力資源短缺的同時(shí),又能保障金融機(jī)構(gòu)用上最新的大模型技術(shù),為業(yè)務(wù)與客戶帶去價(jià)值。

Image

“云上試航”:快速完成大模型可行性與價(jià)值驗(yàn)證

大語言模型橫空出世,帶來的不僅僅是單點(diǎn)技術(shù)的創(chuàng)新,更是全套技術(shù)棧的革新。GPU服務(wù)器、大模型全周期管理平臺、推理加速框架、RAG知識增強(qiáng)、Multi-Agent智能體,這些新的事物在不停地刷新技術(shù)從業(yè)者的認(rèn)知。以上種種技術(shù),要在客戶IDC完整搭建一套,難度極高成本極大,尤其是在大模型的價(jià)值尚未被完全驗(yàn)證與挖掘的前提下。

這個(gè)階段,金融云成為了企業(yè)的最佳選擇。算力層面,云廠商資源儲備充足,為客戶提供了多樣化的算力選擇,且彈性按需付費(fèi);模型層面,主流云廠商不僅提供商業(yè)化大模型,還提供業(yè)界優(yōu)秀的開源大模型服務(wù),客戶可按需自由選擇,以MaaS API的方式調(diào)用;平臺工具層面,更是為客戶提供了極大的選擇空間,從大模型全周期管理平臺到智能體應(yīng)用,從檢索引擎到向量數(shù)據(jù)庫,以上這些,企業(yè)都可以靈活組合使用,快速驗(yàn)證新技術(shù)的價(jià)值,避免前期無謂的投入和時(shí)間浪費(fèi)。

“小步快跑”:大模型應(yīng)用試點(diǎn)的選擇與落地

過去一年,大模型在金融機(jī)構(gòu)的應(yīng)用,也經(jīng)歷了快速的發(fā)展。最初期的嘗鮮者們,都從RAG知識問答場景開始,通過構(gòu)建企業(yè)級知識庫,引入大模型技術(shù),充分感受其在語言理解與生成上的能力。隨著大模型自身變得更加成熟,以及從業(yè)者對大模型的技術(shù)掌控力增強(qiáng),大模型的應(yīng)用已經(jīng)從最初的“問答機(jī)器人”,開始滲透到金融行業(yè)的核心業(yè)務(wù)流程當(dāng)中,并開始扮演Copilot(輔助駕駛)的角色,提升員工工作效率,提升客戶服務(wù)效果。

在銀行行業(yè)智能客服領(lǐng)域,大模型被用于識別客戶意圖和情緒,為客服人員提供話術(shù)輔助與推薦;在證券行業(yè)投研投顧領(lǐng)域,大模型被用于讀取海量的研報(bào)、資訊,以自然語言的方式提供觀點(diǎn)問答和內(nèi)容摘要等服務(wù);在保險(xiǎn)行業(yè)核保領(lǐng)域,大模型被用于理解復(fù)雜的核保政策,針對客戶提交的材料做合規(guī)性審核與保險(xiǎn)計(jì)劃生成。這些被驗(yàn)證過的場景,都適合處于大模型建設(shè)初期的金融機(jī)構(gòu)作參考,選擇2-3個(gè)相對有容錯(cuò)性、投入產(chǎn)出比高的作為試點(diǎn)。

在這個(gè)階段,可暫不考慮太多平臺化的事情,宜采用“以用帶建”的思路,選定場景后,引入一個(gè)經(jīng)過驗(yàn)證的商業(yè)化大模型,提供持續(xù)穩(wěn)定的服務(wù)和安全合規(guī)方面的保障。工程上可以在大模型應(yīng)用層面,選擇輕量化的RAG、Agent產(chǎn)品,配合商業(yè)化大模型,對外提供MaaS API的調(diào)用以及Workflow編排能力,快速支撐業(yè)務(wù)場景的落地。

“平臺筑基”:建設(shè)LLMOps技術(shù)棧,實(shí)現(xiàn)中臺化管理

走過試點(diǎn)階段后,企業(yè)內(nèi)大模型應(yīng)用將會全面鋪開,這時(shí)就不再適合從某幾個(gè)應(yīng)用出發(fā)單獨(dú)建設(shè)了,技術(shù)團(tuán)隊(duì)需要在平臺層面做整體規(guī)劃,基于業(yè)界領(lǐng)先的LLMOps理念,圍繞大模型的構(gòu)建與應(yīng)用流程,構(gòu)建大模型全周期管理平臺,實(shí)現(xiàn)基礎(chǔ)能力的中臺化管理與服務(wù),支撐大模型在多業(yè)務(wù)場景的快速落地。

具體來講,大模型全周期管理平臺主要包含兩個(gè)部分。模型中心,主要承載模型層面相關(guān)工作,語料管理、模型微調(diào)、推理加速、模型評測等;應(yīng)用中心,在模型之上,提供RAG知識庫、Multi-Agent框架、Prompt工程、Workflow編排等能力,支撐業(yè)務(wù)快速基于大模型的能力,構(gòu)建起應(yīng)用鏈路。

企業(yè)在小步快跑階段會使用一些主流開源框架做快速落地,例如:LlamaIndex、OpenAI的Assistants API。到了平臺化階段,不僅要考慮低代碼大模型開發(fā)范式的支持,同時(shí)要考慮全代碼開發(fā)范式,面向技術(shù)人員提供高效的開發(fā)與集成框架,并兼容主流開源框架,實(shí)現(xiàn)原有應(yīng)用的平滑遷移到平臺上。

“云端融合”:大模型混合云架構(gòu),充分利用云上資源

隨著大模型應(yīng)用全面鋪開,場景從服務(wù)內(nèi)部為主,轉(zhuǎn)向直面外部C端客戶,對大模型推理資源的需求會呈指數(shù)級增加。從當(dāng)前大模型技術(shù)發(fā)展趨勢和落地案例來看,未來推理服務(wù)會成為大模型資源需求的絕對主力。

正如前文例子,部署一個(gè)72B大模型推理實(shí)例,需要3張A100(80G)的資源。當(dāng)業(yè)務(wù)上需要50并發(fā)時(shí),需要的GPU卡的數(shù)量在200張左右A100(80G)。無論從供給資源還是采購成本來講,這都是一筆不小的成本。在這個(gè)階段,算力資源會再度成為制約企業(yè)全面擁抱AI大模型的瓶頸。通過構(gòu)建混合云架構(gòu),在安全合規(guī)的前提下,把本地算力作為固定資源池,同時(shí)把云上充足的彈性資源使用起來,成為金融機(jī)構(gòu)在大模型時(shí)代的最佳選擇。

結(jié)語

正在本文截稿之時(shí),OpenAI在春季新品發(fā)布會上搬出了新一代旗艦生成模型GPT-4o,一系列新的能力讓我們無比堅(jiān)信,AI大模型技術(shù)勢必會顛覆和重塑未來產(chǎn)品的形態(tài)。而當(dāng)大模型在金融行業(yè)落地,重塑金融企業(yè)應(yīng)用時(shí),我們必須考慮金融行業(yè)獨(dú)特性的要求。在與眾多金融客戶進(jìn)行大模型應(yīng)用聯(lián)合共創(chuàng)之后,我們對金融客戶面臨的主要挑戰(zhàn)進(jìn)行了剖析,定義了金融級AI原生的藍(lán)圖和六大要素,并挑選了知識密集型、全鏈路數(shù)字化、多模態(tài)數(shù)字化等三類具備較大業(yè)務(wù)價(jià)值的場景,闡述其技術(shù)架構(gòu)的選擇和落地路徑,旨為金融企業(yè)的數(shù)智化創(chuàng)新提速。

 

版權(quán)與免責(zé):以上作品(包括文、圖、音視頻)版權(quán)歸發(fā)布者【阿里巴巴】所有。本App為發(fā)布者提供信息發(fā)布平臺服務(wù),不代表經(jīng)觀的觀點(diǎn)和構(gòu)成投資等建議

熱新聞