定價僅為GPT-4百分之一! 幻方量化推“高性價比”大模型 量化私募打響AI界價格戰(zhàn)?

21世紀(jì)經(jīng)濟(jì)報道2024-05-13 18:22

21世紀(jì)經(jīng)濟(jì)報道記者張梓桐 上海報道

量化私募機(jī)構(gòu)正在高調(diào)入局大模型領(lǐng)域。

近日,幻方公司推出了第二代MoE模型DeepSeek-V2,并開源了技術(shù)報告和模型權(quán)重,該模型引入了MLA架構(gòu)和自研Sparse結(jié)構(gòu)DeepSeekMoE,以236B總參數(shù)、21B激活,實際部署在8卡H800機(jī)器上,輸入吞吐量超過每秒10萬tokens輸出超過每秒5萬tokens。

目前DeepSeek-V2 API定價為:每百萬token輸入1元、輸出2元(32K上下文),僅是GPT-4的近百分之一水平。SemiAnalysis給出了“性價比高到難以置信”的評價。據(jù)該機(jī)構(gòu)計算,在其算力服務(wù)力利用率最高的情況下,DeepSeek每臺服務(wù)器每小時收益可達(dá)35.4美元,毛利率在70%以上。

事實上,金融機(jī)構(gòu)對AI大模型的布局有著天然的業(yè)務(wù)邏輯,在經(jīng)過移動互聯(lián)多年積累后,金融業(yè)在行業(yè)垂直類大模型落地所需的三大支柱:算法、算力、數(shù)據(jù)中相較其他行業(yè)都有獨特優(yōu)勢。

“以投研、投顧等與投資決策相關(guān)的場景為例,傳統(tǒng)的投研和投顧模式更多依賴于行業(yè)專家和投資顧問自身的知識經(jīng)驗和能力水平,個體差異度可能會比較大,而大模型經(jīng)過海量底層數(shù)據(jù)的搜集、梳理、學(xué)習(xí)后,其分析結(jié)果或?qū)⒃谌嫘?、?zhǔn)確性、 時效性等方面賦能傳統(tǒng)模式,但我們也注意到,由于相關(guān)監(jiān)管不明確,以及數(shù)據(jù)安全、數(shù)據(jù)隱私等問題,在這些場景的應(yīng)用仍需謹(jǐn)慎?!碑咇R威中國資產(chǎn)管理業(yè)主管合伙人王國蓓在接受21世紀(jì)經(jīng)濟(jì)報道記者采訪時說道。

AI新征程

幻方量化是一家依靠人工智能技術(shù)進(jìn)行量化投資的對沖基金公司及科技公司,成立于2008年,專注于人工智能在量化投資領(lǐng)域的應(yīng)用。

2023年4月14日其官方微信公眾號發(fā)表的一篇名為《幻方新征程》的文章中,幻方量化宣布將集中資源和力量,全力投身于人工智能技術(shù),并成立了新的獨立研究組織,專注于探索AGI(人工通用智能,Artificial General Intelligence)的本質(zhì)。并強(qiáng)調(diào)“渴望同行之人,一起攀登”。

但彼時幻方量化的高調(diào)動作也遭到市場的質(zhì)疑。但幻方量化董事總經(jīng)理陸政哲表示,“我用中文重申一下:AGI不是用來炒股的,有大得多的用處和大得多的價值?!?/p>

從技術(shù)路徑來看,DeepSeek-V2基于高效且輕量級的框架HAI-LLM進(jìn)行訓(xùn)練,采用16-way zero-bubble pipeline并行、8-way專家并行和ZeRO-1數(shù)據(jù)并行。鑒于DeepSeek-V2的激活參數(shù)相對較少,并且重新計算部分算子以節(jié)省激活內(nèi)存,無需張量并行即可訓(xùn)練,因此DeepSeek-V2減少了通信開銷。

并且,DeepSeek-V2完全開源,可免費上用,開源模型支持128K上下文,對話官網(wǎng)/API支持32K上下文(約24000個token),還兼容OpenAI API接口。

值得注意的是,幻方大模型的橫空出世也再次驗證了市場對于MoE大模型的期待。MoE大模型即Mixture of Experts大模型,是一種基于分治思想的深度學(xué)習(xí)模型。它將整個模型劃分為多個子模型(或稱專家),每個子模型負(fù)責(zé)處理一部分任務(wù)。在推理時,根據(jù)輸入數(shù)據(jù)的特性,選擇最合適的子模型進(jìn)行處理。這種架構(gòu)使得MoE大模型能夠同時兼顧模型的復(fù)雜性和效率,實現(xiàn)高性能和高效率的統(tǒng)一。

金融機(jī)構(gòu)擁抱AI

目前來看,AI+金融產(chǎn)業(yè)鏈分為上游(基礎(chǔ)層)、中游(技術(shù)層)和下游(應(yīng)用層)。上游提供基礎(chǔ)性支持,中游提供核心技術(shù)和解決方案,下游則廣泛應(yīng)用于金融業(yè)務(wù)領(lǐng)域。

據(jù)Mordor Intelligence的報告預(yù)測,全球人工智能金融科技市場規(guī)模預(yù)計到2024年將達(dá)到440.8億美元,并預(yù)計在2029年將增長到508.7億美元,預(yù)測期內(nèi)(2024-2029年)的復(fù)合年增長率為2.91%。

“因為與金融機(jī)構(gòu)多業(yè)務(wù)場景的密切結(jié)合,以及產(chǎn)品能力在海量高質(zhì)金融業(yè)務(wù)數(shù)據(jù)助力下得到快速提升,金融機(jī)器學(xué)習(xí)產(chǎn)品成為市場主要拉力之一?!币患艺趪L試布局AI應(yīng)用的私募基金合伙人告訴21世紀(jì)經(jīng)濟(jì)報道記者。

他表示,目前,AI在量化交易領(lǐng)域的應(yīng)用越來越廣泛,通過算法交易提高交易效率,減少人為錯誤,并能夠快速適應(yīng)市場變化;另一方面,在投資研究自動化環(huán)節(jié),AI可以自動收集和整理投資相關(guān)的信息和數(shù)據(jù),減少研究人員的重復(fù)性工作,使他們能夠?qū)W⒂诟邇r值的分析和決策。

“此外,金融機(jī)構(gòu)也在利用AI分析市場情緒,通過分析投資者行為和市場反饋,預(yù)測市場動向。助力金融機(jī)構(gòu)遵守監(jiān)管要求,通過自動化分析交易模式和行為,檢測異常交易行為,防止欺詐和洗錢等非法活動?!?/strong>

但與此同時,王國蓓表示,在落地過程中,大模型技術(shù)財富管理領(lǐng)域面臨的主要挑戰(zhàn)集中于數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全、隱私保護(hù)、合規(guī)表達(dá)、事實一致性等方面,為解決這些挑戰(zhàn),機(jī)構(gòu)首先需要進(jìn)行大量數(shù)據(jù)治理、夯實數(shù)據(jù)基礎(chǔ)等工作,且需要在語料安全、模型安全、模型評估等方面設(shè)立完善的安全機(jī)制,確保大模型生成內(nèi)容的安全合規(guī)并符合監(jiān)管要求。

熱新聞

電子刊物

  • 地址:北京理工大學(xué)國防科技園2號樓4層
  • 郵編:100081 電話:4001560066 傳真:86-10-88510872
  • 違法和不良信息舉報電話:010-60910566
  • 舉報郵箱:jubao@eeo.com.cn
  • Copyright @ 經(jīng)濟(jì)觀察網(wǎng) 2001-2024
  • 京ICP備18019893號 京公網(wǎng)安備 11010802028547號
  • 廣播電視節(jié)目制作經(jīng)營許可證 (京)字第12950號
  • 增值電信業(yè)務(wù)經(jīng)營許可證 B2-20214402
  • 京網(wǎng)文[2024]1990-097號