定價僅為GPT-4百分之一！幻方量化推“高性價比”大模型量化私募打響AI界價格戰(zhàn)？

21世紀(jì)經(jīng)濟(jì)報道2024-05-13 18:22

21世紀(jì)經(jīng)濟(jì)報道記者張梓桐上海報道

量化私募機(jī)構(gòu)正在高調(diào)入局大模型領(lǐng)域。

近日，幻方公司推出了第二代MoE模型DeepSeek-V2，并開源了技術(shù)報告和模型權(quán)重，該模型引入了MLA架構(gòu)和自研Sparse結(jié)構(gòu)DeepSeekMoE，以236B總參數(shù)、21B激活，實際部署在8卡H800機(jī)器上，輸入吞吐量超過每秒10萬tokens輸出超過每秒5萬tokens。

目前DeepSeek-V2 API定價為：每百萬token輸入1元、輸出2元（32K上下文），僅是GPT-4的近百分之一水平。SemiAnalysis給出了“性價比高到難以置信”的評價。據(jù)該機(jī)構(gòu)計算，在其算力服務(wù)力利用率最高的情況下，DeepSeek每臺服務(wù)器每小時收益可達(dá)35.4美元，毛利率在70%以上。

事實上，金融機(jī)構(gòu)對AI大模型的布局有著天然的業(yè)務(wù)邏輯，在經(jīng)過移動互聯(lián)多年積累后，金融業(yè)在行業(yè)垂直類大模型落地所需的三大支柱：算法、算力、數(shù)據(jù)中相較其他行業(yè)都有獨特優(yōu)勢。

“以投研、投顧等與投資決策相關(guān)的場景為例，傳統(tǒng)的投研和投顧模式更多依賴于行業(yè)專家和投資顧問自身的知識經(jīng)驗和能力水平，個體差異度可能會比較大，而大模型經(jīng)過海量底層數(shù)據(jù)的搜集、梳理、學(xué)習(xí)后，其分析結(jié)果或?qū)⒃谌嫘?、?zhǔn)確性、時效性等方面賦能傳統(tǒng)模式，但我們也注意到，由于相關(guān)監(jiān)管不明確，以及數(shù)據(jù)安全、數(shù)據(jù)隱私等問題，在這些場景的應(yīng)用仍需謹(jǐn)慎?！碑咇R威中國資產(chǎn)管理業(yè)主管合伙人王國蓓在接受21世紀(jì)經(jīng)濟(jì)報道記者采訪時說道。

AI新征程

幻方量化是一家依靠人工智能技術(shù)進(jìn)行量化投資的對沖基金公司及科技公司，成立于2008年，專注于人工智能在量化投資領(lǐng)域的應(yīng)用。

2023年4月14日其官方微信公眾號發(fā)表的一篇名為《幻方新征程》的文章中，幻方量化宣布將集中資源和力量，全力投身于人工智能技術(shù)，并成立了新的獨立研究組織，專注于探索AGI（人工通用智能，Artificial General Intelligence）的本質(zhì)。并強(qiáng)調(diào)“渴望同行之人，一起攀登”。

但彼時幻方量化的高調(diào)動作也遭到市場的質(zhì)疑。但幻方量化董事總經(jīng)理陸政哲表示，“我用中文重申一下：AGI不是用來炒股的，有大得多的用處和大得多的價值?！?/p>

從技術(shù)路徑來看，DeepSeek-V2基于高效且輕量級的框架HAI-LLM進(jìn)行訓(xùn)練，采用16-way zero-bubble pipeline并行、8-way專家并行和ZeRO-1數(shù)據(jù)并行。鑒于DeepSeek-V2的激活參數(shù)相對較少，并且重新計算部分算子以節(jié)省激活內(nèi)存，無需張量并行即可訓(xùn)練，因此DeepSeek-V2減少了通信開銷。

并且，DeepSeek-V2完全開源，可免費上用，開源模型支持128K上下文，對話官網(wǎng)/API支持32K上下文（約24000個token），還兼容OpenAI API接口。

值得注意的是，幻方大模型的橫空出世也再次驗證了市場對于MoE大模型的期待。MoE大模型即Mixture of Experts大模型，是一種基于分治思想的深度學(xué)習(xí)模型。它將整個模型劃分為多個子模型（或稱專家），每個子模型負(fù)責(zé)處理一部分任務(wù)。在推理時，根據(jù)輸入數(shù)據(jù)的特性，選擇最合適的子模型進(jìn)行處理。這種架構(gòu)使得MoE大模型能夠同時兼顧模型的復(fù)雜性和效率，實現(xiàn)高性能和高效率的統(tǒng)一。

金融機(jī)構(gòu)擁抱AI

目前來看，AI+金融產(chǎn)業(yè)鏈分為上游（基礎(chǔ)層）、中游（技術(shù)層）和下游（應(yīng)用層）。上游提供基礎(chǔ)性支持，中游提供核心技術(shù)和解決方案，下游則廣泛應(yīng)用于金融業(yè)務(wù)領(lǐng)域。

據(jù)Mordor Intelligence的報告預(yù)測，全球人工智能金融科技市場規(guī)模預(yù)計到2024年將達(dá)到440.8億美元，并預(yù)計在2029年將增長到508.7億美元，預(yù)測期內(nèi)（2024-2029年）的復(fù)合年增長率為2.91%。

“因為與金融機(jī)構(gòu)多業(yè)務(wù)場景的密切結(jié)合，以及產(chǎn)品能力在海量高質(zhì)金融業(yè)務(wù)數(shù)據(jù)助力下得到快速提升，金融機(jī)器學(xué)習(xí)產(chǎn)品成為市場主要拉力之一?！币患艺趪L試布局AI應(yīng)用的私募基金合伙人告訴21世紀(jì)經(jīng)濟(jì)報道記者。

他表示，目前，AI在量化交易領(lǐng)域的應(yīng)用越來越廣泛，通過算法交易提高交易效率，減少人為錯誤，并能夠快速適應(yīng)市場變化；另一方面，在投資研究自動化環(huán)節(jié)，AI可以自動收集和整理投資相關(guān)的信息和數(shù)據(jù)，減少研究人員的重復(fù)性工作，使他們能夠?qū)Ｗ⒂诟邇r值的分析和決策。

“此外，金融機(jī)構(gòu)也在利用AI分析市場情緒，通過分析投資者行為和市場反饋，預(yù)測市場動向。助力金融機(jī)構(gòu)遵守監(jiān)管要求，通過自動化分析交易模式和行為，檢測異常交易行為，防止欺詐和洗錢等非法活動?！?/strong>

但與此同時，王國蓓表示，在落地過程中，大模型技術(shù)財富管理領(lǐng)域面臨的主要挑戰(zhàn)集中于數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全、隱私保護(hù)、合規(guī)表達(dá)、事實一致性等方面，為解決這些挑戰(zhàn)，機(jī)構(gòu)首先需要進(jìn)行大量數(shù)據(jù)治理、夯實數(shù)據(jù)基礎(chǔ)等工作，且需要在語料安全、模型安全、模型評估等方面設(shè)立完善的安全機(jī)制，確保大模型生成內(nèi)容的安全合規(guī)并符合監(jiān)管要求。

熱新聞

考上“985”研究生，卻不知要去哪個城市讀

【首席觀察】最后一個季度，5%何以“質(zhì)”在

為低價狂歡的時代過去了

臺海觀瀾｜柯文哲案，留給賴清德當(dāng)局的時間

今日看點｜2024年金磚國家領(lǐng)導(dǎo)人會晤將舉行

工信部部長金壯龍會見蘋果公司首席執(zhí)行官庫

養(yǎng)老金缺口巨大大咖這樣支招做好儲備和投

中共中央、國務(wù)院發(fā)布《關(guān)于深化產(chǎn)業(yè)工人隊

10月LPR下調(diào)25個基點：1年期3.1%，5年期以

受益權(quán)益市場回暖上市險企前三季業(yè)績“全

1、定價僅為GPT-4百分之一！幻方量化

2、人民銀行：支持內(nèi)地與香港“互換通

3、【金融街發(fā)布】人民銀行：優(yōu)化“互

4、近百家私募被注銷，什么情況？

5、一批迷你FOF走向清盤，機(jī)構(gòu)戰(zhàn)略分

6、年報過關(guān)？上交所再問

7、券商合并潮起！浙商、方正等一字漲

8、銀行互聯(lián)網(wǎng)貸款業(yè)務(wù)再上“緊箍咒”

9、分管領(lǐng)導(dǎo)身兼數(shù)職是否合規(guī)？國元證

10、宏鑫科技今日收盤跌超6%，自4月15

視頻推薦

總編對話｜從中國走向世界——對話松下電器中國東北亞公司總裁CEO木下步

聚焦主業(yè) 提升品牌：恒安集團(tuán)接班人的長期主義理想

希捷科技全球執(zhí)行副總裁暨首席商務(wù)官鄭萬成：未來五年，中國將成為全球生成數(shù)據(jù)最多的市場

電子刊物

點擊進(jìn)入

用戶名登錄/手機(jī)號登錄 還沒有賬號？免費注冊

定價僅為GPT-4百分之一！ 幻方量化推“高性價比”大模型 量化私募打響AI界價格戰(zhàn)？

AI新征程

金融機(jī)構(gòu)擁抱AI

熱新聞

視頻推薦

電子刊物

用戶名登錄/手機(jī)號登錄

還沒有賬號？免費注冊

定價僅為GPT-4百分之一！幻方量化推“高性價比”大模型量化私募打響AI界價格戰(zhàn)？