大智能時代的產(chǎn)業(yè)再分工:“無數(shù)據(jù),不智能”可以休矣

侯宏2023-10-28 09:44

圖片來源:視覺中國

侯宏/文 炙手可熱的生成式AI或大模型,將如何影響商業(yè)史走向?一個可能的思考角度是:大模型的入局將影響整個數(shù)字化生產(chǎn)力的分工結構。據(jù)此,本文提出大數(shù)據(jù)時代向大智能時代嬗變的論斷,包括以下三方面命題:首先,大模型的本質是智能的大規(guī)模集中供給,是智能的基礎設施化;其次,這一趨勢推動數(shù)據(jù)與智能的解耦,使得沒有大數(shù)據(jù)的企業(yè)也可接入高質量智能;最后,由此帶來的智能紅利對中小企業(yè)尤為有利,或成為經(jīng)濟結構性增長的重要來源。以上挑戰(zhàn)了大數(shù)據(jù)時代的思維范式,為相關人士理解數(shù)字化變局提供了一個有趣的思考起點。

大模型的本質

是智能的大規(guī)模集中供給

生成式AI在諸多方面不同于傳統(tǒng)AI。一方面,顧名思義,生成式AI擅長生成新內容,而傳統(tǒng)AI局限于解釋現(xiàn)有數(shù)據(jù)或者做出預測。投資機構a16z的MartinCasado認為:“微芯片將計算的邊際成本降到了零,互聯(lián)網(wǎng)將分發(fā)的邊際成本降到了零,大模型則將創(chuàng)作的邊際成本降到零。”另一方面,基于自然語言的人機交互界面,生成式AI具備了技術民主化的特質。正如麥肯錫的LareinaLee所說:“用戶不需要任何數(shù)據(jù)科學或機器學習專業(yè)知識,就能有效地利用生成式AI完成工作。這就好比大型機只有技術專家才會使用,而個人電腦人人皆可掌握。”

然而,本文強調生成式AI靈活應對多種非預設任務的能力,區(qū)別于需根據(jù)預設任務進行專門設計的傳統(tǒng)AI。要理解這一點,不妨考慮傳統(tǒng)AI公司面臨的商業(yè)模式困境。以AI四小龍為代表的“傳統(tǒng)”AI公司盡管技術投入巨大,但難以擺脫為企業(yè)客戶提供定制服務的低擴展性模式。這是因為,要實現(xiàn)AI算法與特定任務情景的匹配,技術供應方不得不提供大量低自動化程度的工程服務,既拉低利潤率又降低可擴展性。相比之下,體驗過的人士不難認同,大模型好似百科全書,幾乎所有領域都應對自如。盡管在專業(yè)領域需要模型“微調”,但正如“微調”二字所暗示的,其定制化程度遠低于傳統(tǒng)AI項目,預示著更好的經(jīng)濟性。

能力通用性和其他兩個經(jīng)濟屬性一起,成就了大模型的基礎設施地位。一方面,大模型具備規(guī)模經(jīng)濟。眾所周知,極度昂貴的訓練成本,是大模型為通用性所付出的代價。其規(guī)模經(jīng)濟性體現(xiàn)在,模型參數(shù)規(guī)模超越某臨界值后,其智能表現(xiàn)隨參數(shù)規(guī)模增長呈非線性增長。作為這一規(guī)律的提出者和堅定信仰者,OpenAI在擴大模型參數(shù)規(guī)模的路上蒙眼狂奔。另一方面,大模型具備生成性(generativity)。大模型提供者自身并不能充分發(fā)揮其價值,但其上可以“長出”各類面向真實用例的應用以實現(xiàn)難以預估的長尾價值。

大模型的本質是智能的集中化供給。作為基礎設施,“集中供給”并不新鮮,新鮮的是“智能的集中供給”。我們需要區(qū)分基礎設施的智能化和智能的基礎設施化。智能手機、智能網(wǎng)絡、智能城市、智能電網(wǎng)等詞匯描述的是給定基礎設施的智能化,指對異質性基礎設施(手機、網(wǎng)絡、城市、電網(wǎng)等)規(guī)模經(jīng)濟的個性化調度和外部性的多樣化開發(fā)。智能的基礎設施化則是指智能的生產(chǎn)和供給本身具備了基礎設施屬性。

智能似乎天然與某個聰明的、不可復制的、充滿創(chuàng)意的大腦相關,怎么可能基礎設施化呢?如果它真的基礎設施化了,又意味著什么呢?盡管這似乎是人類歷史上第一次,但歷史告訴我們,每次基礎設施集中化過程都深刻地影響當時的生產(chǎn)力與生產(chǎn)關系。正如電力的集中化生產(chǎn)和大規(guī)模供給推動了第二次工業(yè)革命,智能的大規(guī)模集中供給有望把數(shù)字化時代推向新高潮。

大模型推動數(shù)據(jù)與智能的解耦

筆者把這個新高潮命名為“大智能時代”,以區(qū)別于大數(shù)據(jù)時代。大數(shù)據(jù)時代,投資人通常問一家公司,你有數(shù)據(jù)嗎?即便有人意識到有數(shù)據(jù)的公司不一定能捕獲其價值,但幾乎所有人都認為沒有數(shù)據(jù)一定不能夠從智能中獲益。以這種數(shù)據(jù)-智能緊耦合為底色的商業(yè)思維深刻地影響著商業(yè)實踐。相關概念包括曾鳴教授提出的“數(shù)據(jù)智能”、脫胎自亞馬遜飛輪效應的“數(shù)據(jù)飛輪”以及移植自平臺經(jīng)濟學的“數(shù)據(jù)網(wǎng)絡效應”。

這些概念通常都會援引Google作為案例。Google經(jīng)常被美國的反壟斷機構約談,一個原因是所謂的數(shù)據(jù)網(wǎng)絡效應:搜索引擎的市場份額越大,用戶數(shù)據(jù)就越多,而數(shù)據(jù)訓練出來的機器算法就越來越智能,進而進一步提升其用戶體驗,導致更大的市場份額。曾鳴教授更是基于阿里巴巴的類似經(jīng)驗,提煉出以“數(shù)據(jù)智能”為基石的“智能商業(yè)”方法論。

Google首席經(jīng)濟學家HalVarian則認為,Google的地位不是來自數(shù)據(jù)資源本身,而應歸功于其卓越的數(shù)據(jù)科學與工程能力更好地釋放了數(shù)據(jù)資源的價值。能力優(yōu)勢和數(shù)據(jù)網(wǎng)絡效應都能帶來競爭優(yōu)勢和份額,但前者是稀缺性創(chuàng)造的李嘉圖租,后者是市場地位創(chuàng)造的壟斷租。他的潛臺詞是,你不能培養(yǎng)出卓越能力是你的事兒,不要給我扣壟斷的帽子。不少人或嗤之以鼻,認為是Hal屁股決定腦袋。但OpenAI的異軍突起表明,他可能是對的。ChatGPT對Google搜索的挑戰(zhàn)并不依靠數(shù)據(jù)優(yōu)勢。GPT3.0之前的所有訓練數(shù)據(jù)都來公開數(shù)據(jù),但不妨礙OpenAI在大模型能力方面走在Google前面,威脅到其搜索業(yè)務。

真正重要的不是OpenAI比Google厲害,而是它這么厲害還能對外開放,而非像Google那樣獨家用于自家服務。當然,這方面更厲害的是Meta(即Facebook),開源了模型的參數(shù)且免費支持商用。大模型好似中央電廠,它持續(xù)提煉幾乎人類的所有知識(數(shù)據(jù)),然后對大眾輸出,使得智能不需要在低水平重復開發(fā)。這挑戰(zhàn)了大數(shù)據(jù)時代“無數(shù)據(jù),不智能”的圭臬——企業(yè)的智能商業(yè)不一定以自身數(shù)據(jù)整合為前提?;诖竽P偷牡讓訁?shù),企業(yè)只需要小數(shù)據(jù)去微調這個模型,便有可能開展“智能商業(yè)”。

值得強調的是,“數(shù)據(jù)與智能的解耦”并不意味著數(shù)據(jù)不重要,而意味著數(shù)據(jù)重要性在產(chǎn)業(yè)不同環(huán)節(jié)并非均勻分布。數(shù)據(jù)作為智能原料的地位無可撼動。變化在于,大模型使用這種原料上的效率遠超其他,以至于有志于“智能商業(yè)”的企業(yè)構建自身數(shù)據(jù)飛輪可能喪失經(jīng)濟性。數(shù)據(jù)飛輪或者數(shù)據(jù)網(wǎng)絡效應的邏輯仍然成立,但問題是:當所有企業(yè)都試圖轉起自己的數(shù)據(jù)飛輪,憑什么是你脫穎而出呢?國家電網(wǎng)能夠穩(wěn)定輸出電力時,為什么要在工廠旁邊自建一個小發(fā)電廠呢?當然可能存在備份或補充的需要,但那是另一個邏輯。

釋放智能紅利,驅動經(jīng)濟結構性增長

數(shù)據(jù)與智能解耦帶來的經(jīng)濟性被我稱為智能紅利。Martin所強調的創(chuàng)造內容邊際成本為0是消費者側的紅利。比較一下傳統(tǒng)的內容創(chuàng)造過程和基于生成式AI的內容創(chuàng)造過程,便不難理解。然而,經(jīng)濟發(fā)展主要靠企業(yè)生產(chǎn)率的提升。智能紅利在這方面體現(xiàn)在:企業(yè)原本需要精心構建、維護自身數(shù)據(jù)供應鏈才能實現(xiàn) “智能商業(yè)”所需的“數(shù)據(jù)智能”,而智能大規(guī)模的集中供給可能大大節(jié)省這一過程所需的投資、時間、精力,使得企業(yè)可以專注于業(yè)務創(chuàng)新。

上述智能紅利是促進數(shù)字經(jīng)濟結構性增長的利器。中國經(jīng)濟發(fā)展面臨諸多挑戰(zhàn),而其持續(xù)增長的一個潛在來源是挖掘區(qū)域、行業(yè)發(fā)展不均背后的結構性潛力。眾所周知,小微企業(yè)受制于較為落后的IT基礎設施、孱弱的數(shù)據(jù)基礎和有限的預算,數(shù)字化轉型進程落后于大中型企業(yè)。那么,要實現(xiàn)數(shù)字經(jīng)濟結構性增長,有必要思考如何彌補上述企業(yè)側的數(shù)字化鴻溝。

相對于其他數(shù)字化技術,生成式AI在實現(xiàn)這一目標方面得天獨厚。一方面,生成式AI應用對企業(yè)自身的數(shù)字化準備程度要求相對較低。如果消費者都能使用,有什么理由小微企業(yè)不能呢?另一方面,在采納生成式AI應用方面,小微企業(yè)具有“光腳的不怕穿鞋的”優(yōu)勢。諸多阻礙大中型企業(yè)采納生成式AI的因素(如數(shù)據(jù)泄密)可能對小微企業(yè)影響甚微。并且,大中型企業(yè)需要解決新舊IT之間融合的問題,小微企業(yè)也沒有這方面的負擔。總之,智能紅利不是大中型企業(yè)的專屬,而是小微企業(yè)能夠站在同一智能起跑線上的歷史性機遇。

接入生成式AI應用有兩種方式。一是企業(yè)首先微調出自己獨有的大模型,然后在私有或混合環(huán)境下為自身各類應用賦能;二是直接利用現(xiàn)有的大模型提供商的API(如基于GPT)開發(fā)生成式AI應用,供自己使用或者作為服務售賣給客戶。兩者都受益于智能的集中供給,但小微企業(yè)更可能通過后者獲取智能紅利,其中也蘊含著應用開發(fā)者的創(chuàng)業(yè)機遇。

結語

生成式AI和大模型的誕生純屬偶然。它好似從天而降的隕石,蠻不講理地改變了原有產(chǎn)業(yè)格局和歷史脈絡。筆者作為數(shù)字化產(chǎn)業(yè)的參與者、觀察者和研究者,勾勒了改變發(fā)生的一種可能。按照這一邏輯往下推演,可以得到對當下一些熱門話題的不同觀點,留待后續(xù)。

(作者系北京大學國家發(fā)展研究院助理教授)

 

版權聲明:以上內容為《經(jīng)濟觀察報》社原創(chuàng)作品,版權歸《經(jīng)濟觀察報》社所有。未經(jīng)《經(jīng)濟觀察報》社授權,嚴禁轉載或鏡像,否則將依法追究相關行為主體的法律責任。版權合作請致電:【010-60910566-1260】。