大智能時代的產(chǎn)業(yè)再分工：“無數(shù)據(jù)，不智能”可以休矣

侯宏2023-10-28 09:44

圖片來源：視覺中國

侯宏/文 炙手可熱的生成式AI或大模型，將如何影響商業(yè)史走向？一個可能的思考角度是：大模型的入局將影響整個數(shù)字化生產(chǎn)力的分工結構。據(jù)此，本文提出大數(shù)據(jù)時代向大智能時代嬗變的論斷，包括以下三方面命題：首先，大模型的本質是智能的大規(guī)模集中供給，是智能的基礎設施化；其次，這一趨勢推動數(shù)據(jù)與智能的解耦，使得沒有大數(shù)據(jù)的企業(yè)也可接入高質量智能；最后，由此帶來的智能紅利對中小企業(yè)尤為有利，或成為經(jīng)濟結構性增長的重要來源。以上挑戰(zhàn)了大數(shù)據(jù)時代的思維范式，為相關人士理解數(shù)字化變局提供了一個有趣的思考起點。

大模型的本質

是智能的大規(guī)模集中供給

生成式AI在諸多方面不同于傳統(tǒng)AI。一方面，顧名思義，生成式AI擅長生成新內容，而傳統(tǒng)AI局限于解釋現(xiàn)有數(shù)據(jù)或者做出預測。投資機構a16z的MartinCasado認為：“微芯片將計算的邊際成本降到了零，互聯(lián)網(wǎng)將分發(fā)的邊際成本降到了零，大模型則將創(chuàng)作的邊際成本降到零。”另一方面，基于自然語言的人機交互界面，生成式AI具備了技術民主化的特質。正如麥肯錫的LareinaLee所說：“用戶不需要任何數(shù)據(jù)科學或機器學習專業(yè)知識，就能有效地利用生成式AI完成工作。這就好比大型機只有技術專家才會使用，而個人電腦人人皆可掌握。”

然而，本文強調生成式AI靈活應對多種非預設任務的能力，區(qū)別于需根據(jù)預設任務進行專門設計的傳統(tǒng)AI。要理解這一點，不妨考慮傳統(tǒng)AI公司面臨的商業(yè)模式困境。以AI四小龍為代表的“傳統(tǒng)”AI公司盡管技術投入巨大，但難以擺脫為企業(yè)客戶提供定制服務的低擴展性模式。這是因為，要實現(xiàn)AI算法與特定任務情景的匹配，技術供應方不得不提供大量低自動化程度的工程服務，既拉低利潤率又降低可擴展性。相比之下，體驗過的人士不難認同，大模型好似百科全書，幾乎所有領域都應對自如。盡管在專業(yè)領域需要模型“微調”，但正如“微調”二字所暗示的，其定制化程度遠低于傳統(tǒng)AI項目，預示著更好的經(jīng)濟性。

能力通用性和其他兩個經(jīng)濟屬性一起，成就了大模型的基礎設施地位。一方面，大模型具備規(guī)模經(jīng)濟。眾所周知，極度昂貴的訓練成本，是大模型為通用性所付出的代價。其規(guī)模經(jīng)濟性體現(xiàn)在，模型參數(shù)規(guī)模超越某臨界值后，其智能表現(xiàn)隨參數(shù)規(guī)模增長呈非線性增長。作為這一規(guī)律的提出者和堅定信仰者，OpenAI在擴大模型參數(shù)規(guī)模的路上蒙眼狂奔。另一方面，大模型具備生成性（generativity）。大模型提供者自身并不能充分發(fā)揮其價值，但其上可以“長出”各類面向真實用例的應用以實現(xiàn)難以預估的長尾價值。

大模型的本質是智能的集中化供給。作為基礎設施，“集中供給”并不新鮮，新鮮的是“智能的集中供給”。我們需要區(qū)分基礎設施的智能化和智能的基礎設施化。智能手機、智能網(wǎng)絡、智能城市、智能電網(wǎng)等詞匯描述的是給定基礎設施的智能化，指對異質性基礎設施（手機、網(wǎng)絡、城市、電網(wǎng)等）規(guī)模經(jīng)濟的個性化調度和外部性的多樣化開發(fā)。智能的基礎設施化則是指智能的生產(chǎn)和供給本身具備了基礎設施屬性。

智能似乎天然與某個聰明的、不可復制的、充滿創(chuàng)意的大腦相關，怎么可能基礎設施化呢？如果它真的基礎設施化了，又意味著什么呢？盡管這似乎是人類歷史上第一次，但歷史告訴我們，每次基礎設施集中化過程都深刻地影響當時的生產(chǎn)力與生產(chǎn)關系。正如電力的集中化生產(chǎn)和大規(guī)模供給推動了第二次工業(yè)革命，智能的大規(guī)模集中供給有望把數(shù)字化時代推向新高潮。

大模型推動數(shù)據(jù)與智能的解耦

筆者把這個新高潮命名為“大智能時代”，以區(qū)別于大數(shù)據(jù)時代。大數(shù)據(jù)時代，投資人通常問一家公司，你有數(shù)據(jù)嗎？即便有人意識到有數(shù)據(jù)的公司不一定能捕獲其價值，但幾乎所有人都認為沒有數(shù)據(jù)一定不能夠從智能中獲益。以這種數(shù)據(jù)-智能緊耦合為底色的商業(yè)思維深刻地影響著商業(yè)實踐。相關概念包括曾鳴教授提出的“數(shù)據(jù)智能”、脫胎自亞馬遜飛輪效應的“數(shù)據(jù)飛輪”以及移植自平臺經(jīng)濟學的“數(shù)據(jù)網(wǎng)絡效應”。

這些概念通常都會援引Google作為案例。Google經(jīng)常被美國的反壟斷機構約談，一個原因是所謂的數(shù)據(jù)網(wǎng)絡效應：搜索引擎的市場份額越大，用戶數(shù)據(jù)就越多，而數(shù)據(jù)訓練出來的機器算法就越來越智能，進而進一步提升其用戶體驗，導致更大的市場份額。曾鳴教授更是基于阿里巴巴的類似經(jīng)驗，提煉出以“數(shù)據(jù)智能”為基石的“智能商業(yè)”方法論。

Google首席經(jīng)濟學家HalVarian則認為，Google的地位不是來自數(shù)據(jù)資源本身，而應歸功于其卓越的數(shù)據(jù)科學與工程能力更好地釋放了數(shù)據(jù)資源的價值。能力優(yōu)勢和數(shù)據(jù)網(wǎng)絡效應都能帶來競爭優(yōu)勢和份額，但前者是稀缺性創(chuàng)造的李嘉圖租，后者是市場地位創(chuàng)造的壟斷租。他的潛臺詞是，你不能培養(yǎng)出卓越能力是你的事兒，不要給我扣壟斷的帽子。不少人或嗤之以鼻，認為是Hal屁股決定腦袋。但OpenAI的異軍突起表明，他可能是對的。ChatGPT對Google搜索的挑戰(zhàn)并不依靠數(shù)據(jù)優(yōu)勢。GPT3.0之前的所有訓練數(shù)據(jù)都來公開數(shù)據(jù)，但不妨礙OpenAI在大模型能力方面走在Google前面，威脅到其搜索業(yè)務。

真正重要的不是OpenAI比Google厲害，而是它這么厲害還能對外開放，而非像Google那樣獨家用于自家服務。當然，這方面更厲害的是Meta（即Facebook），開源了模型的參數(shù)且免費支持商用。大模型好似中央電廠，它持續(xù)提煉幾乎人類的所有知識（數(shù)據(jù)），然后對大眾輸出，使得智能不需要在低水平重復開發(fā)。這挑戰(zhàn)了大數(shù)據(jù)時代“無數(shù)據(jù)，不智能”的圭臬——企業(yè)的智能商業(yè)不一定以自身數(shù)據(jù)整合為前提?；诖竽Ｐ偷牡讓訁?shù)，企業(yè)只需要小數(shù)據(jù)去微調這個模型，便有可能開展“智能商業(yè)”。

值得強調的是，“數(shù)據(jù)與智能的解耦”并不意味著數(shù)據(jù)不重要，而意味著數(shù)據(jù)重要性在產(chǎn)業(yè)不同環(huán)節(jié)并非均勻分布。數(shù)據(jù)作為智能原料的地位無可撼動。變化在于，大模型使用這種原料上的效率遠超其他，以至于有志于“智能商業(yè)”的企業(yè)構建自身數(shù)據(jù)飛輪可能喪失經(jīng)濟性。數(shù)據(jù)飛輪或者數(shù)據(jù)網(wǎng)絡效應的邏輯仍然成立，但問題是：當所有企業(yè)都試圖轉起自己的數(shù)據(jù)飛輪，憑什么是你脫穎而出呢？國家電網(wǎng)能夠穩(wěn)定輸出電力時，為什么要在工廠旁邊自建一個小發(fā)電廠呢？當然可能存在備份或補充的需要，但那是另一個邏輯。

釋放智能紅利，驅動經(jīng)濟結構性增長

數(shù)據(jù)與智能解耦帶來的經(jīng)濟性被我稱為智能紅利。Martin所強調的創(chuàng)造內容邊際成本為0是消費者側的紅利。比較一下傳統(tǒng)的內容創(chuàng)造過程和基于生成式AI的內容創(chuàng)造過程，便不難理解。然而，經(jīng)濟發(fā)展主要靠企業(yè)生產(chǎn)率的提升。智能紅利在這方面體現(xiàn)在：企業(yè)原本需要精心構建、維護自身數(shù)據(jù)供應鏈才能實現(xiàn) “智能商業(yè)”所需的“數(shù)據(jù)智能”，而智能大規(guī)模的集中供給可能大大節(jié)省這一過程所需的投資、時間、精力，使得企業(yè)可以專注于業(yè)務創(chuàng)新。

上述智能紅利是促進數(shù)字經(jīng)濟結構性增長的利器。中國經(jīng)濟發(fā)展面臨諸多挑戰(zhàn)，而其持續(xù)增長的一個潛在來源是挖掘區(qū)域、行業(yè)發(fā)展不均背后的結構性潛力。眾所周知，小微企業(yè)受制于較為落后的IT基礎設施、孱弱的數(shù)據(jù)基礎和有限的預算，數(shù)字化轉型進程落后于大中型企業(yè)。那么，要實現(xiàn)數(shù)字經(jīng)濟結構性增長，有必要思考如何彌補上述企業(yè)側的數(shù)字化鴻溝。

相對于其他數(shù)字化技術，生成式AI在實現(xiàn)這一目標方面得天獨厚。一方面，生成式AI應用對企業(yè)自身的數(shù)字化準備程度要求相對較低。如果消費者都能使用，有什么理由小微企業(yè)不能呢？另一方面，在采納生成式AI應用方面，小微企業(yè)具有“光腳的不怕穿鞋的”優(yōu)勢。諸多阻礙大中型企業(yè)采納生成式AI的因素（如數(shù)據(jù)泄密）可能對小微企業(yè)影響甚微。并且，大中型企業(yè)需要解決新舊IT之間融合的問題，小微企業(yè)也沒有這方面的負擔。總之，智能紅利不是大中型企業(yè)的專屬，而是小微企業(yè)能夠站在同一智能起跑線上的歷史性機遇。

接入生成式AI應用有兩種方式。一是企業(yè)首先微調出自己獨有的大模型，然后在私有或混合環(huán)境下為自身各類應用賦能；二是直接利用現(xiàn)有的大模型提供商的API（如基于GPT）開發(fā)生成式AI應用，供自己使用或者作為服務售賣給客戶。兩者都受益于智能的集中供給，但小微企業(yè)更可能通過后者獲取智能紅利，其中也蘊含著應用開發(fā)者的創(chuàng)業(yè)機遇。

結語

生成式AI和大模型的誕生純屬偶然。它好似從天而降的隕石，蠻不講理地改變了原有產(chǎn)業(yè)格局和歷史脈絡。筆者作為數(shù)字化產(chǎn)業(yè)的參與者、觀察者和研究者，勾勒了改變發(fā)生的一種可能。按照這一邏輯往下推演，可以得到對當下一些熱門話題的不同觀點，留待后續(xù)。

（作者系北京大學國家發(fā)展研究院助理教授）