楊強(qiáng):隱私計算為何要開源?

胡群2022-05-20 18:45

經(jīng)濟(jì)觀察網(wǎng) 記者 胡群  “如果隱私計算和聯(lián)邦學(xué)習(xí)技術(shù)只是掌握在少數(shù)寡頭的手里,我們還是得不到真正的數(shù)據(jù)流通,也得不到真正的數(shù)字經(jīng)濟(jì)發(fā)展,因此必須把門檻降低,其中一個有效手段就是開源,能夠讓人人都可以使用這樣的技術(shù),人人都能貢獻(xiàn)到這樣的技術(shù)。”楊強(qiáng)說。

楊強(qiáng)是香港科技大學(xué)計算機(jī)與工程系講席教授、FATE開源社區(qū)技術(shù)指導(dǎo)委員會主席,今年4月,他又有了一個新身份——開放群島( Open Islands)開源社區(qū)執(zhí)行主席。

開放群島(Open Islands)是由深圳數(shù)據(jù)交易有限公司聯(lián)合國家智庫、國家單位、高校、大型金融機(jī)構(gòu)、大型互聯(lián)網(wǎng)公司等多家發(fā)起單位牽頭成立的國內(nèi)首個國際化自主可控隱私計算開源社區(qū)。

隨著數(shù)字經(jīng)濟(jì)的發(fā)展,數(shù)據(jù)已成為數(shù)字經(jīng)濟(jì)基本的生存要素,而數(shù)據(jù)的安全高效可信可控流動則變得異常重要,隱私計算恰逢其時。5月11日,IDC發(fā)布消息稱,隱私保護(hù)計算入選《IDCTechScape:全球行業(yè)生態(tài)使能技術(shù),2022》報告“變革型”技術(shù)曲線。同時入選的還有DAOs、區(qū)塊鏈、多接入邊緣計算等共六項技術(shù)。

IDC調(diào)研發(fā)現(xiàn),2021中國隱私計算市場規(guī)模突破8.6億元人民幣大關(guān)。從收入形態(tài)而言,市場收入主要來源于產(chǎn)品售賣或平臺建設(shè)方面,大量技術(shù)服務(wù)商的營收規(guī)模仍然處于億級以下水平。

如何看待國內(nèi)日漸火熱的隱私計算,為何要推動隱私計算開源,楊強(qiáng)接受了經(jīng)濟(jì)觀察網(wǎng)記者的專訪。

楊強(qiáng)表示,要保證數(shù)據(jù)的安全性,開源和透明是很好的方法,因為一個平臺是否有漏洞、后門,都會透明地打開給所有人看,大家都來觀察、督查,如有問題,大家會打補(bǔ)丁、必須把門檻降低。

觀望冷靜期

經(jīng)濟(jì)觀察網(wǎng):近年隱私計算概念較火,很多創(chuàng)業(yè)公司已獲得數(shù)輪融資,在金融領(lǐng)域中,多家大中型銀行也發(fā)布相關(guān)白皮書或研究報告,但成熟應(yīng)用案例并不多,這是什么原因?

楊強(qiáng):首先我們要肯定資本市場積極支持隱私計算行業(yè),并且真的是自己掏錢來支持是非常可喜的。同時很多技術(shù)人才投身其中,也是非常值得欽佩的。如果按照高德納(Gartner)技術(shù)成熟曲線,當(dāng)前隱私計算已經(jīng)歷初始的繁榮期,但現(xiàn)在是在一個比較觀望和冷靜的時期,大家有各種各樣的技術(shù)方案,卻發(fā)現(xiàn)在需求方?jīng)]有想象的那么熱烈。但我相信,市場需求方的熱烈時刻不久就會到來,這基于兩個先決條件。

一是國內(nèi)正在積極推動的數(shù)字經(jīng)濟(jì)和數(shù)據(jù)要素市場。今年一月份,國務(wù)院辦公廳印發(fā)《要素市場化配置綜合改革試點總體方案》提到,探索“原始數(shù)據(jù)不出域、數(shù)據(jù)可用不可見”的交易范式,在保護(hù)個人隱私和確保數(shù)據(jù)安全的前提下,分級分類、分步有序推動部分領(lǐng)域數(shù)據(jù)流通應(yīng)用。3月,《廣東省數(shù)字政府改革建設(shè)2022年工作要點》提出,探索運(yùn)用區(qū)塊鏈、隱私計算等新技術(shù)強(qiáng)化數(shù)據(jù)安全防護(hù)。

二是疫情倒逼很多公司開展線上化業(yè)務(wù),催生出很多數(shù)字化機(jī)會。如果一個公司僅僅關(guān)注自己的技術(shù)而不去關(guān)注市場的走向、別人的需求,那么它往往會做出一些很高端的軟件,但使用者卻少之又少,我覺得這個現(xiàn)象并不奇怪。我們參考一下過去AI和互聯(lián)網(wǎng),包括云計算技術(shù)等等,我們都看到這樣一種從激情走向理智的過程,現(xiàn)在隱私計算正在經(jīng)歷這樣一個過程。

經(jīng)濟(jì)觀察網(wǎng):為何隱私計算會成為互聯(lián)網(wǎng)、金融等行業(yè)熱門的技術(shù)?

楊強(qiáng):在過去幾年里,我們見證了機(jī)器學(xué)習(xí)在人工智能應(yīng)用中迅猛發(fā)展,但機(jī)器學(xué)習(xí)需要很大的數(shù)據(jù)量訓(xùn)練才能達(dá)到滿意的性能水平,而高質(zhì)量、大數(shù)量的訓(xùn)練數(shù)據(jù)很難獲得,我們不得不面對難以橋接的數(shù)據(jù)孤島。

身處“數(shù)據(jù)時代”,如何有效挖掘數(shù)據(jù)中蘊(yùn)藏的智能而不侵害數(shù)據(jù)本身的隱私和安全,是我們推動社會進(jìn)步和生產(chǎn)力發(fā)展需要共同思考和實踐的課題。隱私計算的本質(zhì)就是在實現(xiàn)“數(shù)據(jù)可用不可見”這一目標(biāo)的過程中產(chǎn)生的一系列理論和技術(shù)。

從二十世紀(jì)七八十年代誕生的基于隱藏部分信息來保護(hù)數(shù)據(jù)隱私的安全多方計算理論,到近年來圍繞“數(shù)據(jù)不動模型動”理念發(fā)明的聯(lián)邦學(xué)習(xí)技術(shù)、隱私計算的發(fā)展已歷經(jīng)40多年。隨著人工智能在各行業(yè)的應(yīng)用落地,人們對于用戶隱私和數(shù)據(jù)安全的關(guān)注度不斷提高。用戶開始更加關(guān)注他們的隱私信息是否未經(jīng)許可,便被他人出于商業(yè)或其他目的而利用,甚至濫用。因此在歐美國家,互聯(lián)網(wǎng)機(jī)構(gòu)率先使用隱私計算技術(shù)。而在中國,近年隨著《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》和《個人信息保護(hù)法》相關(guān)法律法規(guī)的進(jìn)一步實施,已有很多互聯(lián)網(wǎng)、金融機(jī)構(gòu)等企業(yè)由于泄露用戶數(shù)據(jù)而被重罰。

如何在遵守更加嚴(yán)格的、新的隱私保護(hù)條例的前提下,解決數(shù)據(jù)碎片化和數(shù)據(jù)隔離的問題,是當(dāng)前人工智能研究者和實踐者面臨的首要問題。倘若不能很好地解決這一問題,人工智能很有可能面臨新一輪的寒冬。

在金融領(lǐng)域,一方面為了準(zhǔn)確衡量一個用戶的資質(zhì),金融機(jī)構(gòu)需要廣泛地利用各種數(shù)據(jù),包括消費數(shù)據(jù)、工作數(shù)據(jù)和投資數(shù)據(jù)等,而這些數(shù)據(jù)往往分散在不同的機(jī)構(gòu)中,例如工作單位、電商平臺、社交網(wǎng)絡(luò)和投資機(jī)構(gòu)等;另一方面,對于金融機(jī)構(gòu),政府部門有著格外嚴(yán)格的數(shù)據(jù)安全監(jiān)管,想要直接收集大量用戶的數(shù)據(jù)是不可行的。近年由于互聯(lián)網(wǎng)、金融等行業(yè)大規(guī)模應(yīng)用隱私計算,使得隱私計算獲得了指數(shù)級的增長。

但是,隱私計算不會在所有市場中同時獲得高速發(fā)展,我們看到目前國內(nèi)除互聯(lián)網(wǎng)、金融行業(yè)外,智能終端如手機(jī)廠商特別有興趣引入隱私計算,并紛紛建立團(tuán)隊做隱私計算,其中一個很大的動力在于它們的智能終端設(shè)備要進(jìn)入歐美市場,要符合當(dāng)?shù)氐姆煞ㄒ?guī)。

開源與產(chǎn)業(yè)生態(tài)

經(jīng)濟(jì)觀察網(wǎng):為何要推動隱私計算開源?

楊強(qiáng):隱私計算、聯(lián)邦學(xué)習(xí)這些新技術(shù)主要的思想是數(shù)據(jù)可用而不可見,并且可控可計量、數(shù)據(jù)不出本地而知識可以出本地,但是知識也不曝露數(shù)據(jù)的隱私。就是我們所說的魚和熊掌其實可以兼得,如果我們把技術(shù)做好了就可以得到這樣的效果。

如果要得到這樣的效果還需要開源技術(shù)的發(fā)展。如果隱私計算和聯(lián)邦學(xué)習(xí)技術(shù)只是掌握在少數(shù)寡頭的手里,我們還是得不到真正的數(shù)據(jù)流通,也得不到真正的數(shù)字經(jīng)濟(jì)發(fā)展,因此必須把這個門檻降低,其中一個有效手段就是開源,能夠讓人人都可以使用這樣的技術(shù),人人都能貢獻(xiàn)到這樣的技術(shù)。

在隱私計算、聯(lián)邦學(xué)習(xí)的“商業(yè)化大網(wǎng)”中,安全、效率、有效性、普惠是緯線,開源生態(tài)主導(dǎo)的技術(shù)迭代與場景普及是經(jīng)線。目前聯(lián)邦學(xué)習(xí)的算法更新迭代主要來自兩個動力:一是人工智能和隱私計算領(lǐng)域的大量研究,科研機(jī)構(gòu)、人員不斷研究新情況、新漏洞和新算法,產(chǎn)出更多科研成果。同時,國際間的交流積極活躍,全球一流科研人員的匯集,成為技術(shù)發(fā)展的動力。

第二個動力是開源社區(qū)的建設(shè)。基于開源協(xié)作的形式,用戶、生態(tài)伙伴等更多角色的參與,使得技術(shù)接受更多維度檢驗的同時,也能夠建立起更加敏捷、全面的反應(yīng)機(jī)制,隨時響應(yīng)安全風(fēng)險,極大提高了軟件算法的安全性與迭代效率。

經(jīng)濟(jì)觀察網(wǎng):目前開源取得了什么效果?

楊強(qiáng):開源促進(jìn)了隱私計算的“普惠”與價值共生。以國內(nèi)首個聯(lián)邦學(xué)習(xí)開源社區(qū)FATE為例,F(xiàn)ATE的開源開啟了國內(nèi)隱私計算技術(shù)的開源浪潮,是全球首個工業(yè)級聯(lián)邦學(xué)習(xí)開源框架,有效降低了“聯(lián)邦學(xué)習(xí)”的技術(shù)門檻,為很多2020年及之后出現(xiàn)的聯(lián)邦學(xué)習(xí)產(chǎn)品的研發(fā)與應(yīng)用提供了可靠的借鑒或參考。中國信通院調(diào)研統(tǒng)計顯示,55%的國內(nèi)隱私計算產(chǎn)品是基于或參考了開源項目,其中以FATE開源項目為主。FATE開源社區(qū)加速了聯(lián)邦學(xué)習(xí)從“大廠”向小微B端企業(yè)的覆蓋與普及的同時,讓聯(lián)邦學(xué)習(xí)產(chǎn)業(yè)生態(tài)及參與方從“單兵作戰(zhàn)”走向生態(tài)化。

目前,開源已成為大勢所趨,成為隱私計算產(chǎn)業(yè)生態(tài)核心組成部分。在FATE中,3000+的核心開發(fā)者通過社區(qū)能快速獲取有關(guān)如何解決業(yè)務(wù)問題的建議,并采用FATE開源框架及其30余個算法組件,搭建自身技術(shù)棧,利用社區(qū)的合力,讓技術(shù)的魯棒性、適配性、完整性得到全面的提升。而社區(qū)的維護(hù)者、開發(fā)者又能夠基于用戶實際業(yè)務(wù)的需求,進(jìn)一步反哺技術(shù)與項目的迭代,價值共生。

聯(lián)邦學(xué)習(xí)、FATE開源框架在保護(hù)數(shù)據(jù)安全方面的作用已經(jīng)在大量實際應(yīng)用中得到驗證,且運(yùn)用成熟?,F(xiàn)階段,在多方數(shù)據(jù)合作的實際業(yè)務(wù)場景中,安全已不再是最大顧慮;重點轉(zhuǎn)向效率與有效性,或者說是如何在安全、效率、有效性間取得平衡:即在安全可靠的前提下,使效率與有效性最大化。在此背景下,我們提出了兼顧安全、效率、性能、可解釋性、普惠等方面的“可信聯(lián)邦學(xué)習(xí)” ,首次將安全、性能,效率等要素統(tǒng)一在共同的理論框架下。

互聯(lián)互通,建立標(biāo)準(zhǔn)

經(jīng)濟(jì)觀察網(wǎng):如果隱私計算要場景中廣泛落地,還面臨哪些障礙?

楊強(qiáng):首先,我們一開始更多地強(qiáng)調(diào)隱私計算使用的是哪一項技術(shù),而不是特別關(guān)心要達(dá)到什么目的,所以可能一開始有點跑偏了。比如有些廠商特別強(qiáng)調(diào)隱私計算要使用多方計算才安全,使用其他的一些技術(shù)就不安全。其實事實不是這樣的,就好像在蓋一個房子一樣,任何一個技術(shù)其實只是一塊磚頭,如何把這個房子建好考驗的是我們對整體技術(shù)的把控,而不是一塊磚頭的軟硬決定整個房子的安全性。聯(lián)邦學(xué)習(xí)是把這些磚有機(jī)地結(jié)合起來,成為一個房子的設(shè)計方案。這個方案并不排斥任何一方的參與,我們管這個技術(shù)叫做可信聯(lián)邦學(xué)習(xí)或者可信隱私計算。

其次,隨著隱私保護(hù)和合理使用用戶數(shù)據(jù)的法律法規(guī)取得了越來越多的進(jìn)展,制定隱私保護(hù)的標(biāo)準(zhǔn)顯得愈加重要。比如A金融機(jī)構(gòu)用的是一類技術(shù),B用的是另一類技術(shù),C可能是大數(shù)據(jù)公司,用的第三類技術(shù)。當(dāng)大家想互聯(lián)互通的時候,卻發(fā)現(xiàn)這些技術(shù)之間很難溝通,所以現(xiàn)在提出統(tǒng)一大市場非常及時。

隱私計算要按照一個標(biāo)準(zhǔn)搭建、按照一個標(biāo)準(zhǔn)設(shè)計,最后大家各自的方案都可以在一個標(biāo)準(zhǔn)下很容易地互通互聯(lián)。因此,我們在今年FATE社區(qū)里面提出一個重要的口號就是互通互聯(lián),要促進(jìn)各大廠商好幾十個不同的方案,非常非常難互通,我們要在這方面比別人多走一步,要讓他們的這些技術(shù)都能夠很容易地連接起來。

然后,還需要建立標(biāo)準(zhǔn),我們也在國際上建立了一個初始標(biāo)準(zhǔn),國內(nèi)在信通院的領(lǐng)導(dǎo)下也建立了很多的標(biāo)準(zhǔn)。但這些標(biāo)準(zhǔn)還遠(yuǎn)遠(yuǎn)不夠,更好的標(biāo)準(zhǔn)是能夠把技術(shù)和監(jiān)管要求和法律連接起來,這樣的標(biāo)準(zhǔn)才是有用的標(biāo)準(zhǔn),我們現(xiàn)在還缺乏這樣一種相互連接的標(biāo)準(zhǔn)。如果一個技術(shù)被認(rèn)為滿足一個標(biāo)準(zhǔn),那么它就可以合法使用,現(xiàn)在還沒有達(dá)到這樣一個目的,所以這是我接下來特別想推動的,就是把法律界、標(biāo)準(zhǔn)界、政府和技術(shù)開發(fā)人員請到一個桌子上讓大家討論,并達(dá)成共識。

第三,現(xiàn)在大家談的都是數(shù)據(jù),但是我認(rèn)為未來的世界是模型的世界,當(dāng)數(shù)據(jù)都不能出本地,流通知識的唯一載體就是模型。因此,可以想像以后不管是數(shù)據(jù)交易所還是業(yè)務(wù)的多方合作,流通的實體就是模型,所以模型的管理和模監(jiān)管是非常重要的。

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟(jì)觀察報》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟(jì)觀察報》社所有。未經(jīng)《經(jīng)濟(jì)觀察報》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請致電:【010-60910566-1260】。
金融市場研究院主任
主要關(guān)注銀行、信托、fintech領(lǐng)域市場動態(tài)。

熱新聞

電子刊物

點擊進(jìn)入