侵權(quán)投訴
訂閱
糾錯
加入自媒體

隱私計算工程化之殤,為什么“久攻不破”?

Talk is cheap,show me the code!

這是編程界廣為流傳的一句話,空談無益,只以代碼見真章,要的是“實打?qū)嵞苡谩薄?/p>

而這句話似乎也映射了隱私計算領(lǐng)域的水溫之變。從2020年,數(shù)據(jù)被正式納入生產(chǎn)要素之日起,隱私計算便如張弦之箭,迎來了屬于它的東風(fēng),火爆效應(yīng)之下,吸引了眾多賽跑者和入局者,Gartner更是連續(xù)兩年將隱私計算列入年度戰(zhàn)略科技趨勢之一,一時之間,隱私計算被加上了諸多光環(huán)。

一面是寄予厚望,另一面卻是熱鬧背后潛藏的隱憂,隱私計算的發(fā)展似乎并沒有達(dá)到我們對它的預(yù)期。

某國有大型金融機構(gòu)的業(yè)務(wù)負(fù)責(zé)人高聲談(化名)向算力智庫直言:我們確實有對隱私計算產(chǎn)品的需求,也有意準(zhǔn)備采購,目前在做標(biāo)前測試,需要從一些量化的標(biāo)準(zhǔn)去考察,但測試結(jié)果卻并不如人意:很多隱私計算產(chǎn)品都不具備個性化建模等實際落地的工程化能力。

這也并不是算力智庫觀察到的一家之言,中國信通院云計算與大數(shù)據(jù)研究所大數(shù)據(jù)部副主任閆樹表示:目前隱私計算技術(shù)和解決方案還不夠成熟,在安全、性能和數(shù)據(jù)的互聯(lián)互通等方面仍存在挑戰(zhàn),場景落地能力和工程化問題是為“大難關(guān)”。在日前算力智庫舉辦的隱私計算一體機沙龍上,聯(lián)通大數(shù)據(jù)金融行業(yè)中心產(chǎn)品總監(jiān)周永明亦認(rèn)為:這兩年隱私計算看到的全是單點的、嘗試性的,實驗性的進展,什么時候能真正達(dá)到商用級別,把規(guī)模做起來,這才是我更想看到的,也是行業(yè)更需要去努力的方向。

顯然,2年下來,市場態(tài)度開始變得審慎與克制,需求側(cè)對于隱私計算技術(shù)的訴求不再容易被風(fēng)口裹挾,關(guān)注更多的是“是否可用”以及“是否好用”,而這也意味著隱私計算技術(shù)正面臨著一個臨界點,即能否從一項創(chuàng)新型的實驗技術(shù)走向大規(guī)模生產(chǎn)和商用。

飄在隱私計算上方的烏云

在這個臨界點的跨越上,有道久攻不破的關(guān)卡便是工業(yè)級別的工程化落地,如同“木桶短板,掣肘全局”。一位業(yè)內(nèi)資深人士坦言道。
在前述算力智庫的采訪中,工程化落地能力正成為業(yè)內(nèi)眾人口中的“高頻”詞匯,今年CB Insights中國發(fā)布的《2022年中國隱私計算技術(shù)與市場發(fā)展研究報告》亦指出:未來,隱私計算企業(yè)的工程化能力將成為行業(yè)焦點。

何謂工程化能力?這個詞或許并不陌生,但業(yè)界卻尚未看到對它清晰的界定。

“工程化能力”這個概念是為“表”,它的“里”包括很多面向和維度。我認(rèn)為隱私計算工程化能力是指將隱私計算產(chǎn)品從理論、原型到真正落地到客戶側(cè)產(chǎn)生業(yè)務(wù)價值的能力。前幾年可能整個行業(yè)在理論、產(chǎn)品原型、開源標(biāo)準(zhǔn)化的制定上,很多公司都有不錯的積累,但要說真正落地到客戶側(cè)產(chǎn)生實際業(yè)務(wù)價值,我覺得是從去年才開始的,這個能力在今年的節(jié)點上將變得尤為重要,能否做好對客戶的產(chǎn)品化支撐,包括系統(tǒng)的交付能力、運維能力和升級能力,都是對隱私計算公司的重要考驗,螞蟻集團可信原生技術(shù)總監(jiān)秦承剛在接受采訪時表示。

高聲談同樣認(rèn)為,工程化能力的通俗解釋是:隱私計算產(chǎn)品具不具備直接上銀行生產(chǎn)環(huán)境的能力,最起碼應(yīng)該包括幾方面,首先是兼容性,如果要設(shè)計硬件的話,硬件解決方案能不能和金融機構(gòu)現(xiàn)有的軟硬件設(shè)備做兼容。其次是產(chǎn)品實用性和穩(wěn)定性,設(shè)計軟件是否穩(wěn)定可靠,能否支持大規(guī)模的數(shù)據(jù)吞吐量,目前尚未經(jīng)歷大規(guī)模商用化驗證。再就是已接通合規(guī)數(shù)據(jù)源是否能夠滿足金融機構(gòu)的業(yè)務(wù)需求,目前受個人信息保護法沖擊,三方數(shù)據(jù)市場面臨重構(gòu),合規(guī)數(shù)據(jù)源通過隱私計算實現(xiàn)數(shù)據(jù)價值輸出的情況少之又少。

但遺憾的是,現(xiàn)階段行業(yè)的隱私計算工程化能力仍普遍處于早期階段,一如隱私計算從1979年由Shamir 和Blakley 提出秘密分享的緣起開始,“工程化落地能力”便如飄在隱私計算大廈上空的烏云,由來已久,卻久未消散。

工程化能力的“失落”

工程化能力緣何“失落”?

在高聲談看來,首先是產(chǎn)品化層面,就目前觀察來看,整個隱私計算行業(yè)的產(chǎn)品化能力良莠不齊,仍處初期。以金融業(yè)務(wù)場景為例,主要表現(xiàn)在:一是產(chǎn)品易用性不行,拿數(shù)據(jù)清理這個環(huán)節(jié)而言,絕大部分產(chǎn)品是不支持個性化清理的或者說沒有類似這樣的功能,它就是一鍵式傻瓜生成模型,放進去三千個變量標(biāo)簽,通過規(guī)則的入模變量只剩下不到十個,導(dǎo)致模型基本不可用。二就是產(chǎn)品穩(wěn)定性問題,即在面對數(shù)億樣本甚至更大的數(shù)據(jù)量級時,隱私計算平臺的生產(chǎn)可用性是否仍有保障。目前,在隱私計算技術(shù)側(cè),不管MPC也好,F(xiàn)L(聯(lián)邦學(xué)習(xí))也好,都能預(yù)見到算力和網(wǎng)絡(luò)傳輸?shù)钠款i,現(xiàn)階段隱私計算主要是在一些機構(gòu)內(nèi)部或者是兩方、三方之間應(yīng)用,處理的數(shù)據(jù)量較小,這個問題還不明顯。可是未來,多方數(shù)據(jù)交換需求的到來、5G和物聯(lián)網(wǎng)的發(fā)展所帶來的數(shù)據(jù)量急劇增大,隨著數(shù)據(jù)量爆發(fā)式的增長,不解決算力和通信問題,隱私計算的大規(guī)模應(yīng)用無從談起。

在這點上,很多隱私計算廠商也已經(jīng)深刻認(rèn)識,螞蟻集團可信原生技術(shù)總監(jiān)秦承剛亦坦言:進入到隱私計算領(lǐng)域以后,我們發(fā)現(xiàn)對于密碼學(xué)而言,今天不管是什么樣的密碼學(xué)都面臨著相同的問題,就是當(dāng)這些密碼學(xué)在通用處理器上進行運算的時候,速度都很慢,不管是零知識證明或者混淆電路,還是同態(tài)加密。此前拿同態(tài)加密做調(diào)研的時候,就有了一個基本認(rèn)識,同態(tài)加密在最差的情況下,和明文運算相比,大概要慢10萬倍,10萬倍是什么概念?就相當(dāng)于把當(dāng)前最新的英特爾Ice Lake處理器,直接打回到了幾十年前的8086處理器時代。

“不完美”的軟件固然是客觀bug,隱私計算廠商本身的局限性也是其因。

平心而論,當(dāng)前很多隱私計算廠商普遍缺乏全局視角,高聲談直言不諱道,就好比“客戶要的是一盤菜,光只提供盤子不行,而需要將整盤菜炒好了,端上桌才行”。To B生意在于應(yīng)該提供一個“能力樂高”,即一整套數(shù)據(jù)解決方案,而不是一個單點產(chǎn)品,比如能否對接可用的數(shù)據(jù)源,金融絕大部分場景,需要引入外部數(shù)據(jù)源,尤其是在數(shù)據(jù)建模過程中,數(shù)據(jù)需求量更甚,僅提供隱私產(chǎn)品往往是不夠的。再比如是否考慮到了數(shù)據(jù)方案的合規(guī)設(shè)計,數(shù)據(jù)授權(quán)鏈完整與否,客戶告知是否充分,數(shù)據(jù)存儲是否需要按照《個人信息保護法》的要求做全生命周期的目標(biāo)管理等,這涉及到產(chǎn)品前端界面的調(diào)整以及與數(shù)據(jù)源方交互過程中需落實的法律合規(guī)條款。

其次,缺乏對場景的理解力,也是很多隱私計算企業(yè)“先天基因”的欠缺,現(xiàn)階段入局隱私計算賽道的主要選手大多數(shù)為初創(chuàng)型企業(yè),多為技術(shù)出身,包括一些從AI公司或區(qū)塊鏈公司轉(zhuǎn)型過來的,基本很少扎根在業(yè)務(wù)場景一線,對場景的理解力不夠?qū)е庐a(chǎn)品實用性不足,這是環(huán)環(huán)相扣的關(guān)系。還有一個不得不提的痛點就是技術(shù)路徑之間的融合和互聯(lián)互通,雖然從技術(shù)角度來看,隱私計算的每一條技術(shù)路線都有其自證的邏輯,但對于最終客戶來說,對這項技術(shù)信任的建立不能僅僅依靠技術(shù)論證本身。做好技術(shù)標(biāo)準(zhǔn)化,實現(xiàn)技術(shù)棧自主可控國產(chǎn)化,建立權(quán)威和監(jiān)管機構(gòu)認(rèn)可的標(biāo)準(zhǔn)體系,也是隱私計算廠商需要推動和解決的問題。當(dāng)然這也不能苛求于隱私計算廠商一己之力,需要行業(yè)多方共治共推。

此外,數(shù)據(jù)源的配合積極性不夠也一定程度上制約了產(chǎn)業(yè)落地,由于缺少激勵,數(shù)據(jù)源不愿配合需求方費時費力提供測試數(shù)據(jù),加之因為《個保法》的出臺,合規(guī)的要求導(dǎo)致數(shù)據(jù)源共享的意愿更加淡薄。這些問題交織一起,才造成了今日工程化之困境,在這些問題都沒有解決之前,整個行業(yè)是不具備真正的生產(chǎn)和工程化實現(xiàn)的前提的。

那么“工程化之困”有何解?

在算力智庫的調(diào)研中發(fā)現(xiàn),一條被廣泛共識的解題方向正在浮現(xiàn)出來。

軟硬結(jié)合或破開“工程化之困”

工程化的問題其實就是怎么能夠讓客戶最大化程度去優(yōu)化性能和成本,華控清交總裁王勝利在日前的算力智庫隱私沙龍中一語總結(jié)到:成本太高,就通過工程化,將性能大幅提升,在性價比和計算成本之間取得平衡。

怎么平衡呢?業(yè)界開始將目光轉(zhuǎn)向軟硬結(jié)合。

其實可以發(fā)現(xiàn),在幾年前,業(yè)界對于密碼學(xué)等軟件類解決方案的呼聲似乎更高,密碼學(xué)一度被視為隱私計算的“原教旨主義”,甚至能隱約看到一條潛在的鄙視鏈,做軟件要優(yōu)于做硬件,而現(xiàn)在風(fēng)向變了,經(jīng)過幾年的實踐檢驗,軟件在“計算性能”一途上并非最優(yōu)解。

“我們認(rèn)為隱私計算未來在可信安全、可信執(zhí)行環(huán)境TEE以及算力加速上面,對硬件都一定是有依賴的。軟硬件結(jié)合一定會是可信隱私計算一個重要的技術(shù)領(lǐng)域,也一定會是數(shù)據(jù)密態(tài)時代行業(yè)的一個主流形態(tài),而且我們也很早就開始作相關(guān)的布局,其實到今天的話,也證明我們當(dāng)時的判斷差不多是對的”,秦承剛表示。在2021年9月便率先發(fā)布軟硬一體機的螞蟻集團,并且日前牽頭推進了全球首個隱私計算一體機國際標(biāo)準(zhǔn)立項,也確實印證了此點。

意識到硬件必要性的,不止螞蟻一家,目前業(yè)內(nèi)已經(jīng)有一批創(chuàng)業(yè)公司陸續(xù)扎入隱私計算軟硬結(jié)合的賽道,各家都在嘗試單點突破。比如星云Clustar主攻高性能算力提升,推出了隱私計算加速卡和軟硬一體機,融數(shù)聯(lián)智則瞄準(zhǔn)芯片研發(fā),數(shù)牘科技則推出了軟硬協(xié)同的隱私計算方案,據(jù)數(shù)牘科技介紹,經(jīng)過結(jié)合硬件的可插拔的特性,能夠非常靈活的對一臺通用的服務(wù)器進行能力改造,將之變?yōu)殡[私計算專用服務(wù)器,從而也提高了服務(wù)器資源和算力的利用效率,進一步降低計算資源開銷。

在軟硬結(jié)合的不斷探索中,隱私計算行業(yè)找到了一個共性切入口,即一體機, 一體機并非是新鮮概念,互聯(lián)網(wǎng)早已有之,華控清交公司總裁王勝利表示,一體機在理解層面,可以分為兩種,一種就是軟硬件的工程化設(shè)備,即所謂的Engineered System,以軟件為主,結(jié)合硬件加速,通過工程化的工作,最大化發(fā)揮軟件的優(yōu)勢,但是它對硬件,沒有什么太多不可替代的依賴,這也符合IT基本特點,以開放和兼容為基礎(chǔ)。另一種,就是我們所說的Fusion(融合),就是將各種硬件物理的組合在一起,或者通過某種資源管理軟件把硬件做集成。前者以軟件基因為主,并不依賴一種專有的硬件設(shè)備,開放性好,使用維護便捷,容易得到廣泛的使用。后者相對而言會依賴某種專有的硬件設(shè)備,使用門檻高,形成一定的技術(shù)壁壘。隱私增強計算PEC(Privacy Enhancement Computation)選擇工程一體化系統(tǒng)的交付形態(tài)對于系統(tǒng)性能和整體擁有成本達(dá)到一個商用平衡,以及客戶后期維護管理帶來很多便利。性能成本不做優(yōu)化,沒有兼容開放的IT技術(shù)在面對商業(yè)場景使用上會顯得困難重重。

高聲談也判斷:加入硬件化的解決方案,對于行業(yè)的長遠(yuǎn)發(fā)展來說是有利無害的,純軟件的競爭會容易導(dǎo)致紅海,導(dǎo)致行業(yè)沒有底線,去年就已出現(xiàn)過10萬元賣源碼的惡性案件,若是這樣,這個行業(yè)還怎么玩?所以加入硬件之后,有利于固化一些利潤空間,對于隱私行業(yè)來說,是具有長期發(fā)展意義的。另外從甲方的需求來看,我們也非常希望可以看到硬件化的落地方案,一如我前面所說,在招投標(biāo)過程中,甲方是會面臨決策風(fēng)險和遷移成本問題,如果有硬件底座的話,最起碼有個交付物,不像純軟件解決方案,廠商若是倒閉,我們也無法繼續(xù)維護,也不懂底層密碼計算。如果是通用的硬件底座解決方案,我們再把其他廠商引入進來,遷移成本就會比較小,從這幾方面來看,行業(yè)的方向是一體機,這也是目前許多廠商一致認(rèn)可的一個方案。

沖量在線CEO劉堯在日前結(jié)束的算力智庫隱私一體機沙龍中,亦認(rèn)為“現(xiàn)在這個時間點軟硬件結(jié)合的一體機是解決隱私計算行業(yè)大規(guī)模商業(yè)化落地的核心密鑰。首先面向業(yè)務(wù)系統(tǒng)適配的瓶頸,隱私計算相關(guān)的產(chǎn)品、軟件算法或者硬件不可以作為新的孤島矗立在客戶的原有系統(tǒng)里,以及客戶原有的建模平臺、數(shù)據(jù)中臺的遷移和對接也非常重要。其次隱私計算廠商當(dāng)下最需要解決的是底層硬件設(shè)備不同環(huán)境的差異化問題。而想要解決適配性與兼容性這兩大難題,通過軟硬件的結(jié)合方案,向上,無縫適配各種各樣的業(yè)務(wù)系統(tǒng)和數(shù)據(jù)治理流程。向下,打通各種各樣不同芯片、加速卡,形成軟硬件結(jié)合的一體化的能力!眲虮硎,對于不同硬件生態(tài)的打通也同樣需要做大量的前置準(zhǔn)備工作,而提到硬件,隱私計算廠商更需要關(guān)注的是適配信創(chuàng)環(huán)境。只有從軟件、硬件兩方面雙管齊下,持續(xù)攻關(guān),才能保證一體機產(chǎn)品對各類客戶均能實現(xiàn)一鍵式部署,提高一體機應(yīng)用的廣度、深度。

但軟硬結(jié)合,目前來看也不是坦途。

需要說明的是,軟硬結(jié)合與一體機,并不是畫等號的,一體機是軟硬結(jié)合的一種載體,盡管當(dāng)下能夠有效緩解隱私計算工程化落地與工程化交付中的一些困難,可隨著未來數(shù)據(jù)規(guī)模和業(yè)務(wù)復(fù)雜度的逐年遞增,一體機還需再進一步的提升擴展性和拓展更豐富的產(chǎn)品形態(tài),秦承剛強調(diào)到。

做軟硬結(jié)合,不管從周期,還是從為此付出的成本來看,都是既耗時又耗資源,比如我們做自主可控的TEE,前期投入了很多人力,大概花了2年才有最后的產(chǎn)品成型。而且交付軟件和交付硬件是不一樣的,交付硬件的話,會涉及到一個很長的供應(yīng)鏈,需要同時做好供應(yīng)鏈管理,這也直接導(dǎo)致了整個硬件領(lǐng)域“壁壘”的存在,一些中小型企業(yè)可能就會被阻擋在外。其實,我覺得不是所有的隱私計算公司都需要去做硬件,比如有的公司適合做軟件和密碼學(xué)算法,有的公司適合做硬件,大家可以找準(zhǔn)自己的定位,形成一個良好的分工協(xié)作,對于整個行業(yè)來說,發(fā)展會更快也會更高效。秦承剛繼續(xù)表示到。

縱觀互聯(lián)網(wǎng)的歷史發(fā)展脈絡(luò),任何技術(shù)往深了走,都會進入硬件領(lǐng)域,但置身于越來越紛繁復(fù)雜的國際形勢,全球微妙的競爭和對抗格局下,“去IOE化”(IBM的小型機、Oracle的數(shù)據(jù)庫,EMC的存儲設(shè)備)成為戰(zhàn)略級語境,2020年國家開始全面推廣信創(chuàng)產(chǎn)業(yè),其中涉及芯片、服務(wù)器的國產(chǎn)替代,于隱私計算軟硬結(jié)合而言,也必須未雨綢繆,尋求芯片“國產(chǎn)自主可控”的后路,這是算力提升當(dāng)中最艱難的部分,也將是隱私計算后半程突圍的機會。

       原文標(biāo)題 : 隱私計算工程化之殤,為什么“久攻不破”?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

安防 獵頭職位 更多
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號