长兴郴障科技有限公司

澎湃Logo
下載客戶端

登錄

  • +1

DPU發(fā)展的四個(gè)關(guān)鍵問(wèn)題

鄢貴海/中國(guó)科學(xué)報(bào)
2022-08-10 10:06
未來(lái)2% >
字號(hào)

DPU是面向基礎(chǔ)設(shè)施層的數(shù)據(jù)處理單元。在DPU概念誕生之初,人們爭(zhēng)論它“應(yīng)如何定義”。但后來(lái)發(fā)現(xiàn),只有定義,還遠(yuǎn)不能說(shuō)明DPU能做什么、有什么作用、如何與現(xiàn)有系統(tǒng)更好地協(xié)同。

要講清楚DPU的技術(shù)發(fā)展和應(yīng)用價(jià)值,需要觸及關(guān)于DPU的4個(gè)關(guān)鍵問(wèn)題:DPU是什么、DPU能否標(biāo)準(zhǔn)化、DPU產(chǎn)業(yè)化面臨哪些挑戰(zhàn)、是否有中國(guó)化方案。

DPU是什么?

所謂基礎(chǔ)設(shè)施層,是有別于應(yīng)用層而言的,為了給“應(yīng)用”提供物理或虛擬化資源,甚至提供基礎(chǔ)服務(wù)的邏輯層。現(xiàn)有的計(jì)算系統(tǒng),被人為地分為基礎(chǔ)設(shè)施層(IaaS)、平臺(tái)層(PaaS)、軟件層(SaaS),以及位于最上層的應(yīng)用層。

從優(yōu)化技術(shù)的側(cè)重點(diǎn)來(lái)看,越基礎(chǔ)層的組件越傾向于以性能優(yōu)先為導(dǎo)向,存在更多的“機(jī)器依賴”;越上層的優(yōu)化越以生產(chǎn)效率為導(dǎo)向,通過(guò)層層封裝,屏蔽底層差異,對(duì)用戶透明。

為什么會(huì)有面向基礎(chǔ)設(shè)施層的DPU?難道是現(xiàn)有的數(shù)據(jù)中心的CPU、GPU、路由器、交換機(jī)不能繼續(xù)作為“面向基礎(chǔ)設(shè)施層的數(shù)據(jù)處理單元”了嗎?計(jì)算系統(tǒng)的研究很大程度上是“優(yōu)化”的研究;現(xiàn)有的基礎(chǔ)設(shè)施不是不能,而是不夠“優(yōu)化”。

DPU的出現(xiàn)首先要解決的就是網(wǎng)絡(luò)數(shù)據(jù)包處理的問(wèn)題。隨著核心網(wǎng)、匯聚網(wǎng)朝著100G、200G發(fā)展,接入網(wǎng)也達(dá)到50G、100G時(shí),CPU無(wú)法提供足夠的算力來(lái)處理數(shù)據(jù)包了。而且,網(wǎng)絡(luò)帶寬的增速來(lái)自于應(yīng)用的豐富、數(shù)據(jù)中心規(guī)模的擴(kuò)大、數(shù)字化進(jìn)展的驅(qū)動(dòng),而 CPU 性能增速卻隨著摩爾定律的放緩而下降,這進(jìn)一步加劇了服務(wù)器節(jié)點(diǎn)上CPU的計(jì)算負(fù)擔(dān)。

另外一個(gè)例子是云計(jì)算場(chǎng)景下的“虛擬機(jī)之間的數(shù)據(jù)轉(zhuǎn)發(fā)”問(wèn)題,即OVS。通常,20個(gè)虛擬機(jī)需要消耗至強(qiáng)多核處理器5個(gè)核的算力,這是一筆比較大的開(kāi)銷,同時(shí)也是使用DPU的一個(gè)原因。

此外,目前的系統(tǒng)結(jié)構(gòu)并不是為處理網(wǎng)絡(luò)數(shù)據(jù)而生的,在高帶寬網(wǎng)絡(luò)、隨機(jī)訪問(wèn)、高并發(fā)度收發(fā)的場(chǎng)景下效率并不高。現(xiàn)有技術(shù)開(kāi)辟了用“輪詢”替代中斷來(lái)處理IO操作的方法,但這些在現(xiàn)有體系基礎(chǔ)上的“修修補(bǔ)補(bǔ)”只能當(dāng)做權(quán)宜之計(jì),本質(zhì)上是經(jīng)典技術(shù)在新場(chǎng)景下的不適應(yīng)。

有人把DPU單純理解為給CPU“減負(fù)”,把DPU作為一個(gè)網(wǎng)卡的“變種”,將其視為一個(gè)單純的算法硬件化的載體,以“頭腦簡(jiǎn)單,四肢發(fā)達(dá)”的形象示人。但如果重新審視系統(tǒng)功能的載體分布情況,就會(huì)看到DPU并非單純的加速器,而是與CPU全方位配合的一個(gè)關(guān)鍵組件。

從主機(jī)負(fù)責(zé)所有的管理、控制、數(shù)據(jù)面的功能,到逐步“卸載”這些功能分別迭代出異構(gòu)計(jì)算、智能網(wǎng)卡、DPU。DPU的價(jià)值愈發(fā)彰顯,人們甚至可以以DPU為中心來(lái)構(gòu)建計(jì)算系統(tǒng)。前不久,阿里云公布的CIPU宣稱替代CPU成為新一代云計(jì)算核心硬件,可以說(shuō)是把DPU推向了舞臺(tái)中心,雖然尚有爭(zhēng)議,但這也許正是DPU發(fā)展的方向。

DPU可以標(biāo)準(zhǔn)化嗎?

在回答DPU是否可以標(biāo)準(zhǔn)化之前,需要明確標(biāo)準(zhǔn)化的確切含義是什么,以及為什么要標(biāo)準(zhǔn)化。我認(rèn)為,DPU的標(biāo)準(zhǔn)化涉及兩個(gè)方面: DPU的架構(gòu)是否可以標(biāo)準(zhǔn)化?這影響到DPU的研發(fā)成本問(wèn)題。DPU的應(yīng)用是否可以標(biāo)準(zhǔn)化?這影響DPU應(yīng)用生態(tài)的問(wèn)題。

現(xiàn)在廣泛存在一種認(rèn)識(shí)誤區(qū):籠統(tǒng)地認(rèn)為DPU是一種專用處理器,既然是“專用”,就不可避免地采用“定制化”才能實(shí)現(xiàn),而一旦“定制化”,“標(biāo)準(zhǔn)化”也就無(wú)從談起了,從而得到了一個(gè)武斷的結(jié)論——DPU沒(méi)有產(chǎn)業(yè)化價(jià)值。

其實(shí)專用化、定制化、標(biāo)準(zhǔn)化這三個(gè)概念,并沒(méi)有直接因果關(guān)系。

比如,GPU無(wú)疑是一種“專用”處理器,因?yàn)閳D形圖像這種信息交互方式是絕對(duì)的剛需;GPU中通過(guò)定制化來(lái)實(shí)現(xiàn)光柵操作處理器、紋理處理器等高度定制化的功能單元,及其超大規(guī)模的數(shù)據(jù)集同步并行處理技術(shù),都是面向像素級(jí)海量數(shù)據(jù)處理的定制化技術(shù);GPU通過(guò)OpenGL、DirectX等圖形操作API和CUDA通用編程框架來(lái)實(shí)現(xiàn)標(biāo)準(zhǔn)化。所以,“專用”并不比“通用”低人一等,“定制化”甚至是一些應(yīng)用剛需必須采用的技術(shù)選擇。

DPU標(biāo)準(zhǔn)化是一個(gè)過(guò)程,而不是目的。標(biāo)準(zhǔn)化的進(jìn)程很大程度與市場(chǎng)化程度相互作用。

DPU產(chǎn)業(yè)化面臨的挑戰(zhàn)

DPU主要在基礎(chǔ)層和平臺(tái)層發(fā)揮作用,這決定了現(xiàn)階段DPU的優(yōu)化主要是性能導(dǎo)向。這其實(shí)是塊“硬骨頭”。現(xiàn)在有些DPU的設(shè)計(jì)過(guò)于依賴通用核的使用,盡管靈活性得到了保證,但是性能往往上不去,根本不可能有客戶買單。

還有一個(gè)業(yè)界人士更切身體會(huì)的挑戰(zhàn)——產(chǎn)品適配。但“適配”說(shuō)起來(lái)容易做起來(lái)難,因?yàn)闀?huì)遭遇工作量“指數(shù)爆炸”的適配困境。

鑒于此,我們開(kāi)發(fā)了一套自動(dòng)化多生態(tài)環(huán)境的編譯、發(fā)布、測(cè)試系統(tǒng)平臺(tái)(ADIP),把適配工作系統(tǒng)地分解為兩條、4個(gè)階段的流水線,分別針對(duì)主機(jī)側(cè)的軟件適配和DPU側(cè)的軟件適配。這個(gè)開(kāi)發(fā)集成平臺(tái)已經(jīng)支持了中科馭數(shù)的DPU在多個(gè)國(guó)產(chǎn)CPU和OS的適配工作,目前還在快速完善過(guò)程中。

DPU還面臨一些其他的挑戰(zhàn),一些是屬于目前國(guó)內(nèi)集成電路設(shè)計(jì)行業(yè)面臨的共性問(wèn)題,比如芯片制造的供應(yīng)鏈問(wèn)題、高水平研發(fā)人員短缺問(wèn)題,等等;也有DPU賽道的特性挑戰(zhàn),比如需求多樣化與DPU設(shè)計(jì)功能失配、DPU的軟件生態(tài)不夠成熟等問(wèn)題。

DPU的發(fā)展是否有“中國(guó)方案”?

DPU的發(fā)展是否有適合我們自己的道路或“中國(guó)方案”?這也是我們一直在思考的問(wèn)題。在計(jì)算系統(tǒng)發(fā)展的歷程中,大體有三個(gè)重要的因素決定了一類產(chǎn)品/技術(shù)是否能取得商業(yè)化的成功。第一是“性能”,取決于創(chuàng)新結(jié)構(gòu)、算法的發(fā)明,創(chuàng)新技術(shù)、工藝的采用等。第二是“生產(chǎn)率”,與開(kāi)發(fā)效率、系統(tǒng)與現(xiàn)有系統(tǒng)的兼容性及學(xué)習(xí)成本等因素有關(guān)。第三是“成本”,涉及規(guī)模效應(yīng)、工程化水平、供應(yīng)鏈以及服務(wù)成本等。

DPU的性能問(wèn)題一方面是設(shè)計(jì)問(wèn)題,比如結(jié)構(gòu)是否優(yōu)秀、功能是否完善等,另一方面是DPU芯片生產(chǎn)制造問(wèn)題。從綜合產(chǎn)品力來(lái)看,我們雖然局部技術(shù)上占有優(yōu)勢(shì),整體上還難以與西方芯片巨頭如英偉達(dá)、邁威等相匹敵,因此,目前DPU的整體格局還是典型的“西強(qiáng)東弱”。

但是,中國(guó)算力需求是全球最強(qiáng)勁的。服務(wù)器的需求增速是全球第一,國(guó)家層面還有“新基建”中的“算力基礎(chǔ)設(shè)施”的宏大布局、今年2月份啟動(dòng)的“東數(shù)西算”戰(zhàn)略布局、運(yùn)營(yíng)商開(kāi)始廣泛投入的“算力網(wǎng)絡(luò)”的建設(shè)等。這不僅為DPU的發(fā)展提供了機(jī)遇,給整個(gè)信息技術(shù)、計(jì)算技術(shù)的發(fā)展都提供了新的機(jī)遇。

(原標(biāo)題:《DPU發(fā)展的四個(gè)關(guān)鍵問(wèn)題》。作者鄢貴海系中科院計(jì)算技術(shù)研究所研究員、中科馭數(shù)董事長(zhǎng)。)

    責(zé)任編輯:張靜
    圖片編輯:張同澤
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋
            真人百家乐官网赌场娱乐网规则| 蒙自县| 百家乐试玩网站| 肃宁县| 大发888hanpa| 网上百家乐官网大赢家筹码| 做生意必须看风水吗| 真人百家乐娱乐场开户注册| 百家乐官网代理博彩正网| 百家乐玩法秘诀| 百家乐官网娱乐下载| 名仕国际棋牌官方网| 百家乐官网园| 百家乐作弊| 大发888代充值| 百家乐牌机的破解法| 网络百家乐官网路单图| 做百家乐网上投注| 百家乐官网真人游戏| 百家乐官网试玩账户| 百家乐软件代理打| 赌百家乐庄闲能赢| 百家乐类游戏平台| 罗马百家乐官网的玩法技巧和规则 | 百家乐官网平注秘籍| 皇冠国际足球| 泰无聊棋牌游戏中心| 玩百家乐游戏经验| 百家乐官网高命中投注| 长方形百家乐筹码| 做生意风水关键吗| 西游记百家乐官网娱乐城| 邻水| 金都国际| 百家乐888| 于都县| 百家乐官网真人百家乐官网皇冠开户| 百家乐官网羸钱法| 易胜博百家乐官网娱乐城| 兰考县| 百家乐官网视频游戏大厅|