长兴郴障科技有限公司

澎湃Logo
下載客戶端

登錄

  • +1

DPU發展的四個關鍵問題

鄢貴海/中國科學報
2022-08-10 10:06
未來2% >
字號

DPU是面向基礎設施層的數據處理單元。在DPU概念誕生之初,人們爭論它“應如何定義”。但后來發現,只有定義,還遠不能說明DPU能做什么、有什么作用、如何與現有系統更好地協同。

要講清楚DPU的技術發展和應用價值,需要觸及關于DPU的4個關鍵問題:DPU是什么、DPU能否標準化、DPU產業化面臨哪些挑戰、是否有中國化方案。

DPU是什么?

所謂基礎設施層,是有別于應用層而言的,為了給“應用”提供物理或虛擬化資源,甚至提供基礎服務的邏輯層。現有的計算系統,被人為地分為基礎設施層(IaaS)、平臺層(PaaS)、軟件層(SaaS),以及位于最上層的應用層。

從優化技術的側重點來看,越基礎層的組件越傾向于以性能優先為導向,存在更多的“機器依賴”;越上層的優化越以生產效率為導向,通過層層封裝,屏蔽底層差異,對用戶透明。

為什么會有面向基礎設施層的DPU?難道是現有的數據中心的CPU、GPU、路由器、交換機不能繼續作為“面向基礎設施層的數據處理單元”了嗎?計算系統的研究很大程度上是“優化”的研究;現有的基礎設施不是不能,而是不夠“優化”。

DPU的出現首先要解決的就是網絡數據包處理的問題。隨著核心網、匯聚網朝著100G、200G發展,接入網也達到50G、100G時,CPU無法提供足夠的算力來處理數據包了。而且,網絡帶寬的增速來自于應用的豐富、數據中心規模的擴大、數字化進展的驅動,而 CPU 性能增速卻隨著摩爾定律的放緩而下降,這進一步加劇了服務器節點上CPU的計算負擔。

另外一個例子是云計算場景下的“虛擬機之間的數據轉發”問題,即OVS。通常,20個虛擬機需要消耗至強多核處理器5個核的算力,這是一筆比較大的開銷,同時也是使用DPU的一個原因。

此外,目前的系統結構并不是為處理網絡數據而生的,在高帶寬網絡、隨機訪問、高并發度收發的場景下效率并不高。現有技術開辟了用“輪詢”替代中斷來處理IO操作的方法,但這些在現有體系基礎上的“修修補補”只能當做權宜之計,本質上是經典技術在新場景下的不適應。

有人把DPU單純理解為給CPU“減負”,把DPU作為一個網卡的“變種”,將其視為一個單純的算法硬件化的載體,以“頭腦簡單,四肢發達”的形象示人。但如果重新審視系統功能的載體分布情況,就會看到DPU并非單純的加速器,而是與CPU全方位配合的一個關鍵組件。

從主機負責所有的管理、控制、數據面的功能,到逐步“卸載”這些功能分別迭代出異構計算、智能網卡、DPU。DPU的價值愈發彰顯,人們甚至可以以DPU為中心來構建計算系統。前不久,阿里云公布的CIPU宣稱替代CPU成為新一代云計算核心硬件,可以說是把DPU推向了舞臺中心,雖然尚有爭議,但這也許正是DPU發展的方向。

DPU可以標準化嗎?

在回答DPU是否可以標準化之前,需要明確標準化的確切含義是什么,以及為什么要標準化。我認為,DPU的標準化涉及兩個方面: DPU的架構是否可以標準化?這影響到DPU的研發成本問題。DPU的應用是否可以標準化?這影響DPU應用生態的問題。

現在廣泛存在一種認識誤區:籠統地認為DPU是一種專用處理器,既然是“專用”,就不可避免地采用“定制化”才能實現,而一旦“定制化”,“標準化”也就無從談起了,從而得到了一個武斷的結論——DPU沒有產業化價值。

其實專用化、定制化、標準化這三個概念,并沒有直接因果關系。

比如,GPU無疑是一種“專用”處理器,因為圖形圖像這種信息交互方式是絕對的剛需;GPU中通過定制化來實現光柵操作處理器、紋理處理器等高度定制化的功能單元,及其超大規模的數據集同步并行處理技術,都是面向像素級海量數據處理的定制化技術;GPU通過OpenGL、DirectX等圖形操作API和CUDA通用編程框架來實現標準化。所以,“專用”并不比“通用”低人一等,“定制化”甚至是一些應用剛需必須采用的技術選擇。

DPU標準化是一個過程,而不是目的。標準化的進程很大程度與市場化程度相互作用。

DPU產業化面臨的挑戰

DPU主要在基礎層和平臺層發揮作用,這決定了現階段DPU的優化主要是性能導向。這其實是塊“硬骨頭”。現在有些DPU的設計過于依賴通用核的使用,盡管靈活性得到了保證,但是性能往往上不去,根本不可能有客戶買單。

還有一個業界人士更切身體會的挑戰——產品適配。但“適配”說起來容易做起來難,因為會遭遇工作量“指數爆炸”的適配困境。

鑒于此,我們開發了一套自動化多生態環境的編譯、發布、測試系統平臺(ADIP),把適配工作系統地分解為兩條、4個階段的流水線,分別針對主機側的軟件適配和DPU側的軟件適配。這個開發集成平臺已經支持了中科馭數的DPU在多個國產CPU和OS的適配工作,目前還在快速完善過程中。

DPU還面臨一些其他的挑戰,一些是屬于目前國內集成電路設計行業面臨的共性問題,比如芯片制造的供應鏈問題、高水平研發人員短缺問題,等等;也有DPU賽道的特性挑戰,比如需求多樣化與DPU設計功能失配、DPU的軟件生態不夠成熟等問題。

DPU的發展是否有“中國方案”?

DPU的發展是否有適合我們自己的道路或“中國方案”?這也是我們一直在思考的問題。在計算系統發展的歷程中,大體有三個重要的因素決定了一類產品/技術是否能取得商業化的成功。第一是“性能”,取決于創新結構、算法的發明,創新技術、工藝的采用等。第二是“生產率”,與開發效率、系統與現有系統的兼容性及學習成本等因素有關。第三是“成本”,涉及規模效應、工程化水平、供應鏈以及服務成本等。

DPU的性能問題一方面是設計問題,比如結構是否優秀、功能是否完善等,另一方面是DPU芯片生產制造問題。從綜合產品力來看,我們雖然局部技術上占有優勢,整體上還難以與西方芯片巨頭如英偉達、邁威等相匹敵,因此,目前DPU的整體格局還是典型的“西強東弱”。

但是,中國算力需求是全球最強勁的。服務器的需求增速是全球第一,國家層面還有“新基建”中的“算力基礎設施”的宏大布局、今年2月份啟動的“東數西算”戰略布局、運營商開始廣泛投入的“算力網絡”的建設等。這不僅為DPU的發展提供了機遇,給整個信息技術、計算技術的發展都提供了新的機遇。

(原標題:《DPU發展的四個關鍵問題》。作者鄢貴海系中科院計算技術研究所研究員、中科馭數董事長。)

    責任編輯:張靜
    圖片編輯:張同澤
    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            澳门百家乐娱乐城网址| 新澳博百家乐官网娱乐城| 百家乐官网赌博凯时娱乐| 申博太阳城官网| 实战百家乐官网十大取胜原因百分百战胜百家乐官网不买币不吹牛只你能做到按我说的.百家乐官网基本规则 | 百家乐注册赠金| 宝丰县| 华盛顿百家乐的玩法技巧和规则| 玩百家乐官网会犯法吗| LV百家乐官网娱乐城| 大发888更名网址6222| 射阳县| 沙龙百家乐娱乐平台| 百家乐官网机械投注法| 大发888真钱娱乐| 百家乐官网技巧开户网址| 打百家乐官网如何赢分| 大发888客户端 运行| 做生意属虎的朝向| 百家乐官网优惠高的网址| bet365代理| 博天堂百家乐官网| 百家乐官网翻天超清| 基础百家乐官网的玩法技巧和规则 | 百家乐视频游戏聊天| 澳门百家乐官网如何算牌| 六合彩官网| 威尼斯人娱乐城网上赌博| 南宁百家乐官网赌| 岳阳县| 求购百家乐官网程序| 澳门足球博彩网站| 百家乐平注法到6| 百家乐翻天快播粤语| 百家乐官网网络游戏信誉怎么样 | 大发888娱乐场漏洞| 大发百家乐的玩法技巧和规则| 澳门百家乐有哪些| 百家乐官网刷钱| 至尊百家乐官网娱乐平台| 长春市|