长兴郴障科技有限公司

澎湃Logo
下載客戶端

登錄

  • +1

GTC速遞|“加量也加價”:英偉達40系顯卡性能提升70%

澎湃新聞記者 邵文
2022-09-21 12:53
來源:澎湃新聞
? 未來2% >
字號

·“得益于英偉達與臺積電的緊密合作,專為GPU制造優化的4nm工藝讓Ada Lovelace架構能夠集成760億個晶體管和超過18000個CUDA核心,較上一代Ampere架構多70%,能耗比相較Ampere則提升一倍。”

·“RTX光線追蹤和神經網絡渲染的時代正在全面展開,全新英偉達Ada Lovelace架構將其推向了新的高度。Ada的性能是上一代產品的4倍,正在為完全基于仿真的未來游戲鋪路。”

經過幾個月的猜測,英偉達創始人兼首席執行官黃仁勛終于在昨晚的GTC(GPU技術大會)2022上揭曉了RTX 40系列GPU的配置。

RTX 4090 圖片來源:GTC大會

RTX 4090售價1599 美元,建議零售價為12999元人民幣起,相比上一代RTX 3090的11999元上漲1000元,將于10月12日發布。RTX 40系列較上一代性能提升最高可達4倍,其特色光線追蹤技術也是此次最重要的升級之一。

“RTX光線追蹤和神經網絡渲染的時代正在全面展開,全新英偉達Ada Lovelace架構將其推向了新的高度。”黃仁勛在GTC大會主題演講上說。

RTX 4080 圖片來源:GTC大會

RTX 4080則將于11月上市,目前提供的兩個價格是16GB 版本為1199美元(人民幣定價上探至9499元),12GB版本預計為899美元(人民幣定價為7199元),相較上一代同定位的RTX3070Ti的4499元售價可謂“再創新高”。

RTX 40系列顯卡售價 圖片來源:GTC大會

在2021年“缺芯潮”等因素推動的業績攀升后,英偉達2022年的情況卻出現逆轉。在美國芯片出口管制重拳和以太坊“合并”等事件影響下,該公司的發展前景被蒙上陰影。此前公布的第二季度財報已顯示,該公司游戲部門的收入同比下降33%,環比降幅達44%。因此,此次GTC大會成為多方矚目的焦點。

“加量也加價”:40系顯卡性能、價格再創新高

RTX 4090采用了全新的第三代RTX架構,并使用臺積電4納米工藝制造。按照傳統,新一代RTX也以計算機史上的名人命名,這次的是世界上第一位計算機程序員Ada Lovelace女士。

“得益于英偉達與臺積電的緊密合作,專為GPU制造優化的4nm工藝讓Ada Lovelace架構能夠集成760億個晶體管和超過18000個CUDA核心,較上一代Ampere架構多70%,能耗比相較Ampere則提升一倍。”黃仁勛在演講中表示。

采用了Ada架構的40系顯卡在性能表現上遠遠超過前輩30系顯卡。這款RTX GPU主要用于游戲玩家和少數剩余的加密礦工,有望將游戲世界從一系列預先計算的圖像轉變為完全模擬的虛擬世界。

“Ada正在為完全基于仿真的未來游戲鋪路。Ada的性能是上一代產品的4倍,為整個行業設立了新標準。”黃仁勛表示。

能效方面,RTX 4090功率為450W,與RTX 3090Ti保持一致,但英偉達稱在同樣功率下,4090的游戲表現較RTX 3090Ti提升一倍。

定位低一檔的RTX 4080則有16GB與12GB兩個顯存版本,16GB版本集成了9728個DUDA核心。英偉達稱RTX 4080 16GB的游戲性能兩倍于RTX 3080,并超過了上一代旗艦RTX 3090Ti。而12GB版本的RTX 4080則集成了7680個CUDA核心,理論性能也超越了上一代旗艦RTX 3090Ti。

光線追蹤技術與“元宇宙構建工具”

在新的Ada Lovelace架構中,SM 流處理器新增著色器重排序技術(Shader Execution Recording),黃仁勛強調其對GPU來說是革命性的,可實現對任務的實時重新調度,原理上與CPU的亂序執行技術類似。這項技術能夠讓英偉達顯卡光線追蹤性能提升2-3倍,在RTX 4090上輸出90 TFLOPS,性能較上代提升兩倍,整體游戲性能提升25%。

對于這項技術的原理,黃仁勛解釋道,光線追蹤的工作負載需要不同的線程處理,不同著色器之間很難合并工作,SER技術則能夠即時安排著色器負載,從而提高執行效率,更好地利用GPU資源,打造更好的光線追蹤效果。

SER技術工作原理 圖片來源:GTC大會

除此之外,黃仁勛還宣布了用于游戲和創作應用的第三代NVIDIA DLSS(Deep Learning Super Sampling,深度學習超級采樣),表示這是神經網絡圖形技術的下一次革命。這項由人工智能驅動的技術可以生成全新幀,從而大幅提高游戲性能,也就是說,利用AI算法降低模擬真實物理環境所需要的計算量。

這也是第三代DLSS技術與之前最大的不同——生成的不再是像素,而是全面的畫面幀。DLSS 3技術可以分析兩幀連續的游戲圖像,并向神經網絡輸入像素級的從幀到幀的運動方向和速度信息,此后神經網絡模型將據此計算出中間幀。于是,中間幀由神經網絡計算生成,不再涉及圖形渲染,完全獨立于游戲,這就能大大減輕游戲中即時演算的運算量。

“DLSS 3能夠為Ada GPU帶來遠高于CPU可計算的幀率,從而讓一些對CPU要求較高的游戲也從中受益。”黃仁勛說。據介紹,第三代DLSS技術相較于單純渲染的方式可以將游戲性能提高4倍。

在現場,黃仁勛展示了對CPU要求比較高的《微軟模擬飛行》游戲在開啟DLSS 3前后的幀率變化。 圖片來源:GTC大會

在RTX 40系列GPU和DLSS 3的配合下,3D設計師直接就可以利用精確的物理學和逼真的材料渲染完整的光線追蹤環境,并實時查看效果。

自元宇宙一詞熱門以來,被稱為“元宇宙構建工具”的Omniverse越來越受關注。黃仁勛發布了關于Omniverse的一系列重大更新。

Omniverse是英偉達在2019年推出的實時3D設計協作工具,黃仁勛曾在2021 GTC大會上介紹,“Omniverse可以讓個人模擬制造出遵從物理規律的共享3D虛擬世界”。

現在,用戶可以在Omniverse中創建數字孿生數據庫——首個用于數據生成和數字孿生模擬的SimReady素材庫。

除此之外,在昨天的GTC大會上,黃仁勛表示,Omniverse支持Ada Lovelace GPU。由此,Omniverse不僅能夠加速各種復雜的3D工作流,還能夠將光線追蹤、AI和計算等復雜技術集成到3D流水線中,在VR中也能實現實時光線追蹤——Cloud XR。

在NVIDIA Omniverse Cloud的支持下,Omniverse可以為3D工作流提供無縫協作體驗。黃仁勛表示,“NVIDIA Omniverse Cloud是一款IaaS產品,可以連接在云上、本地和單個設備上,運行Omniverse應用。”

NVIDIA RTX Remix 圖片來源:GTC大會

在現場黃仁勛還展示了NVIDIA RTX Remix。NVIDIA RTX Remix可以讓愛好者為各種經典游戲制作mod添加RTX光追效果。即捕捉下經典游戲畫面,然后利用AI工具自動增強材質,并通過光線追蹤和DLSS快速將游戲RTX化。看起來此舉是為了讓更多人開始使用和熟悉Omniverse。

單顆2000TOPS的“核彈”級產品:Atlan取消,雷神接棒

在2021年春季的英偉達GTC大會上,黃仁勛宣布了用于自動駕駛汽車的Atlan芯片,計劃于2025年用于量產車應用。但在昨晚的2022年秋季GTC上,黃仁勛宣布Atlan已被取消,取而代之的是一種名為Thor(雷神)的新設計,該設計將提供兩倍的性能和數據吞吐量,但仍將在 2025年推出。

黃仁勛沒有將Thor描述為自動駕駛芯片,而是表示,這顆SoC是為汽車的中央計算架構而生,用這一顆芯片打造一個控制器,即可同時為自動泊車、智能駕駛、車機、儀表盤、駕駛員監測等多個系統提供算力。

Thor SoC預計將通過770億個晶體管提供2000 TOPS的整數計算能力以及2000 TFLOPS的浮點性能。相比之下,2016年為特斯拉AutoPilot的第2版(與Pascal GPU 組合)提供動力的Parker SoC提供了大約1個TOPS,2020年緊隨其后的是提供30個TOPS的Xavier芯片。

單顆2000 TOPS可以說是“核彈”級的產品,目之所及沒有對手。

黃仁勛介紹,這樣的性能來源于對CPU(Grace)、GPU(Ada Lovelace)和處理 Transformer模型的引擎(Hopper)進行了升級。“Hopper提供了令人驚嘆的 Transformer引擎和Vision Transformer的快速變革,而Ada是英偉達最新的GPU產品,基于4nm工藝打造。”

英偉達自動駕駛芯片演進

Thor可以被配置成多種模式,可以將2000 TOPS和2000 TFLOPS全部用于自動駕駛工作流;其2000 TOPS的算力也可以分開用,如一部分用于駕駛艙AI和信息娛樂系統,另一部分用于輔助駕駛。Thor中的多計算域隔離允許并發、對時間敏感的多進程無中斷運行,可以在一臺計算機上同時運行Linux、QNX和Android。

將自動泊車、智能駕駛、車機、儀表盤、駕駛員監測等多個系統的計算統一到Thor上完成,意味著對汽車EE架構的顯著簡化,同時可以降低產品的布線規模,降低車重,從而達到降低成本的作用。

除此之外,英偉達還發布了一款微型機器人系統級模塊芯片Jetson Orin Nano,它的速度較之前的Jetson Nano快了80倍。Jetson Orin Nano可以運行NVIDIA Isaac機器人堆棧,并具有 ROS 2 GPU 加速框架。

    責任編輯:鄭潔
    校對:施鋆
    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            百家乐官网技术辅助软件| 文昌市| 百家乐官网赌场程序| 百家乐博娱乐平台赌百家乐| 优博家百家乐官网娱乐城| 户型风水不好害死人 24种破财户| 澳门顶级赌场百家乐| 风水24山| 百家乐官网赢钱战略| 百家乐重要心态| 百家乐官网代理网址| 太阳城百家乐怎么出千| 百家乐官网视频计牌器| V博百家乐的玩法技巧和规则| 百家乐官网论坛博彩拉| 百家乐投注| 葡京百家乐的玩法技巧和规则| 百家乐官网真钱送彩金| 威尼斯人娱乐城 104| 百家乐官网作| 朔州市| 百家乐庄闲分布概率| 互博百家乐官网现金网| 大发888登录网页游戏| 百家乐白菜价| 巴特百家乐官网的玩法技巧和规则| 余姚市| 大赢家娱乐城信誉| 将军百家乐的玩法技巧和规则 | 皇家赌场| 百家乐作弊视频| 百家乐官网和的打法| 横峰县| 临朐县| 百家乐官网经验在哪找| 菲律宾太子娱乐城| 大发888我发财| 百家乐庄闲| 太阳百家乐官网网| 百家乐官网赌场策略| 澳门百家乐官网赌客|