NVIDIA GeForce RTX 20系列,是由NVIDIA繼GeForce GTX 10系列后開發的圖形處理器系列。於2018年8月20日的Gamescom(科隆遊戲展)上发布。[1][2][3]本系列首發產品是GeForce RTX 2080及2080Ti,2018年9月20日正式發售[4]。此系列產品新命名為RTX,而未沿用推出多年的GTX,以突顯支援光线跟踪的特色。
架构特性
RTX 20系列基于图灵微架构(Turing),具有实时光线跟踪(Ray tracing)功能。[5]通过使用RT核心(光線追踪運算核心)可以加速这一过程。这些核心能够高效处理四叉树和球形层次结构,并在碰撞模拟的过程中更快地为三角面组成的立体模型进行物体碰撞模拟。
RT核心的光线追踪功能在模拟反射、折射和阴影的操作上可以取代传统立方体贴图和深度贴图的光栅技术。从光线追踪运算得到的信息可以增强阴影使画面更加逼真,尤其是可以将发生于屏幕画面以外的动作通过阴影和光线反射渲染到画面之中。
张量運算核心(Tensor Core)进一步加速了光线追踪,并用于填充部分渲染图像中的空白,这种技术被称为「降噪」。张量核心原是為深度学习而設計的,例如学习如何提高图像的分辨率。但通常消费者的张量核心主要是执行一些已经完成的深度学习模型,这些模型是在超级计算机进行分析和解决的,超级计算机确定如何实现这些目标的方法,例如学习如何提高图像的分辨率,然后由消费者的张量核心实际使用这个方法,也就是使用超级计算机找到的方法来提高图像的分辨率。
因此,圖靈架構的光線追蹤特性,實際上是舊有光線追蹤技術與近年興起的人工智慧(AI)、深度學習結合的產物,先是利用光線追蹤專用的運算單元RT core生成圖像的關鍵要素,剩餘的非關鍵要素則是交由深度學習運算單元Tensor Core來補全,而圖像中的關鍵要素,也藉由Tensor Core執行相關的深度學習程式來決定。除此以外,Tensor Core還被用於執行消除混疊的深度學習程式(深度學習超級採樣,DLSS),來柔化畫面鋸齒邊緣。[6]
將深度學習、光線追蹤用於畫面運算雖然不是首個,NVIDIA早在基於帕斯卡、伏打圖形處理微架構的GeForce GTX TITAN系列上有先行鋪路,光線追蹤更是早已有之的技術,只是當時裝置的效能僅能到作生成靜態畫面之用,而本代GeForce RTX系列則是首個在畫面處理中大量使用深度學習技術、引入與深度學習相結合的光線追蹤實時動態畫面技術的圖形處理器。不過它仍然保留了效能強勁、規格龐大的傳統光柵化渲染3D畫面所需的運算組件。[7]
細節
- 採用台積電12nm FFN製程打造,由伏特微架構使用的12nm FFC製程改進(但本質上依舊是台積電16nm FF+製程的延伸版本),性能是後者的1.1倍,功耗只有後者的70%,核心面積則可以縮小20%
- 為容納數量龐大的運算單元,核心面積相比帕斯卡微架構的大幅增加,由GP102(GeForce GTX 1080Ti)的471mm2增加至TU102(GeForce RTX 2080Ti)的754mm 2
- CUDA 7.5
- 採用全新的SM陣列設計: TPC包含了兩個SM單元(Pascal為1個),SM單元重新分配為64個FP32、64個INT32、8個Tensor Core 、1個RT Core ,同時添加了獨立的INT數據路徑,支援FP32和INT32操作的並發執行。
- 為共享暫存、一級暫存、紋理暫存引入了統一架構,一級暫存與共享暫存大小是靈活可變的,可以根據需要在64+32KB或者32+64KB之間變換,讓一級暫存更充分利用資源,也減少一級暫存延遲,並提供比Pascal GPU中使用的一級暫存更高的頻寬,同時二級暫存容量提升。
- Tensor Core(張量核心) : 負責人工智慧、神經網路運算,增加了新的INT8和INT4精度模式,FP16半精度也能夠被完整支援通常會用到矩陣融合乘加(FMA)運算,新的INT8精度模式的工作速率是此速率的兩倍,張量核心為矩陣運算提供了顯著的加速,除了新的神經圖形功能外,還用於深度學習訓練和推理操作。
- NGX (Neural Graphics Acceleration)框架: 利用張量核心,在遊戲中實現深度學習功能,GeForce Experience會自動匹配Turing顯卡並且下載可用的NGX Core軟件包,對應如DLSS、AI InPainting、AI Super Rez、AI Slow-Mo等功能。
- DLSS (深度學習超級採樣) : 反鋸齒技術,利用張量核心實現在較低的輸入樣本數下更快地渲染,具有與64×超級採樣畫面相同品質的細節,還可以避免TAA產生的運動模糊等問題,相比TAA等其它反鋸齒技術,渲染能力得到大幅提升。
- AI InPainting : 算法利用大量真實世界圖像的訓練,可以補全圖片中缺失的內容,也可以移除照片的噪點、失真部分以及增強照片的清晰度等功能。
- AI Super Rez : 將原影片的解析度清晰地放大2倍、4倍、8倍,圖像更加銳利。
- AI Slow-Mo : 將普通常見的30fps進行智慧補幀計算,可以獲得240/480fps的慢動作影片,而不需要專門高幀率攝影機。
- RT Core : 專門為光線追踪計算,是一條特異化的專用流水線,用於加速計算邊界體積層次(BVH)遍歷以及光線和三角求交(光線投射)。
- GDDR6顯示記憶體的支援
- 附有影像串流壓縮技術(Display Stream Compression,DSC)1.2版的DisplayPort 1.4a
- 功能集PureVideo的硬體加速視訊解碼
- NVLink連接器(與伏打微架構的不相容)
- VirtualLink VR
- GPU Boost 4[8]
設計
RTX是GeForce 20系列引入的开发平台。RTX的光线追踪示范程序中使用了微软的DXR,OptiX和Vulkan来进行光线追踪。[9]
芯片规格
型號
|
推出日期
|
核心 代號
|
製程 (nm)
|
晶体管數 & 晶粒面積
|
核心配置
|
時脈頻率
|
填充率
|
顯示記憶體
|
運算性能 (TFLOPS)
|
每秒 光線數 (十億)
|
匯流排 介面
|
TDP (W)
|
NVLink 支援
|
發售價格(美金)
|
核心組態 SPs:TMUs:ROPs[a]
|
光追 核心
|
張量 核心
|
二級 暫存 (MB)
|
預設 (MHz)
|
加速 (MHz)
|
記憶體 (MT/s)
|
像素 (GP/s)
|
材質 (GT/s)
|
容量 (GB)
|
頻寬 (GB/s)
|
類型
|
介面 頻寬 (位元)
|
單精度 (加速)
|
雙精度 (加速)
|
半精度 (加速)
|
張量 浮點
|
零售版
|
創始版
|
GeForce RTX 2060
|
2019年 1月15日
|
TU106- 200A- KA-A1
|
12
|
108億 445mm2
|
1920:120:48 (30 SM)
|
30
|
240
|
3
|
1365
|
1680
|
14000
|
65.52
|
163.8
|
6
|
336
|
GDDR6
|
192
|
5.24 (6.45)
|
0.16 (0.20)
|
10.5 (12.9)
|
51.6
|
5
|
PCIe 3.0 x16
|
160
|
否
|
$349
|
GeForce RTX 2060 TU104
|
2020年 1月10日
|
TU104- 150-KC- A1
|
136億 545mm2
|
$300
|
GeForce RTX 2060 Super
|
2019年 7月9日
|
TU106- 410- A1
|
108億 445mm2
|
2176:136:64 (34 SM)
|
34
|
272
|
4
|
1470
|
1650
|
90.5
|
191.4
|
8
|
448
|
256
|
6.12 (7.18)
|
0.19 (0.22)
|
12.2 (14.4)
|
57.4
|
6
|
175
|
$399
|
GeForce RTX 2070
|
2018年 10月17日
|
TU106- 400-A1
|
2304:144:64 (36 SM)
|
36
|
288
|
1410
|
1620
|
90.24
|
203.04
|
6.50 (7.47)
|
0.20 (0.23)
|
12.3 (14.9)
|
59.7
|
$499
|
不適用
|
TU106- 400A-A1
|
1620+
|
$499+
|
$599
|
GeForce RTX 2070 Super
|
2019年 7月9日
|
TU104- 410-A1
|
136億 545mm2
|
2560:160:64 (40 SM)
|
40
|
320
|
1605
|
1770
|
102.72
|
256.8
|
8.22 (9.06)
|
0.26 (0.28)
|
16.4 (18.1)
|
72.5
|
7
|
215
|
2路 NVLink
|
$499
|
GeForce RTX 2080
|
2018年 9月20日
|
TU104- 400-A1
|
2944:184:64 (46 SM)
|
46
|
368
|
1515
|
1710
|
96.96
|
278.76
|
8.92 (10.1)
|
0.28 (0.32)
|
17.8 (20.1)
|
80.5
|
8
|
$699
|
不適用
|
TU104- 400A-A1
|
1710+
|
$699+
|
$799
|
GeForce RTX 2080 Super
|
2019年 7月23日
|
TU104- 450-A1
|
3072:192:64 (48 SM)
|
48
|
384
|
1650
|
1815
|
15500
|
105.6
|
316.8
|
496
|
10.1 (11.2)
|
0.32 (0.35)
|
20.3 (22.3)
|
89.2
|
250
|
$699
|
GeForce RTX 2080 Ti
|
2018年 9月27日
|
TU102- 300-K1- A1
|
186億 754mm2
|
4352:272:88 (68 SM)
|
68
|
544
|
5.5
|
1350
|
1545
|
14000
|
118.8
|
367.2
|
11
|
616
|
352
|
11.8 (13.4)
|
0.37 (0.42)
|
23.5 (26.9)
|
107.6
|
10
|
$999
|
不適用
|
TU102- 300A-K1- A1
|
1545+
|
$999+
|
$1,199
|
NVIDIA Titan RTX
|
2018年 12月18日
|
TU102- 400-A1
|
4608:288:96 (72 SM)
|
72
|
576
|
6
|
1770
|
129.6
|
388.8
|
24
|
672
|
384
|
12.4 (16.3)
|
0.39 (0.51)
|
24.9 (32.6)
|
130.5
|
11
|
280
|
$2,499
|
另见
參見
扩展链接