ATI Radeon HD 4000 系列,其显示核心代号Radeon R700 ,由AMD (ATI )研发并推出。Radeon HD 4000系列的第一款產品是RV770顯示核心 ,採用此晶片的顯示卡 名為Radeon HD 4850,有800個流處理器。而核心頻率更高的HD 4870及HD 4890緊隨其後,更率先採用GDDR5 作為顯示記憶體。最高端顯示卡採用R700核心,是一款雙晶片顯示卡產品,名為HD 4870 X2。
背景
與之前的系列不同,首發的Radeon R700 顯示卡只是中端產品。這與AMD 調整策略有關。過往,AMD往往在高端市場落後於NVIDIA 。此次,AMD在中端市場主動出擊,原因是該市場佔用家群一個較大的比例,利潤亦會較高。而對手NVIDIA方面,雖然推出了性能比較強的GTX 200系列顯示卡,但性價比 明顯比R700不足。以往的顯示卡 開發,是先研製旗艦級產品,再將此功能削減,成為中端和低端顯示卡。面對著顯示核心的架構愈來愈複雜,研發的成本和時間亦愈來愈高。另外,高端產品的市場比較細,產品往往只是技術的演示。而ATI 在過往與NVIDIA 競爭的過程中,經常錯過適當的發佈時間,不只輸掉高端市場,亦減慢了中低端顯示卡的發佈。
在AMD收購ATI後,市場策略亦開始調整。今次,公司只會研發針對主流市場的顯示卡,高端顯示卡則由雙核心顯示卡補上,例如Radeon HD 4870 X2。
架構
整體的架構與上一代相約,但作出了多方面的微調。與上一代顯示卡系列一樣,支援DirectX 10.1及Shader Model 4.1。RV770核心有9.56億個電晶體 ,採用55 nm 製程製造。
SIMD(Single Instruction Multiple Data)
同樣是SIMD架構,核心擁有多個SIMD核心。每一個SIMD核心有16個流處理器、獨立的纹理单元和L1快取。
由於取消了共用快取,各核心可以透過Global DataShare Unit互相溝通。而每個流處理器有5個ALU ,換言之一個SIMD核心有80個ALU 。與上一代不同,本次所有的ALU單元都可以作整數位元運算,可大大提升GPGPU應用的效能。RV770顯示核心有10個SIMD核心,合共擁有800個流處理器。
流處理器(Stream Processing Unit)
RV770顯示核心擁有800個流處理器,是上一代RV670的2.5倍。流處理器的結構並沒有任何改變,只是數量上有所上升。每個流處理器有5個ALU ,所有的ALU單元都可以作整數位元運算。流處理器的架構依然是4D+1D的結構,相對NVIDIA的全1D結構,雖然效率沒有那麼高,但架構簡單,可以輕易提升流處理器的數量。AMD方面,每一個流處理器內的5個ALU會共用一個指令发射端口;NVIDIA方面,一個ALU需要獨立的端口,難以有效提升流處理器的數量。
纹理单元(Texture Unit)
每一個SIMD核心都擁有1組纹理单元,換言之RV770擁有10組纹理单元。每組纹理单元內有4个纹理寻址单元,16个32位元浮点纹理采样单元和4个纹理过滤单元。
快取(Cache)
上一代的顯示核心,快取 (Cache)是被所有的SIMD核心共享的。在R700顯示核心中,每一個SIMD核心都擁有獨立的Cache。這樣做可以降低延遲,提高效率。上一代SIMD可透過共用快取互相溝通,由於採用了獨立快取,所以AMD為每一個核心加裝了Global DataShare Unit,作SIMD互相溝通之用。
片內互聯
AMD放棄了Ring Bus架構鏈接顯示記憶體 ,改用回傳統的Crossbar架構。因為縱使Ring Bus架構的結構簡單且可以優化,但延遲率高,亦要用更多的電晶體。最重要的是R600顯示Ring Bus架構對效能的幫助不明顯,
記憶體
RV770的記憶體頻寬 是256-bit ,但使用GDDR5 的話仍可以保持高速率。
光栅单元(Render Back-Ends)
AMD重新設計了光栅单元,用來改善AA性能。亦取消了針對透明及霧化效果的運算單元。而AA算法仍然會交由Shader處理,憑著流處理器的數量是上一代的2.5倍,AA的性能亦有所提升。
CrossFire Sideport
R700的GPU互聯架構
這一代的雙顯示核心設計仍使用PCI Express橋接晶片。此次使用的是PLX 出品,功耗為3.8瓦的PEX 8647晶片,這塊晶片支援PCIe 2.0,允許兩顆GPU運作在相同的PCIe插槽但擁有兩倍於前代產品(Radeon HD 3870 X2)的頻寬。但AMD在此代顯示核心上還內建了一個新的「CrossFire X Sideport」,用來協調多個顯示核心之間的通訊[ 1] ,提供額外5GB/s且全雙工的GPU間資料傳送頻寬,增進圖形效能。如此一來兩個GPU間的總頻寬達到了21.8GB/s。籍此AMD利用兩顆顯示核心,組成一張顯示卡,用作對抗NVIDIA的高端產品。所以增加CrossFire的效能和效率就變得重要。在這一點上,CrossFire X Sideport內聯器從未被啟用,在任何支援CrossFire的驅動程式上。
UVD2(Unified Video Decoder 2 )
相對第一代的UVD ,UVD2可以解碼更高码率和分辨率的影片。另外,與NVIDIA的新PureVideo 一樣,可以支援兩段影片同時解碼,方便提供畫中畫功能。新增Dynamic Contrast技術,用來提升影片的光暗對比。另外,顯示核心依然集成了音效卡,支援聲道由5.1升級到7.1,支援AC3 和DTS ,亦追加對LPCM 的支援。
Radeon HD 4550/4350會支援UVD 2.2。[ 2] 提高對高清影片格式的兼容性,支援新一代的影像輸出。
AVT(Accelerated Video Transcoding)
利用AVT技術,使用者可以利用R700顯示核心,編碼1080p的高清影片,這相當於GPGPU的一種應用。
其他技術
GPGPU
AMD選擇了開放標準,例如苹果電腦推廣的OpenCL ,以至DirectX ,或者AMD自家的Brook + 。AMD認為NVIDIA的CUDA 是閉源標準,最终都会失败。
物理引擎
AMD宣佈与Havok 合作共同优化在AMD四核心处理器下的游戏物理运算的表现,并表示会共同研究将来让顯示卡 支援Havok 物理引擎。有第三開發者聲稱,PhysX 物理引擎可以在R700核心上實現。而NVIDIA就盡全力幫助那一位程式員,讓R700核心支持CUDA 技術,藉此讓核心支援PhysX 物理引擎。[ 3]
GDDR5
Radeon HD 4870將會利用GDDR5 作為顯示記憶體,是業界首次採用GDDR5裝備顯示卡。相對而言,NVIDIA就顯得比較保守,只採用GDDR3記憶體,但可以保證產品發佈順利,亦提供足夠的頻寬。對上一次,ATI亦率先採用GDDR4作為X1950 XTX顯示卡的記憶體,但由於頻率提升有限,並未能為新產品提供更大的頻寬。而GDDR5的頻寬更大,功耗更低,亦符合AMD對節能的要求。
但由於GDDR5始終是新技術,所以開始的時候不能大量上市,亦耽誤了HD 4870顯示卡的發佈。而AMD放棄了Ring Bus記憶體架構,採用GDDR5記憶體是迫不得已的做法。
PowerPlay
這是一個電源管理技術,RV670將它首次引入到桌面市場中。而在R700顯示核心中,有關的技術亦得到升級。例如,顯示核心可以自行關閉不在工作中的處理單元,亦可以調整核心的電壓和頻率。顯示記憶體方面,就只有頻率可以調整。
產品
Radeon HD 4800
最先推出的是Radeon HD 4850顯示卡,於2008年6月25日推出,目標是中端市場,擁有800个流处理器,採用GDDR3顯示記憶體。比較高端的Radeon HD 4870 亦在其後推出,除核心頻率有所提升,更採用GDDR5 顯示記憶體 。另外,由於RV770的核心頻率還有提升的空間,預計有廠商會推出超頻版本的RV770顯示卡,用來與GTX 280顯示卡競爭。
旗艦型號Radeon HD 4870 X2已於2008年8月12日推出,採用雙顯示核心設計,對手是NVIDIA的GeForce GTX 280,而實際效能比NVIDIA Geforce GTX 280顯示卡更強,後來NVIDIA推出GeForce GTX 295方能戰勝之。顯示核心亦集成了CrossFire Sideport元件,兩個顯示核心可以雙向5GB/s的頻寬互相連結。[ 4] 橋接晶片方面,採用了PEX8647,支援PCI-E 2.0。[ 5]
這個系列最低端的是Radeon HD 4830,它有640個流處理器,對手是GeForce 9800 GT。[ 6]
AMD於2009年4月2日(原為4月6日,之後推遲到9日,最後由於產品提早在3月底發售,所以正式的官方發佈時間定為4月2日)[ 7] 推出使用RV790核心的Radeon HD 4890,規格與Radeon HD 4870相似,但運作頻率更高。對手是NVIDIA 的GeForce GTX 275。RV790核心並不是單純的RV770核心超頻版本,還額外增加了300万个晶体管[ 8] 。
AMD於中國內地市場推出Radeon HD 4860,使用RV790核心,只擁有640個流處理器,採用512MB GDDR5顯示記憶體,由於以高時脈運作,所以效能與Radeon HD 4870接近。
Radeon HD 4700
ATI Radeon HD 4770顯示卡
Radeon HD 4770於2009年4月 推出,使用AMD首款40nm繪圖核心RV740,擁有640個流處理器,128bit顯示記憶體介面,但採用GDDR5 顯示記憶體,以免記憶體頻宽不足。核心時脈750MHz,記憶體時脈3200MHz。效能較Radeon HD 4830優勝,部份測試成績甚至與Radeon HD 4850相近。由於需求高加上台積電 的40nm晶片前期生產良率欠佳,造成市面上長期缺貨,相同級別需要由Radeon HD 4850降價接替。本產品可視為半年後推出的Radeon HD 5000系列的實驗品。
Radeon HD 4600
Radeon HD 4670 - 核心頻率為750MHZ,採用GDDR3顯示記憶體,頻率為1800MHz(容量是512/1024 MB)。核心擁有320个流处理器,但顯示記憶體頻宽仅有128bit,规格参数与HD3850 128-bit(HD3690)相似[ 9] 。
Radeon HD 4650 - 核心頻率比4670慢,採用GDDR2顯示記憶體。
Radeon HD 4550
ATI Radeon HD 4550顯示卡
Radeon HD 4550 - 有80個流處理器,採用GDDR3顯示記憶體,頻寬只有64-bit。
Radeon HD 4350
Radeon HD 4350 - 與HD 4550同樣有80個流處理器,但只採用GDDR2顯示記憶體。對手是GeForce 9400 GT。
FireStream 9000
GPGPU產品方面,AMD會推出基於RV770核心的FireStream 9250。它支援雙精度和64位元浮點運算。
顯示核心規格列表
桌上型
獨立顯示核心
型號
發布日期
開發代號
製程 (nm )
電晶體數量 (百萬)
晶片面積 (mm2 )
匯流排 介面
顯示記憶體容量 (MiB )
時鐘頻率
核心佈置
填充率
顯示記憶體類型
運算效能 GFLOPS
熱設計功耗 (W)
GFLOPS/W 單精度浮點 運算能效
API 支援 (版本)
發售價格 (美元)
核心 (MHz )
記憶體 (MHz )
像素 (GP /s)
材質 (GT /s)
記憶體頻寬 (GB /s)
匯流排類型
記憶體位寬 (位元 )
單精度浮點數
雙精度浮點數
空載
滿載
DirectX
OpenGL
OpenCL
Radeon HD 4350
2008年9月30日
RV710
55
242
73
PCIe 2.0 x16 PCIe 2.0 x1 AGP 8x
256 512 1024
575
500
80:8:4
2.3
4.6
6.4
DDR2
64
92
否
20
4.6
10.1
3.3
1.0
?
Radeon HD 4550
2008年9月30日
RV710
55
242
73
PCIe 2.0 x16
256 512 1024
600 600
600 800
80:8:4
2.4
4.8
6.4 12.8
DDR2 GDDR3
64
96
否
25
3.84
10.1
3.3
1.0
?
Radeon HD 4650
2008年9月10日
RV730 PRO
55
514
146
PCIe 2.0 x16 AGP 8x
256 512 1024
600 650
400-500 500 700
320:32:8
4.8 5.2
19.2 20.8
12.8-16.0 16.0 22.4
DDR2 GDDR3 GDDR4
64 128
384 416
否
48
8.0 8.7
10.1
3.3
1.0
?
Radeon HD 4670
2008年9月10日
RV730 XT
55
514
146
PCIe 2.0 x16 AGP 8x
512 1024
750 750
400-500 900 1000
320:32:8
6.0
24.0
12.8-16.0 28.8 32.0
DDR2 GDDR3 GDDR4
128
480
否
59
8.14
10.1
3.3
1.0
?
Radeon HD 4730
2009年6月8日
RV770 CE
55
956
256
PCIe 2.0 x16
512
700 750
900 900
640:32:8
5.6 6.0
22.4 24.0
28.8
GDDR3
128
896 960
179.2 192
110
8.15
10.1
3.3
1.0
?
Radeon HD 4770
2009年4月28日
RV740
40
826
137
PCIe 2.0 x16
512
750
800
640:32:16
12
24
51.2
GDDR5
128
960
192
80
12
10.1
3.3
1.0
?
Radeon HD 4830
2008年10月21日
RV770 LE
55
956
256
PCIe 2.0 x16
512 1024
575
900
640:32:16
9.2
18.4
57.6
GDDR3 GDDR4
256
736
147.2
95
7.75
10.1
3.3
1.0
?
Radeon HD 4850
2008年6月25日
RV770 PRO
55
956
256
PCIe 2.0 x16
512 1024 2048
625
993
800:40:16
10
25
63.55
GDDR3 GDDR4
256
1000
200
110
9.09
10.1
3.3
1.0
?
Radeon HD 4860
2009年9月9日
RV790 GT
55
959
282
PCIe 2.0 x16
512 1024
700
750
640:32:16
11.2
22.4
96
GDDR5
256
896
179.2
130
6.89
10.1
3.3
1.0
?
Radeon HD 4870
2008年6月25日
RV770 XT
55
956
256
PCIe 2.0 x16
512 1024 2048
750
900
800:40:16
12
30
115.2
GDDR5
256
1200
240
150
8
10.1
3.3
1.0
?
Radeon HD 4890
2009年4月2日
RV790 XT
55
959
282
PCIe 2.0 x16
1024 2048
850
975
800:40:16
13.6
34
124.8
GDDR5
256
1360
272
190
7.16
10.1
3.3
1.0
?
Radeon HD 4850 X2
2008年11月7日
R700
55
956x2
256x2
PCIe 2.0 x16
512x2 1024x2
625
993
800:40:16 ×2
2× 10
2× 25
2× 63.55
GDDR3
256x2
2000
400
250
8
10.1
3.3
1.0
?
Radeon HD 4870 X2
2008年8月12日
R700
55
956x2
256x2
PCIe 2.0 x16
1024x2
750
900
800:40:16 ×2
2× 12
2× 30
2× 115.2
GDDR5
256x2
2400
480
286
8.39
10.1
3.3
1.0
?
1 統一渲染單元 數量 : 紋理對映單元 數量 : 渲染輸出單元 數量
2 GDDR5 顯示記憶體 的資料傳送速率是其時鐘頻率的4倍,而非其它DDR記憶體的兩倍
3 熱設計功耗(TDP)數值來源於超微官方資料。不同廠商的非公版顯示卡電路板設計會使得實際TDP數值和官方資料的有所不同。
4 全部型號帶有UVD2、ATI PowerPlay功能
整合式顯示核心
這一列表是Radeon HD 4000中內建於AMD晶片組系列的型號,整合這些型號的晶片組有700系列 、800系列 以及900系列 (980G,實際是880G的更名版本)。這些型號全部支援DirectX 10.1以及OpenGL 3.3。
型號
發布日期
開發代號
圖形核心
製程 (nm )
電晶體數量 (百萬)
晶片面積 (mm2 )
匯流排 介面
記憶體容量3 (MiB )
核心時脈2 (MHz )
核心佈置1
填充率
顯示記憶體類型
運算效能 GFLOPS
特性/備註
像素 (GP /s)
材質 (GT /s)
FP32 (GP /s)
記憶體頻寬 (GB /s)
匯流排類型
有效時脈 (MHz )
記憶體位寬 (位元 )
Radeon HD 4200 Graphics (785G晶片組)
2009年8月
RS880
RV620
55
>205
~73 (~9 × 8.05)
HT 3.0
最高可從系統記憶體佔用512 + 可選的專用128(即板載顯存)
500
40:4:4
2
2
1
20.8 (系統記憶體) + 2.6 (專用)
HT (系統) + DDR2 -1066 DDR3 -1333 (專用)
1333 (專用)
16 (專用)
40
UVD2
Radeon HD 4250 Graphics (880G晶片組、980G晶片組)
2010年3月(880G)、2011年9月(980G)
RS880
560
2.24
2.24
1.12
HT (系統) + DDR3 -1333 (專用)
44.8
Radeon HD 4290 Graphics (890GX晶片組)
RS880D
最多佔用系統記憶體512 + 專用128
700
2.8
2.8
1.4
56
1 統一渲染單元 數量 : 紋理對映單元 數量 : 渲染輸出單元 數量
2 在ATI PowerPlay 節電技術生效時,核心時脈在不同的使用場合時會有所不同。這個列表列出的時脈數值是官方預設的時脈值參數3 整合顯示核心的專用記憶體採用特別的sideport匯流排,用作顯示記憶體
行動型顯示核心
這個列表除了獨立顯示核心以外,還包括整合於北橋晶片 內的整合式顯示核心。
型號[ 10]
發布日期
型號代號
開發代號
製程 (nm )
匯流排 介面
記憶體容量 (MiB )
時鐘頻率 (MHz )
記憶體時脈 (MHz )
核心佈置1
填充率
記憶體
API 相容性 (版本)
運算能力 GFLOPs
備註
像素 (GP /s)
材質 (GT/s)
頻寬 (GB /s)
匯流排類型
匯流排位寬 (位元 )
DirectX
OpenGL
Mobility Radeon HD 4200
2009年9月10日
未知
RV620
55
內建PCIe x16 1.1
可最多從系統記憶體中佔用512
500
800 (系統記憶體)
40:4:4
2
2
6.4/12.8
DDR2 DDR3
64/128
10.1
2.0
40
UVD 2, PowerPlay 7.0
Mobility Radeon HD 4225
2010年5月1日
未知
RV620
55
內建PCIe x16 1.1
可最多從系統記憶體中佔用512
380
800 (系統記憶體)
40:4:4
1.52
1.52
6.4/12.8
DDR2 DDR3
64/128
10.1
2.0
30.4
UVD 2, PowerPlay 7.0
Mobility Radeon HD 4250
2010年5月1日
未知
RV620
55
內建PCIe x16 1.1
可最多從系統記憶體中佔用512
500
800 (系統記憶體)
40:4:4
2
2
6.4/12.8
DDR2 DDR3
64/128
10.1
2.0
40
UVD 2, PowerPlay 7.0
Mobility Radeon HD 4270
2010年5月1日
未知
RV620
55
內建PCIe x16 1.1
可最多從系統記憶體中佔用512
590
800 (系統記憶體)
40:4:4
2.36
2.36
6.4/12.8
DDR2 DDR3
64/128
10.1
2.0
47.2
UVD 2, PowerPlay 7.0
Mobility Radeon HD 4330
2009年1月9日
M92
RV710
55
PCIe x16 2.0
512
450
600
80:8:4
1.8
3.6
9.6
DDR2 DDR3 GDDR3
64
10.1
3.3
72
UVD 2, PowerPlay 7.0
Mobility Radeon HD 4530
2009年1月9日
M92
RV710
55
PCIe x16 2.0
512
500
700
80:8:4
2
4
11.2
DDR2 DDR3 GDDR3
64
10.1
3.3
80
UVD 2, PowerPlay 7.0
Mobility Radeon HD 4550
2010年1月1日
M92
RV710
55
PCIe x16 2.0
512
550
700
80:8:4
2.2
4.4
11.2
DDR2 DDR3 GDDR3
64
10.1
3.3
80
UVD 2, PowerPlay 7.0
Mobility Radeon HD 4570
2009年1月9日
M92
RV710
55
PCIe x16 2.0
512
680
800
80:8:4
2.72
5.44
12.8
DDR2 DDR3 GDDR3
64
10.1
3.3
108.8
UVD 2, PowerPlay 7.0
Mobility Radeon HD 4650[ 11]
2009年1月9日
M96
RV730
55
PCIe x16 2.0
512 1024
500 550
600 800
320:32:8
4 4.4
16 17.6
19.2 25.6
DDR2 DDR3 GDDR3
128
10.1
3.3
320 352
UVD 2, PowerPlay 7.0
Mobility Radeon HD 4670[ 11]
2009年1月9日
M96-XT
RV730
55
PCIe x16 2.0
512 1024
675
800
320:32:8
5.4
21.6
12.8 25.6
DDR2 DDR3 GDDR3
128
10.1
3.3
432
UVD 2, PowerPlay 7.0
Mobility Radeon HD 4830[ 12]
2009年3月3日[ 13]
M97
RV740
40
PCIe x16 2.0
512 1024
400/600 400/600
800/900 800/900
640:32:16
6.4/9.6 6.4/9.6
12.8/19.2 12.8/19.2
25.6/28.8 25.6/28.8
GDDR3 DDR3
128
10.1
3.3
512/768 512/768
UVD 2, PowerPlay 7.0
Mobility Radeon HD 4850[ 14]
2009年1月9日
M98
RV770
55
PCIe x16 2.0
1024
500
850 700
800:40:16
8
20
54.4 89.6
GDDR3 GDDR5 2
256
10.1
3.3
800
UVD 2, PowerPlay 7.0
Mobility Radeon HD 4860[ 12]
2009年3月3日[ 13]
M97
RV740
40
PCIe x16 2.0
1024
650
1000
640:32:16
10.4
20.8
64.0
GDDR5 2
128
10.1
3.3
832
UVD 2, PowerPlay 7.0
Mobility Radeon HD 4870
2009年1月9日
M98-XT
RV770
55
PCIe x16 2.0
512 1024
550
888 700
800:40:16
8.8
22
56.832 89.6
GDDR3 GDDR5 2
256
10.1
3.3
880
UVD 2, PowerPlay 7.0
Mobility Radeon HD 4870 X2
2009年1月9日
M98-XT
RV770
55
PCIe x16 2.0
2048
550
700
2x [800:40:16]
2x 8.8
2x 22
2x 89.6
GDDR5 2
2x 256
10.1
3.3
2x 880
UVD 2, PowerPlay 7.0 雙GPU解決方案
1 統一渲染單元 數量 : 紋理對映單元 數量 : 渲染輸出單元 數量
2 GDDR5 顯示記憶體 的資料傳送速率是其時鐘頻率的4倍,而非其它DDR記憶體的兩倍
參考文獻
参见
外部連結