年度GPU架构回看,7000三大基本水源真实照片首度
分类:pc28.am

同样属于架构革新的2012

HotChips半导体大会上,AMD不仅介绍了Steamroller、Jaguar两大处理器架构的一些细节,还首次公开了GCN Radeon HD 7000系列显卡所用三大核心的内核照片,它们分别是Southern Island家族的Tahiti、Pitcairn、Cape Verde。

AMD发布新锐龙处理器的时间大概是在台北电脑展,而Navi显卡则有可能在两星期后的E3大展上,反正最近关于这两样东西的泄露不断,现在RX 3080的规格也泄露出来了。

经历了这么多年的GCN架构后,AMD终于在今年正式推出了全新的RDNA架构。作为聚合了AMD最新GPU架构思想的产物,RDNA就此横空出世,并将全新特性注入到大家翘首企盼的Radeon RX 5700 XT及Radeon RX 5700显卡中。而全新架构以及新特性的加持下的新显卡会为我们带来什么?在性能上AMD是否会突破自我?接下来会为各位正式揭晓。

过去的2012年里,无论是AMD还是NVIDIA都在图形架构技术层面上锐意进取,为我们带来了Compute Unit以及GPU Boost等等先进的技术,这些技术对于显卡产品的推动和促进作用是显著的。但对于我们以及整个业界来说,光有这些技术的进步还远远不够。

在过去几年中,AMD一直不肯公布此类照片,很大程度上是因为他们总是提前NVIDIA发布新产品,自然不想让对手很快就近距离看到自家GPU的设计图,外界自然也就无从得知AMD GPU的物理布局细节了。

图片 1

图片 2

如果孤立存在,即便再优秀再精妙的技术,也无法转变成任何对我们有益的结果。只有将这些技术系统的融合在一起,调整好彼此的关系并令其发挥最佳的效果,技术的进步才能为我们带来切实的好处。所以对技术融合在一起所形成的架构进行回顾,也就变得有意义了。

注意下边几张照片主要是给工程师、设计师等专业人士看的,不是拿来宣传的那种经过艺术加工的照片,因此看上去有些粗糙,但却是最真实的。

这消息是@KOMACHI_ENSAKA在推特上曝出来的,这款产品是中段Radeon显卡所用的,预计将与RTX 2070和RTX 2060相竞争,至于这款显卡的命名是啥其实没有定论的,不过为了便于说明暂时把它称作Navi 10核心和RX 3080显卡。

RX 5700 XT/5700全新显卡,全新规格

技术的进步带动了AMD及NVIDIA在GPU架构层面的进步,让2012年不仅是技术进步年,更是GPU架构进步年。先后出现的GCN和开普勒(Kepler)体系都是双方技术进步的集大成者,它们成功地将双方全部的技术进步转化成了产品性能的提升,但细化到架构内部,双方的表现却并不都是积极向好的。同样的甚至是彼此一一对应的各种先进技术所组成的Tahiti和开普勒,最终却并没有一起收获成功。

图片 3

图片 4

自从微软推出DirectX 10推出之后,GPU就从管线渲染架构进入统一渲染架构,GPU的设计也发生了非常大的改变。AMD在2012年推出了第一代的GCN架构,无论是在游戏性能上还是通用计算性能上都有了极大的提升。不过在之后等待我们的就一直是不停更新的GCN架构了。在2015年AMD推出了Fiji显卡,结合HBM高速显存及更多的CU单元让使得其成为一张现象级显卡,但HBM高昂的成本也拖累的AMD显卡的发展。不过到了2016年,AMD拿出了Polaris架构,14nm工艺的加成以及几何单元、渲染器效率的提升让GCN架构的效能提升巨大,不过AMD并没有拿Polaris架构推出顶级显卡,而是在2017年推出了Vega架构,配合改进的NCU以及HBM2显存,让显卡在计算性能上有了很大的提升。

胜利者从不缺乏赞美,赞美本身对胜利者以及旁观者都没有任何意义。只有找到导致问题的本源,并从由此探究更深层次的问题,我们才能明白图形界在过去的2012年里究竟经历了些什么。友站ZOL今天就带我们一览了2012年里出现在我们面前的所有图形架构,并揭示了决定AMD/NVIDIA架构之战结局的原因。

Tahiti:Radeon HD 7900系列核心,可以清楚地看到分列左右的每一组CU,下方的逻辑控制单路(包括PCI-E控制器和UVD视频解码引擎等等),左右和上方的显存控制器单元、二级缓存。两个ACE应该在中间,但是ROP光栅单元实在找不出来。

Navi架构带来了全新的着色器引擎设计,以提高计算单元的利用率和更高的像素吞吐量,Navi 10芯片拥有40个CU单元,每单元拥有64个流处理器,也就是一共2560个流处理器,比现在的Vega 64与56都要少,根据此前的消息这个核心拥有8个着色引擎,这些引擎每个包含5个CU单元和一个光栅后端,现有的GCN架构中每个光栅后端包含16个ROP,现在不清楚Navi 10是否会有128个ROP,或者AMD已经减少了Navi架构每个光栅后端的ROP数量。

但较长时间使用GCN架构让AMD在显卡架构上已经显现出疲态了,AMD的新显卡需要一款全新的架构以应对未来通用计算、图形的挑战。等待了这么久后,AMD终于在今年推出了采用全新的RDNA架构。正式宣告了GCN架构“连载”完结,AMD GPU的新时代正式开启,采用RNDA架构的Radeon RX 5700系列显卡也同时推出。

图片 5

图片 6

实际上着色器引擎数量是Navi架构的一个重要细节,因为此前AMD的GCN架构一直无法突破4个着色器引擎,这也导致大型GPU的流处理器利用率不足,这也是目前以来GCN架构的最大限制。

以下为两款新显卡与RX Vega显卡的规格对比表:

令人眼前一亮的Tahiti

Pitcarin:Radeon HD 7800/7900M系列核心,看起来很像Tahiti,只不过小了一号,计算单元、显存控制器都更少了。

如果这个问题解决了,AMD就能提升大型GPU的流处理器利用率问题,并且我们可能会看到有超过4096个留处理器的GPU的诞生,此外ROP数量也有可能超过64个,从而提升高分辨率的吞吐量,这也是此前AMD的大GPU的另一个限制。

[此处---规格表开始]

AMD从2011年年中便曝光了全新一代的GCNGraphic Core Next)架构体系,其后陆续到来的Tahiti、Pitcairn以及Cape Verde均基于该体系。GCN的整个信息披露过程相当系统和全面。按照AMD公布的信息,GCN将会带来大量革命性的技术革新,几乎将先前AMD GPU架构的各种问题一扫而空。在这些新技术情报带来的希望中,人们迎来了GCN的首款核心——Tahiti。

图片 7

根据此前曝光的Navi显卡PCB照片,我们可以知道它拥有256位的现存位宽,并使用GDDR6显存,PCB上只有单面显存设计,所以显存容量应该是8GB,不排除会出有16GB显存的专业版的可能性。

[此处---规格表结束]

图片 8
GCN的Tahiti架构打开了2012显卡架构年的大门

Cape Verde:Radeon HD 7700/7800M系列核心,是南岛家族中的小兄弟,不但计算单元、显存控制器(上方和左侧的两个亮绿色区域)进一步削减,ACE也只剩下了一个。

Radeon RX 5700系列显卡采用的Navi 10核心采用了与Radeon Ⅶ相同的7nm工艺制造。新工艺使得Radeon RX 5700系列显卡的核心面积仅为251平方毫米,同时对比此前的Radeon RX Vega 64/56的486平方毫米,尺寸大幅下降了48%。而与采用Polaris 30核心的Radeon RX 590显卡对比,在核心面积增加不多的情况下,晶体管数量也从57亿增加到了103亿。可见新工艺为Radeon RX 5700系列显卡提供了强大助力。

Tahiti是GCN体系的旗舰级核心,拥有超过43亿的晶体管规模。与上代的Cayman构架相比,其运算资源总量提升到了2048个流处理器,纹理拾取和载入与存储单元则提升至恐怖的512个,纹理过滤单元由Cayman的96个增加到了128个,但同时构成后端的ROP光栅单元与Cayman维持相同,均为32个。HD7970拥有全新设计的MC结构,6个64bit双通道显存控制器组合形成了全新的384bit显存控制单元,HD7970也因此采用了容量达3072MB的显存体系。

由于全新RDNA架构的使用,虽然RX 5700系列显卡的CU计算单元数量与RX 590相差不大,甚至要少于两款RX Vega显卡,但抛开全新PCI-E 4.0控制器等电路,从计算单元数量上就能看出AMD对RDNA架构带来的效率提升的信心。

图片 9
Tahiti构架特性

这次AMD的两款Radeon RX 5700显卡都采用的是Navi 10核心,不过在具体规格上还是有一些区别的。

Tahiti架构的特色由五个主要的部分组成:

图片 10

1、基于HKMG的台积电新28nm工艺。

Radeon RX 5700 XT作为目前RDNA架构性能最强的型号,其采用的Navi 10核心拥有完整的40组CU计算单元。从架构图中可以看出AMD将40组CU单元分为4组,每组中有10个CU计算单元,同时每两组CU单元组成一个Dual Compute Unit。RX 5700 XT也拥有160个纹理单元,还有60个光栅单元。

2、包含了几何引擎、光栅化引擎以及一级线程管理机制的前端ACE Asynchronous Compute Engine)。

与Radeon RX 5700 XT的40组CU相比,Radeon RX 5700只有36组,同时纹理单元也要少16个,其刚好少了4组CU,由于每组CU计算单元中有4个纹理单元,所以Radeon RX 5700刚好少4组CU,同时少了16个纹理单元。最终使得RX 5700在规格上要略低于RX 5700 XT。

3、负责处理运算任务及Pixel Shader的32个CUCompute Unit)集群,包含在CU内部负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,二级线程管理机制以及与它们对应的shared unified cache等缓冲体系。

除此以外,两款Radeon RX 5700系列显卡也有其他的区别。在核心频率方面,RX 5700 XT要更高一些,基础频率为1605MHz,峰值频率达到了1905MHz。而RX 5700的核心频率为1465MHz,峰值频率为1725MHz。简单计算可以发现,此次RX 5700系列显卡的Boost频率相比基础频率更大,达到了300MHz左右,比此前的RX 590仅有不到100MHz的Boost频率明显要强很多,不过对比两款RX Vega显卡稍稍低了一些。

4、负责完成fillrate过程以及输出最终画面的ROP阵列,显存控制器MCMemory Controller)以及PCI-Express3.0总线传输控制端。

除了这两个频率外,AMD还为此次的RX 5700系列显卡的添加了游戏频率,不过这个频率相比显卡的Boost频率保守一些,RX 5700 XT显卡设置为1755MHz,RX 5700显卡设置为1625MHz。

5、负责视频回放及处理的UVD3.0单元,以及全新的负责视频编码部分的VCE。

在显存方面,此次AMD为RDNA架构的两款显卡都搭载了全新的GDDR6显存,这也是AMD首次采用GDDR6显存。相比于AMD此前在RX Vega 64/56中使用的8GB HBM2显存,GDDR6显存由于采用了如16bit预取宽度、改进版QDR 4倍数据倍率等技术,使得相比其上代的GDDR5性能有了大幅提升,所以此次RX 5700系列采用了GDDR6显存,相比RX 590等采用的GDDR5显存性能提升非常大,与Vega 64/56采用的8GB HBM2显存对比也不落下风,带宽达到了448GB/s。同时相比于HBM2显存的高价格,GDDR6显存也可以让AMD有效控制显卡整体成本。

图片 11
HD7970构架

最终落实到具体计算性能上,此次RX 5700 XT的单精度浮点性能为9.75 TFLOPS,RX 5700的单精度浮点性能为7.9 TFLOPS,相比Vega 64/56要落后一些。不过相较于Vega 64/56的486平方毫米的大核心,RX 5700XT仅凭借251平方毫米达到了接近10TFLOPS的性能,实际每平方毫米性能确实提升巨大。

相对于前代的Cayman构架,Tahiti构架有了诸多触及灵魂深处的改动。它改进了Cayman的双前端并行体系,用更加灵活且效率更高的CU单元替代了强调吞吐但在效率层面显得“笨重”的VLIW Core,首次引入完善的Unified Cache并大幅改进了过往架构带有明显缺陷的缓冲体系,进一步强化了任务管理、仲裁机制以及架构的几何处理能力。

功耗方面,7nm工艺的加持外加更高能效比的RDNA架构,使得其能够在功耗表现上要比之前的Vega系列显卡出色很多,RX 5700 XT TDP功耗为225W,而RX 5700 TDP功耗甚至在200W以下,为185W。

Tahiti所做出的一系列改进不仅明快而且目的性强烈,它扭转了AMD“以吞吐换延迟”的错误GPU架构方向,补完了先前架构的种种缺失并一扫AMD传统GPU架构笨拙且低效的痼疾,非常积极地迎合了DirectX 11对运算灵活度和效率的要求,将整个架构的运算和动作效率提升到了全新的高度,更为AMD通往通用计算等先进应用领域打下了基础。

视频接口AMD也追随大潮,放弃了DVI接口,RX 5700系列显卡采用了3个DisplayPort 1.4及1个HDMI 2.0b接口。其中HDMI接口支持4K显示,而这个DisplayPort 1.4接口则最高支持8K分辨率,同时也提供了DSC(Display Stream Compression,显示流压缩)技术,这项技术通过一种压缩比达到3:1的“视觉无损”的编码技术,可以输出高分辨率HDR视频。

过去的2012年里,无论是AMD还是NVIDIA都在图形架构技术层面上锐意进取,为我们带来了Compute Unit以及GPU Boost等等先进...

RDNA架构解析全新计算单元:提高能效比的基石

本次Radeon RX 5700系列显卡最显著的改进就是采用了全新的RDNA架构,不同于此前AMD不断改进的GCN架构,此次AMD推出的全新架构对比之前的架构,在绝对性能、能效比等方面都要全方位胜过GCN架构。作为AMD下一代游戏GPU架构,从计算单元开始革新,为RX 5700系列显卡搭建实现高性能的基石。

图片 12

而在设计RDNA架构时,AMD聚焦于三点:全新的计算单元设计、多级缓存架构以及改进的流式图形管道。这三者让RDNA架构再次提高运算效率,让其相比GCN有了更大的提升。

图片 13

在具体的CU单元上,Navi 10拥有40组RDNA CU计算单元,共有80个标量处理器,2560个流处理器以及160个64bit双线性过滤单元。

图片 14

AMD对CU计算单元本身的改进堪称巨大。从ATI时代开始GPU向着GPGPU可编程的时代进军,到GCN架构已经可以做到统一的标量及矢量运算,通用计算性能已大幅提升。AMD在推出GCN架构这么多年后,RDNA架构在通用计算方面进一步提升,能够让全新的CU计算单元在数据运算时更加灵活。

图片 15

具体到单个CU单元,相比GCN架构中采用的4个SIMD16矢量单元,4个SIMD4特殊功能单元及1路共享标量解码单元、1路矢量解码单元、256KB的VGPR。

而在RDNA架构中,在GCN中较为复杂的CU设计变成了2个SIMD32单元,2个SIMD8特殊功能单元及2路标量解码单元、2路矢量解码单元,256KB VGPR。新架构解码更宽,并且提高了SIMD执行单元的位数,同时从架构图中看RDNA架构可以在一个周期内完成操作数聚集,相比GCN架构的4周期要强很多。

图片 16

在实际的指令执行中,由于GCN架构的SIMD单元配置,一条Wave64指令需要拆分成4条SIMD 16指令执行,这样就需要4个时钟周期才能完成一条指令。

图片 17

对于RDNA的CU架构来说,其Wave32/64双模式可以同时运行两条不同的Wave32指令或一条Wave64指令,减少了运行指令的时钟周期,增强了CU单元运行效率。

图片 18

图片 19

除此以外AMD也在RDNA架构的CU单元中提供了两倍于GCN架构的ALU单元及4倍的缓存带宽。所以当我们看前面的规格表时,RX 5700系列显卡拥有40/36组CU,而RX Vega显卡拥有64/60组NCU,却在计算性能上并没有落后很多的原因。

图片 20

一款GPU除了基础的运算单元架构外,缓存架构也很重要。AMD在由两组CU单元组成的Dual Compute Unit中添加了L0级缓存,全新设计的L1缓存及减少拥塞的L2缓存,让RDNA架构提升了缓存带宽、减少了缓存的延迟及功耗。

图片 21

此次RDNA采用了4MB二级缓存,512KB的一级缓存以及V%、I$、K$的L0缓存。其中V$缓存拥有两倍载入带宽。而且本次AMD也将在主机平台使用过的DCC(Delta Color Compression,三角形颜色压缩)技术进行了改进,引入全新的RDNA架构中,通过将贴图材质中的色彩数据压缩,在图形渲染时由GPU进行解压,从而极大地节省了内存带宽。

图片 22

图片 23

作为“Next Generation of Gaming Architect”,AMD也改进了图形管道。AMD提供了4个增强的异步计算引擎、中央的几何处理器拥有四个Prim Unit,统一地处理顶点复用、曲面细分等任务。六十四个像素单元让图形处理速度更快。

AMD采用了新的几何引擎、六十四个像素单元、4个异步计算引擎以及均衡负载分发及重分发引擎,而这一切让AMD实现了高频低功耗的图形管道设计。

图片 24

图片 25

图片 26

这一系列革新让采用RDNA架构的Navi GPU相比Vega GPU绝对性能提升了14%,功耗下降了23%,单位核心面积性能提高了2.3倍。相比GCN架构有了全面的改进,继GCN架构后大幅提升GPU计算单元性能,同时改进图形管道增强图形处理能力,最终得到了一个高效且非常灵活的GPU架构。

PCI-E 4.0:面向未来更高带宽需求应用

在经历了这么多年的发展,PCI-E总线也经历了大跨越的发展,从最初的PCI-E 1.0到目前普及率最高的的PCI-E 3.0,越来越多的高速设备通过这个接口传输数据。PCI-E 4.0规范早在2017年正式公布,只从规范发布到具体产品需要一些时间。在经过了一年多的研发后,采用PCI-E 4.0规范的设备终于面世,其中AMD就是积极参与的个中代表。在采用RDNA架构的Navi显卡中,AMD也将PCI-E 4.0技术带入其中。

图片 27

图片 28

PCI-E 4.0 16GT/s的信号速率相比PCI-E 3.0提高了一倍,这也意味着带宽翻倍,传输性能更强。显然AMD将其用在Radeon RX 5700系列显卡上更有超前现有产品的意味。更高的带宽意味着新显卡在超高分辨率视频回放等需要极高带宽的场景下很有优势,在AMD的测试中通过DAVINCI RESOLVE 16回放ProRES 4×4 8K 60fps视频,采用RX 5700系列显卡可以满帧回放,而在PCI-E 3.0的带宽条件下,仅为36帧。所以对于未来需求的内容创作来说,PCI-E 4.0可以更好的满足严苛要求。

GDDR6:带宽更高,成本更低

在整个GCN架构时期,AMD在主流显卡中使用的都是GDDR5显存,从Fiji开始,AMD在高端显卡中使用了更先进的HBM显存。虽然HBM通过TSV硅穿孔技术进行芯片堆叠互联,让HBM显存拥有超高的带宽、功耗更低、而且与GPU同时封装,可以做出如Fury Nano这样的体积小巧但性能强大的显卡。

图片 29

但HBM也存在成本较高的问题,同时相比于老旧的GDDR5,GDDR6显存的高带宽也满足了现今高性能GPU的需求,所以对于主流级显卡来说,GDDR6显然是更好的选择。所以AMD在全新的Radeon RX 5700系列显卡中都采用了8GB的GDDR6显存,传输速率为14Gbps,带宽最高为448GB/s,相比RX Vega 64的484GB/s相差不多,但是比Vega 56的410GB/s要高一些。

Radeon Media Engine/Radeon Display Engine:超高清视频处理输出解决方案

随着超清视频的出现,使得显卡的视频输出能力要提高不少。在最新的RX 5700系列显卡中,AMD更新了Navi GPU中的Radeon Media Engine,紧随主流,为RX 5700XT以及RX 5700提供了三个DisplayPort 1.4接口及一个HDMI 2.0b端口,使其支持4K 120Hz、4K HDR 120Hz甚至8K HDR 60Hz。

图片 30

图片 31

近些年网络直播行业的兴起让串流也成为一些用户日常使用的功能。AMD早在很多年前就推出过UVD(Unified Video Decoder)及VCN(Video Core Next)技术,旨在加强GPU的视频编解码性能。而在采用RDNA架构的RX 5700系列显卡中,AMD将其升级为Radeon Media Engine,再次提高显卡的编解码能力。

Radeon Media Engine支持H.264编码的4K150/8K30串流解码,4K90的视频编码、H.265编码的4K60解码、4K90编码以及VP9编码的4K60解码能力。

Adrenalin驱动解析Radeon Imaging Sharpening:锐利画面更通用

AMD在Ploris之后推出了Adrenalin驱动,当然除了经常为显卡“打鸡血”外,AMD还时常为其添加很多实用的功能。而这次AMD再次为新驱动带来了多项新功能,Radeon Imagining Sharpening就是其中之一。

图片 32

早前多年前为了消除画面中的锯齿,从硬件开发商到游戏厂商都在想方设法解决这个问题,于是推出了如TAA、FXAA等抗锯齿技术。虽然这些技术让画面边缘更加平滑,但也不可避免的导致了边缘模糊。玩家现在已经可以通过更高的分辨率获得锐利的画面,不过通常降低分辨率会显著提高游戏运行帧率,很多玩家也会采取这样的方式,但这回影响到游戏的体验。

图片 33

所以AMD在2019版的Adrenalin驱动中添加了Radeon Imaging Sharpening功能,通过这个功能锐化画面、恢复游戏清晰度。而且AMD让这项技术更具普适性,可在DirectX 9、DirectX 12以及Vulkan图形API中使用,同时基于AMD的算法,RIS技术几乎可与所有抗锯齿技术合作,在保证效果的同时不会产生过度锐化产生的振铃效应。

Radeon Chill:智能动态调节功耗

显卡在渲染画面时几乎一直处于高负载运行,即使是在画面静止时显卡也一直以高帧率渲染画面,这这浪费了很多电能。所以AMD在软件层面添加了Radeon Chill功能,在画面静止时以低帧率渲染画面,当驱动监测到画面变化后,会迅速调用GPU重新以高帧率渲染画面,实现了流畅游戏与节能之间的平衡。

图片 34

而且为了进一步降低显卡功耗,Radeon Chill会主动在保持游戏流畅的同时降低运行帧数,从而达到降低功耗的目的。而这一切仅需玩家将这项功能打开即可。

同时无论玩家的显示器是否支持Free Sync,Radeon Chill功能都会显示器刷新率自动设置帧率目标,保证画面流畅顺滑。

Radeon Anti-Lag:优化调度,减少输入延迟

在我们玩游戏时,我们点击键鼠或手柄时向电脑输入操作指令,而电脑根据我们发送的指令来渲染游戏画面。从我们点击鼠标/键盘/手柄到显示画面的时间成为“输入延迟”。对于一些玩家尤其是电竞选手对降低输入延迟有着极高的需求。

图片 35

具体来说,显卡完成画面渲染需要CPU调用,CPU向显卡发送指令渲染游戏画面。所以在这种情况下,优化CPU调用效率、提高GPU负载就成为解决如数延迟的关键。而这也可以通过软件的指令调度优化。显卡与CPU之间的软件媒介是驱动,通过驱动对CPU指令调度GPU渲染进行优化,可以降低输入延迟,响应更快,提升体验。

AMD FidelityFX:简化游戏优化,带来更佳画质

大型游戏开发通常是一项大工程,需要在一定的时间内程序、美术、等多方面通力合作,所以在整个开发周期中可能会存在一些问题。不过由于各家厂商使用的游戏引擎不同,开发人员对游戏引擎的熟练度也会不同,所以游戏优化成为了一个大问题。所以GPU开发商会与游戏厂商进行合作,为游戏进行优化,增强游戏画面表现。

不过这项工作通常比较繁琐,需要花费很多精力。AMD为了帮助开发者提升游戏画面保真度,推出了FidelityFX SDK,帮助开发者提高游戏画质。

其中高对比度自适应锐化功能(Contrast Adaptive Sharpening,CAS)作为FidelityFX的一项技术,可以让原本由于抗锯齿技术导致的模糊画面更加锐利、对比度更高。同时自适应锐化功能还支持在动态分辨率的情况下使用。AMD称这项技术是由FXAA抗锯齿开发者开发的,可以轻易集成并且支持任何GPU。

图片 36

当然CAS功能是FidelityFX中的一项,所以所以未来AMD可能会在其中添加更多实用的功能,方便开发者开发出画质更佳的游戏。

图片 37

而AMD的动作非常迅速,其已经与一些游戏开发商进行合作,目前《F1 2019》及《无主之地3》已经采用了FidelityFX,而更多的游戏开发商也宣布支持这项技术,相信不久后会有更多的新游戏会通过这项技术提升游戏画质。

Radeon RX 5700系列显卡图赏

图片 38

包装和外观也体现了AMD对新显卡的重视。公版的RX 5700系列显卡从包装上就采用了经典的红黑配色,但在打开方式上有区别,RX 5700XT的包装更像一个展示盒,但RX 5700就是传统的抽屉包装。

[此处---图赏开始]

[此处---图赏结束]

先来看看RX 5700 XT,从包装就开始与众不同的他自然在显卡外观上也极具特色。显卡正面与之前的AMD显卡差别明显,整体为灰色,横向细凹槽为整张显卡的主要设计,而在涡轮风扇位置处的凹陷则让整张显卡更具线条感更加明显,工业气息少了很多,但却更具科技感。

图片 39

RX 5700 XT采用了涡轮散热器,所以在正面仅有一个直径为7厘米的涡轮风扇。作为“Red Team”正面的“RADEON”logo为亮银色主体 红色描边,但并没有具体型号,相比AMD希望通过外观来区分两张显卡吧。

[此处---图赏开始]

[此处---图赏结束]

从顶部看RX 5700 XT那一块凹陷要更明显一些,中间的红色纹路通过凹陷处到达尾部,而且这个红色要更亮一些。有人说那个凹陷像是“显卡被砸了一下”出现的,不过这也是在调侃这块显卡的外观而已。但在拿起显卡时,那个凹槽实际居然还能增强握持手感,但在设计这块显卡时设计师应该没想过还有这个好处的。不过实际上RX 5700 XT的独特外观有散热等方面优化的。

RX 5700 XT在显卡尾部还有散热开孔,可以增强显卡进风量,而且也有“radeon”的字样。当然作为这张显卡也会有背板的。

另一张RX 5700显卡就显得“规矩”很多了,没有条纹修饰,整个显卡就如一个长型金属盒子,不过红色新字体的”RADEON“logo在整体金属灰的映衬下也确实更美观,虽然简单却很耐看。不过从背面就可以看出AMD的“区别对待”了,RX 5700显卡并没有背板。

图片 40

两张显卡的视频输出都为3个DisplayPort 1.4及1个HDMI 2.0b接口,在这方面AMD做到了统一。虽然AMD也加入了VirtualLink协会,但在新显卡中没有提供USB Type-C接口。

[此处---图赏开始]

[此处---图赏结束]

供电方面AMD同样一视同仁,两张显卡都采用了6 8pin外接供电,结合PCI-E提供的75W供电,总共为显卡提供75W 75W 150W=300W的总供电能力。实际足以满足RTX 5700 XT的225W以及RX 5700的180W TDP要求。

当然呢,除了AMD提供的公版卡外,实际上AIC厂商也同时在推出新显卡,所以作为AMD重要合作伙伴的XFX也提供了两张全新的RX 5700显卡。但目前依旧是公版设计,非公版还需要一段时间。

图片 41

图片 42

显卡拆解:做工用料一如既往优秀

AMD公版显卡的做工一直都非常出色,而且一些显卡设计的非常精美,实际用料也非常足。这次的两张公版RX 5700显卡也不例外。当然,显卡螺丝多也是有些麻烦,要是保管不好装的时候少了或是多了可不好啊。

图片 43

虽然没有再使用HBM2显存了,但实际上显卡整体还是左侧布局比较紧凑一些的,右侧电子元件较少的区域刚好是显卡涡轮风扇的位置。左上方还有6 8pin供电接口。

[此处---图赏开始]

[此处---图赏结束]

RX 5700 XT是有背板的,所以有三部分,背板是金属材质。拆下背板后就可以看到显卡背面了,整体布局工整,背面还有一些供电元件。

Navi 10核心近照。但是AMD并没有在核心上激光刻蚀标注,核心封装周围还有一圈金属保护Die,与AMD公布的照片相同。八颗GDDR6显存围绕核心周围。

图片 44

公版RX 5700 XT显卡采用了三星的K4Z80325BC-H14 GDDR6显存,单颗容量为1GB,等效传输速率为14Gbps。显卡一共使用8颗组成8GB容量。

[此处---图赏开始]

[此处---图赏结束]

供电方面公版RX 5700 XT显卡采用了7 1相数字供电。每项供电有一颗mosFET场效应管。七相为核心供电,搭配一个安森美FDMF 3170集成mosFET,提供高达70A的电流处理能力,而且具有过流保护等功能。一相显存供电,mosFET同样为安森美FDMF 3170。公版RX 5700 XT显卡使用了两颗IR35217 PWM芯片,每个能控制6相供电,两个一共支持12相供电,完全满足显卡供电需求。

[此处---图赏开始]

[此处---图赏结束]

接下来就是RX 5700 XT显卡的散热器了。作为一个涡轮散热器,整体被大体分成两部分,一部分是一个直径为7厘米的涡轮风扇,另一边则是一个巨大的真空腔均热板散热器。而且在与GPU核心接触的部分,覆盖的并不是常见的导热硅脂,而一种特殊的导热材质(可能是像手机中常用的石墨烯)。

图片 45

而公版RX 5700显卡的的PCB布局与RX 5700 XT显卡类似,不过具体看还是有区别的。RX 5700显卡为6 1相供电,相比RX 5700 XT显卡的供电要求要更低一些。

[此处---图赏开始]

[此处---图赏结束]

公版RX 5700显卡的核心也是Navi 10,不过少了4组CU计算单元,同时纹理单元数量及核心频率都有所下降。显存与RX 5700 XT相同,都是三星的K4Z80325BC-H14 GDDR6显存。

[此处---图赏开始]

[此处---图赏结束]

图片 46

近距离看供电,相比RX 5700 XT显卡少了一相核心供电

[此处---图赏开始]

[此处---图赏结束]

具体的的供电电路方面,与公版RX 5700 XT相同,核心及显存的每一相供电搭配的mosFET都是安森美FDMF 3170。同样在显存附近及显卡背面共有两颗两颗IR35217 PWM芯片。

[此处---图赏开始]

[此处---图赏结束]

虽然散热器外观不同,但都是涡轮风扇散热,RX 5700显卡也采用的是真空腔均热板,与核心接触的地方也为特殊的材质。

基准测试PCI-E 4.0与PCI-E 3.0对比测试:几乎一样

在正式开始基准测试之前,我们先来进行一个环节,就是Radeon RX 5700 XT显卡在通过PCI-E 4.0 x16与PCI-E 3.0 x16下的性能表现。测试平台我们选择了全新的AMD锐龙9 3900X,主板为华硕ROG X570 CROSSHAIR Hero,测试项目为3DMark Fire Strike的三项测试以及Time Spy的两项测试,以及《杀出重围:人类分裂》、《古墓丽影:暗影》两款游戏。测试结如下:

[此处---数据图开始]

[此处---数据图结束]

[此处---数据图开始]

[此处---数据图结束]

从测试结果中看,实际上在使用PCI-E 4.0 x16接口运行基准测试及游戏时并不会使测试成绩及游戏帧数提高,在这些测试中没有差别。实际上本站在《PCIe 4.0已至,但PCIe 3.0 x8是不是就够用了?》文章中已经有详细阐述及测试,在实际的游戏运行环境中,目前的PCI-E 3.0技术已满足要求。实际上AMD在RX 5700系列新显卡使用PCI-E 4.0技术时,也是举例其在如8K视频剪辑等需要高带宽的应用场景。

所以经过了这个测试后,正式测试就要开始了。

测试平台

测试平台我们选用了英特尔Core i9-9900K,8核心16线程及3.6GHz的基础频率让测试不会出现瓶颈。主板为技嘉Z390 AORUS XTREM,内存为两条技嘉AORUS DDR4-3200 8GB。系统为最新的Windows 10 1903,驱动程序方案作为对比的NVIDIA显卡使用GeForce Game Ready Driver 431.16,AMD显卡统一采用Adrenalin 19.7.1。具体测试平台配置如下:

[此处---测试平台开始]

[此处---测试平台结束]

与Radeon RX 5700系列显卡对比测试的有公版RX Vega 64/56,公版NVIDIA GeForce RTX 2060、RTX 2070、RTX 2060 SUPER以及RTX 2070 SUPER共6张显卡,涵盖了目前主流的中高端显卡。

基准测试:RDNA首秀出色

测试项目为3DMark中Fire Strike及Time Spy中的五项测试。这些测试涵盖了从1080P到4K分辨率以及不同档次的画质,对于玩家来说具有不错的参考价值。

[此处---数据图开始]

[此处---数据图结束]

从基准测试的结果看,采用全新RDNA架构的AMD Radeon RX 5700系列显卡确实发挥出了很强的实力,在3DMark Fire Strike的三项测试中,RX 5700 XT领先RTX 2070超过10%,甚至对比最新的RTX 2070 SUPER也不落下风。再对比上一代的Vega 64显卡,RX 5700 XT也有约14%左右的领先。不过在Time Spy的两项测试中虽然Radeon RX 5700 XT相比上一代Vega 64有20%以上的领先,但相比RTX 2070还是要弱一些。

相同的趋势同样在RX 5700中出现,在三项Fire Strike测试中,RX 5700无论是对比Vega 56还是对比RTX 2060等都能保持一定的领先,但在Time Spy的两项测试中RX 5700相对与RTX 2060及RTX 2060 SUPER还是要落后一些的。

游戏测试

在游戏测试中我们选择了1920×1080及2560×1440两种分辨率进行测试,选取了目前较为主流的10款单机大作,包括《刺客信条:奥德赛》、《全面战争:三国》等。在两种分辨率下,游戏的画质都调整为预设最高/极高/Ultra,针对《地铁:离去》游戏,画质为Ultra(因其上还有两档画质调节)。以下为测试结果:

1920×1080分辨率

[此处---数据图开始]

[此处---数据图结束]

2560×1440分辨率

[此处---数据图开始]

[此处---数据图结束]

在1920×1080分辨率下,测试的游戏对于参测的显卡来说都能以较高的帧数运行,不过对比起来,不同显卡之间的差异还是比较明显的。对于RX 5700 XT来说,相对于RX Vega 64,新架构为实际测试带来了更高的游戏帧数,平均领先幅度在20%左右,而对比RTX 2070,AMD RX 5700 XT显卡在6项测试中都处于领先,两款游戏平手,剩下两款款游戏有所落后,但幅度并不大。不过更惊喜的是,即使与RTX 2070 SUPER对比,RX 5700 XT的也没有落后很多,甚至在《GTA5》游戏中还有领先,部分游戏落后幅度在5%左右,整体表现很不错。

而对于RX 5700显卡来说,甚至对比Vega 64不落下风,而对比RTX 2060,RX 5700在9款游戏中实现了领先,同样是对比RTX 2060 SUPER,在部分游戏中也能实现平局甚至领先。

到了要求更高的2560×1440分辨率测试,情况与1920×1080分辨率下的情况基本相同,RX 5700 XT再对比RTX 2070时在一些游戏时有一定的领先,同时对比RTX 2070 SUPER也会有平局或领先情况发生。对于RX 5700来说测试结果也类似,部分游戏的平均领先幅度为7%左右。

超频测试:还有一定潜力,值得期待

AMD一直在超频方面比较开放,Adrenalin驱动中的Wattman可以方便的调节核心频率、电压、温度上限等众多选项。即使没有第三方超频软件,仅通过驱动也可以方便的进行显卡超频。在19.7.1版的Adrenalin驱动中,Wattman甚至支持自动超频,现在AMD直接提供了自动欠压GPU、自动超频GPU以及自动超频显存的选项,在提供了丰富的手动调节选项后简化了超频操作。

所以我们也使用了自动超频GPU及自动超频显存功能,来看看Radeon RX 5700的两款显卡超频性能如何。

首先是RX 5700 XT显卡,点击后应用,Wattman非常快速的给出结果,核心提高到2130MHz,显存最高到935MHz,此时GDDR6显存的等效传输速率为14.96Gbps。

RX 5700显卡在使用Wattman自动超频后给出的核心频率可以提高到1830MHz,显存为930MHz,等效传输速率为14.8Gbps。两张显卡相比Boost频率都要提升了一些。

虽然自动超频非常方便,但我们还是进行了手动超频测试,不过会将Wattman给出的结果做一下参考。与我们测试过的其他显卡不同的是,Wattman给出的结果比较迷,对于RX 5700 XT显卡来说,在将功率上限提高到极限后,同时进行核心及显存超频,实际的频率甚至要更低一些,最终RX 5700 XT显卡得到相对于Boost频率 210MHz,显存 51MHz、等效传输速率约14.46Gbps的结果。

但公版RX 5700显卡最终手动超频的频率要比Wattman给出的结果要高了,得到相对于Boost频率 125MHz,显存 110MHz、等效传输速率约14.88Gbps的结果。之所以最终核心及显存的超频结果定格在1850MHz及1860MHz,通过AafterBurnner软件无论如何调节,也无法让RX 5700显卡超到更高的频率,所以这个核心及显存频率的结果也应该不是公版RX 5700显卡的极限,如果AMD解锁了这个限制,兴许超频成绩会更高。最终超频后进行3DMark测试的成绩如下:

[此处---数据图开始]

[此处---数据图结束]

[此处---数据图开始]

[此处---数据图结束]

这是RNDA架构 7nm的超频首秀,实际上RX 5700系列两款显卡的基础频率及Boost频率已经比较高了,而实际超频让显卡的频率再上一层,实际RX 5700 XT显卡的核心频率最高超过了2000MHz,在2020MHz附近,实际测试后成绩平均提升6%左右。RX 5700显卡的实际核心频率达到了1850MHz,成绩平均提升5%左右。

温度测试:低噪音,散热满足要求

在温度测试过程中,全程采取封箱测试,测试时室内温度为25摄氏度,测试采用的机箱为分形工艺R6 TG,待机测试为开机后静置无操作记录10分钟,满载测试为运行3DMark Fire Strike压力测试。以下为测试结果:

[此处---折线图开始]

[此处---折线图结束]

测试时室内温度为25摄氏度。在待机时,RX 5700 XT以及RX 5700两张显卡表现的其实不错,待机时的温度最终为40摄氏度左右,此时两站显卡的涡轮风扇在运行,RX 5700 XT转速在710RPM左右,RX 5700转速为680RPM左右,几乎听不到噪音。

而在3DMark Fire Strike压力测试中,涡轮风扇的表现就不是很出色了。此时RX 5700的温度为80摄氏度,而RX 5700 XT的温度甚至上升到了85摄氏度。此时通过记录的风扇转速发现,RX 5700 XT的风扇转速近为1900RPM,虽然这样会保持一个相对合适的噪音水平,但依旧希望AMD能够改进驱动,将GPU温度保持在一个更加合理的水平。

不过我们将两张显卡的风扇转速都手动调整到2900转时,在测量其满载温度,结果就比较满意了,RX 5700温度为70摄氏度,而RX 5700 XT温度为75摄氏度。以下两张显卡手动调整后的温度表现:

[此处---折线图开始]

[此处---折线图开始]

但这么做也有一定代价,就是噪音明显一些,如果有注重静音表现的朋友,还是请不要这么做。

功耗测试:RDNA 7nm带来惊喜

通过我们专门购置的功耗测试仪,可以精准的测量出显卡PCI-E、外接供电功率。通过开机后静置测量显卡待机功耗,显卡的满载功耗则通过运行3DMark Fire Strike压力测试获得,以下为测试成绩:

[此处---折线图开始]

[此处---折线图结束]

[此处---折线图开始]

[此处---折线图结束]

待机功耗方面,RX 5700显卡的功耗都在21W左右,与RX Vega 64/56相差不多,但要比NVIDIA的几款显卡要高一些。但在满载功耗方面,7nm工艺不仅让全新的Radeon RX 5700核心面积骤减,随之而来的就是功耗的下降。RX 5700显卡的满载功耗约为161W,与RTX 2060几乎相当。同时RX 5700 XT的表现也非常出色,满载功耗方面约为217W,比RX Vega 56的226W还要低。看来架构工艺双升级真正为RX 5700系列显卡的功耗带来了真正改善。

总结:新架构灵活高效,开启AMD显卡新世代

对于AMD来说,过去七年间经历足以成为其公司发展史上最重要的一段时期,不过对于RTG部门而言,这七年间虽然从通用计算、到家用主机、甚至风靡一时的挖矿都让其保持了相当的热度,而且Fiji、Polaris都是这七年中的闪光点。但这七年磨出的“GCN”这一剑终归有完成的一刻,接下来还有还需要继续RTG的使命,保持AMD在GPU领域的竞争力。

显然,在7年之后的2019年,AMD RTG也终于拿出了盼望已久的Navi,拿出了让玩家望眼欲穿的RDNA,也再次让消费者看到了AMD在图形领域依旧保持这应有的实力。

新架构从计算单元到图形处理管道都有了重大更新,这也是新架构提升效率的基石。不过从Vega架构以来,AMD RTG对GPU核心缓存及存储控制器(毕竟AMD干过显卡里装SSD的事情)等方面进行了非常大的改进,以及主机领域的针对性优化(DCC,三角形颜色压缩),让AMD在图形架构、技术领域其实在不断地积累。而大规模并行计算等领域的发展也让AMD对通用计算有了更多的理解。所以才能在这次的RDNA架构中看到从计算单元、缓存架构到图形管道的全方位提升。

不过略显遗憾的是,逐渐成为未来图形学光照领域热门的光线追踪技术在目前的RDNA架构中缺席了。不过好在AMD为下一代家用主机设计的GPU中包含这项技术,说明离我们在AMD显卡中见到这项技术也不远了。

回到这次推出的Radeon RX 5700系列显卡上,这两张显卡都是采用的Navi 10核心,采用了7nm工艺制造。40组/36组CU计算单元的数目让整个核心面积仅为251平方毫米,这也回到了较小的核心面积水平。RX 5700 XT对比RX Vega 64显卡,有接近18%的性能提升,而RX 5700对比Vega 56也几乎有同样的领先幅度。而且功耗相比这两款Vega显卡要低不少,可谓效能提升代表,也做到了AMD发布时的承诺。而且这次7nm的Navi 10核心面积仅为251平方毫米,Radeon VII的核心面积为331平方毫米,所以目前的RX 5700系列显卡远没有达到目前RDNA架构及制造工艺的极限。但其现在表现出来的高效能却令人印象深刻,我们应该能见到更多采用RDNA架构的Navi GPU的出现。

价格方面,在7月6日,AMD官方为这两款还在预售的显卡进行调价, RX 5700 XT显卡售价从3599元降至3099元,而RX 5700显卡售价则从2999元下调至2699元,最高降幅达500元。新品还在预售就调价也是比较少见的。虽然在前几天竞争对手已经推出了性能更强大的产品,旨在阻击AMD新品,不过降价让竞争的天平再次向AMD这边倾斜。从测试中可以得出此次推出的两款显卡再近些AMD的显卡产品线中属于具有很强竞争力的代表,此次调价会让RX 5700 XT及RX 5700两款显卡更具竞争力,再次凸显其性价比。

这次的两款显卡虽然不是面对最高端GPU的产品线,但也足够成为搅动起目前消费级显卡市场的重磅产品。让我们看7年之后,AMD要怎么再次为显卡市场带来新的活力,七年磨一剑,今日把示君,这样的AMD怎能不让人爱呢。虽然NVIDIA在上周推出了SUPER系列显卡做好了迎战的准备,但AMD的紧急降价一定会让老对手措手不及,NVIDIA应该会有新的动作来应对,显卡市场的好戏终于开锣了!

本文由pc28.am发布于pc28.am,转载请注明出处:年度GPU架构回看,7000三大基本水源真实照片首度

上一篇:跨云管理实现跃升,企业如何构建开放式混合云 下一篇:没有了
猜你喜欢
热门排行
精彩图文