有感于xsx的架构，对rdna的个人看法【amd吧】

amd吧关注：790,643贴子：18,163,368

54回复贴，共1页

有感于xsx的架构，对rdna的个人看法

首先感谢小吧@山鸠，谢谢提供xsx的架构图。
这里提一下个人的一些小看法。
xsx是153亿晶体管360.4mm²，这样算下来平均晶体管密度才42.5M/mm²。作为比较，工艺差不多的4750g是98亿晶体管156mm²，算下来晶体管密度超过60M/mm²。而工艺略微落后（初代7nm）的5700xt是103亿晶体管253mm²，算下来平均晶体管密度40M/mm²出头，同世代的3950x中的CPU部分每个die是38亿晶体管74mm²，算下来平均晶体管密度略微超过50M/mm²。
从上述四组数据里可以看出，rdna架构的显卡晶体管密度不高，就算有工艺改进&有CPU部分拉高平均值，xsx的晶体管密度也很低（不用说和4750g相比，就是和初代7nm工艺的CPU也没法比）。这或许是从另一方面解释为什么4750g的核显没有选择navi架构的原因（晶体管密度太拉跨，当然了，挤牙膏&时间跟不上&人手不足才是主要原因）。
当然了，rdna架构本身同规模的性能比vega强出不少（哪怕同带宽，也要强出15%以上，这还是rdna1.0）。而且根据xsx的能耗比表现（52cu运行在1.825GHz的情况下，才140W），rdna2.0的主频将更上一层楼（桌面的4750g用vega架构都能运行在2.1G的主频上，更别提为了主频，晶体管密度更低&专门针对高主频设计的rdna2.0），所以这次笔者对消费级rdna2.0架构的显卡主频抱有信心，默频上2.1G+问题不大，顶级非公版主频还会超的更高。
不过，rdna架构中拉低晶体管密度的到底是什么现在还没有详尽的解释，xsx这边可以归咎于光追单元，但这么低的晶体管密度明显不能用为了主频而让步来解释（里面还有其他部分）~

送TA礼物

IP属地:辽宁

1楼2020-08-18 15:13回复

现在笔者很好奇，rdna里面到底有什么大量占用面积而消耗不了多少晶体管。这个问题明显不能用为了主频而让步来解释，更别提所选择的密度库不同（CPU更依赖高主频，但7nm工艺的CPU晶体管密度总是大于rdna架构的显卡）~

IP属地:辽宁

2楼2020-08-18 15:15

对了，当然rdna2.0内部会添加光追单元，但这也很难解释为何xsx的晶体管密度这么低~

IP属地:辽宁

3楼2020-08-18 15:21

根据自己的见解，抛个砖
RDNA里每CU 4组SIMD16改成了2组SIMD32，复杂度增加了。类似还有Dual CU对缓存和标量ALU的并用，RDNA2里还增加了Ray Tracing单元，其实对于DX12之前的游戏来说，除了降低了对CPU的依赖，这些改造都没什么卵用。不过一旦上了DX12U，恐怕会一下子跟Vega拉开差距，堆的晶体管也要操作系统/图形API/软件来适配才行。
站未来

IP属地:美国

4楼2020-08-18 15:36

收起回复

AMD这次选择在Navi21上堆5120SP，方向是对的，但值得质疑的是RDNA2在SP数变多了之后是否还会出现GCN时代那种SP越多游戏性能提升越小的问题。
泼个冷水：目前RDNA2唯一可信的跑分是那个比2080Ti高17%的VR Benchmark，到最后表现可能就是这个水平。传闻中的比2080Ti快40% 50%都没有确切来源。RDNA2之前立下的能耗比提升50%的flag可能没法兑现，也有可能放一个出厂灰烬的版本，缩小和老黄的差距，再发个高能耗比的降频版本兑现承诺。
RDNA2 99%不会有类似DLSS的功能，6900XT实际游戏最终可能会被DLSS 3.0加持下的3070甚至3060虐杀。DLSS方向是对的，画面细节带来的感知强还是游戏帧数提升带来的感知更强？

就不知AMD什么时候跟进了。但最近经常有RDNA2和“AI cores”同时出现的爆料

IP属地:北京

5楼2020-08-18 16:31

农企为了能够拉高性能，GPU用的是高性能库，而CPU为了降低成本，用的是高密度库。其实农企要是舍得花钱把CPU全用高性能库，5.0真的不是事。

IP属地:江苏

来自Android客户端6楼2020-08-18 16:34

收起回复

这个是工艺的取舍问题，根据华为工程师在知乎上的解答，高密度库和高性能库在频率上能相差15%。我个人认为15%偏高，10%的性能差别是有的。

IP属地:江苏

来自Android客户端7楼2020-08-18 16:36

收起回复

如果ZEN2没用分离式io设计降低延迟再使用高性能库拔高频率，那牙膏真的会被打的吐血

IP属地:江苏

来自Android客户端8楼2020-08-18 16:38

收起回复

密度可以换成本
成本可以换频率
这个得看怎么选择才是最好的

IP属地:贵州

9楼2020-08-18 16:57

分析得不错！确实，优化频率特性通常会降低密度
但是，显卡的频率要服从于功耗，3090为什么基础频率只有1.4G、boost频率只有1.74G，那主要是功耗决定的，而不是芯片不能在更高的频率稳定工作。现在应该是TGP350W , 如果换算成为AMD惯常的标称TBP（约等于TGP/0.7-0.8) ,会明显超过400W .
而且再提高频率，能效比会明显下降。比如5700虽然是阉割版但实际能效比就比5700XT高15-20%。5600XT官方初版bios（boost频率1560）甚至比5700XT能效比高近30%, 实际跑3DMARK平均功耗甚至低于个别5500XT和1660. 实际上RDNA1的大规模生产频率1650-1700（目标频率1680-1720）较佳，好的芯片可以到1750（目标频率1800-1850）。如果再降低，能效还可以提升（比如苹果50WTBP的5600M），但性价比就会下降。

IP属地:云南

11楼2020-08-18 19:17

因此，我估计旗舰级的TBP应该在300-350W之间（TGP240-275W )，频率在1.75-1.825G之间（目标频率和标称频率可能稍高），相比之下5700XT公版默认的实际游戏平均频率大约1.725G，5700大约1.675G。就算IPC完全没提升（普通性能应该是），适当考虑边际效用核心双倍能力也是基本可以达到。
其实，关键是带宽，如果继续采用D6而不是D6X ,核心翻倍是需要512bit才能充分发挥，希望是512bit, 这是这次性能能否突破的关键之关键。

IP属地:云南

12楼2020-08-18 19:24

收起回复

相关讨论：
摸着老黄估计Navi新卡的性能【amd吧】_百度贴吧 https://tieba.baidu.com/p/6886027992?pid=134149611628&cid=0&red_tag=1481387980#134149611628

IP属地:云南

13楼2020-08-18 19:25

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

54回复贴，共1页

<返回amd吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴

日	一	二	三	四	五	六

有感于xsx的架构，对rdna的个人看法

登录百度账号

扫二维码下载贴吧客户端