amd吧 关注:790,643贴子:18,163,368
  • 54回复贴,共1

有感于xsx的架构,对rdna的个人看法

只看楼主收藏回复

首先感谢小吧@山鸠,谢谢提供xsx的架构图。
这里提一下个人的一些小看法。
xsx是153亿晶体管360.4mm²,这样算下来平均晶体管密度才42.5M/mm²。作为比较,工艺差不多的4750g是98亿晶体管156mm²,算下来晶体管密度超过60M/mm²。而工艺略微落后(初代7nm)的5700xt是103亿晶体管253mm²,算下来平均晶体管密度40M/mm²出头,同世代的3950x中的CPU部分每个die是38亿晶体管74mm²,算下来平均晶体管密度略微超过50M/mm²。
从上述四组数据里可以看出,rdna架构的显卡晶体管密度不高,就算有工艺改进&有CPU部分拉高平均值,xsx的晶体管密度也很低(不用说和4750g相比,就是和初代7nm工艺的CPU也没法比)。这或许是从另一方面解释为什么4750g的核显没有选择navi架构的原因(晶体管密度太拉跨,当然了,挤牙膏&时间跟不上&人手不足才是主要原因)。
当然了,rdna架构本身同规模的性能比vega强出不少(哪怕同带宽,也要强出15%以上,这还是rdna1.0)。而且根据xsx的能耗比表现(52cu运行在1.825GHz的情况下,才140W),rdna2.0的主频将更上一层楼(桌面的4750g用vega架构都能运行在2.1G的主频上,更别提为了主频,晶体管密度更低&专门针对高主频设计的rdna2.0),所以这次笔者对消费级rdna2.0架构的显卡主频抱有信心,默频上2.1G+问题不大,顶级非公版主频还会超的更高。
不过,rdna架构中拉低晶体管密度的到底是什么现在还没有详尽的解释,xsx这边可以归咎于光追单元,但这么低的晶体管密度明显不能用为了主频而让步来解释(里面还有其他部分)~


IP属地:辽宁1楼2020-08-18 15:13回复
    现在笔者很好奇,rdna里面到底有什么大量占用面积而消耗不了多少晶体管。这个问题明显不能用为了主频而让步来解释,更别提所选择的密度库不同(CPU更依赖高主频,但7nm工艺的CPU晶体管密度总是大于rdna架构的显卡)~


    IP属地:辽宁2楼2020-08-18 15:15
    回复
      对了,当然rdna2.0内部会添加光追单元,但这也很难解释为何xsx的晶体管密度这么低~


      IP属地:辽宁3楼2020-08-18 15:21
      回复
        根据自己的见解,抛个砖
        RDNA里每CU 4组SIMD16改成了2组SIMD32,复杂度增加了。类似还有Dual CU对缓存和标量ALU的并用,RDNA2里还增加了Ray Tracing单元,其实对于DX12之前的游戏来说,除了降低了对CPU的依赖,这些改造都没什么卵用。不过一旦上了DX12U,恐怕会一下子跟Vega拉开差距,堆的晶体管也要操作系统/图形API/软件来适配才行。
        站未来


        IP属地:美国4楼2020-08-18 15:36
        收起回复
          AMD这次选择在Navi21上堆5120SP,方向是对的,但值得质疑的是RDNA2在SP数变多了之后是否还会出现GCN时代那种SP越多游戏性能提升越小的问题。
          泼个冷水:目前RDNA2唯一可信的跑分是那个比2080Ti高17%的VR Benchmark,到最后表现可能就是这个水平。传闻中的比2080Ti快40% 50%都没有确切来源。RDNA2之前立下的能耗比提升50%的flag可能没法兑现,也有可能放一个出厂灰烬的版本,缩小和老黄的差距,再发个高能耗比的降频版本兑现承诺。
          RDNA2 99%不会有类似DLSS的功能,6900XT实际游戏最终可能会被DLSS 3.0加持下的3070甚至3060虐杀。DLSS方向是对的,画面细节带来的感知强还是游戏帧数提升带来的感知更强?就不知AMD什么时候跟进了。但最近经常有RDNA2和“AI cores”同时出现的爆料


          IP属地:北京5楼2020-08-18 16:31
          回复
            农企为了能够拉高性能,GPU用的是高性能库,而CPU为了降低成本,用的是高密度库。其实农企要是舍得花钱把CPU全用高性能库,5.0真的不是事。


            IP属地:江苏来自Android客户端6楼2020-08-18 16:34
            收起回复
              这个是工艺的取舍问题,根据华为工程师在知乎上的解答,高密度库和高性能库在频率上能相差15%。我个人认为15%偏高,10%的性能差别是有的。


              IP属地:江苏来自Android客户端7楼2020-08-18 16:36
              收起回复
                如果ZEN2没用分离式io设计降低延迟再使用高性能库拔高频率,那牙膏真的会被打的吐血


                IP属地:江苏来自Android客户端8楼2020-08-18 16:38
                收起回复
                  密度可以换成本
                  成本可以换频率
                  这个得看怎么选择才是最好的


                  IP属地:贵州9楼2020-08-18 16:57
                  回复
                    分析得不错!确实,优化频率特性通常会降低密度
                    但是,显卡的频率要服从于功耗,3090为什么基础频率只有1.4G、boost频率只有1.74G,那主要是功耗决定的,而不是芯片不能在更高的频率稳定工作。现在应该是TGP350W , 如果换算成为AMD惯常的标称TBP(约等于TGP/0.7-0.8) ,会明显超过400W .
                    而且再提高频率,能效比会明显下降。比如5700虽然是阉割版但实际能效比就比5700XT高15-20%。5600XT官方初版bios(boost频率1560)甚至比5700XT能效比高近30%, 实际跑3DMARK平均功耗甚至低于个别5500XT和1660. 实际上RDNA1的大规模生产频率1650-1700(目标频率1680-1720)较佳,好的芯片可以到1750(目标频率1800-1850)。如果再降低,能效还可以提升(比如苹果50WTBP的5600M),但性价比就会下降。


                    IP属地:云南11楼2020-08-18 19:17
                    回复
                      因此,我估计旗舰级的TBP应该在300-350W之间(TGP240-275W ),频率在1.75-1.825G之间(目标频率和标称频率可能稍高),相比之下5700XT公版默认的实际游戏平均频率大约1.725G,5700大约1.675G。就算IPC完全没提升(普通性能应该是),适当考虑边际效用核心双倍能力也是基本可以达到。
                      其实,关键是带宽,如果继续采用D6而不是D6X ,核心翻倍是需要512bit才能充分发挥,希望是512bit, 这是这次性能能否突破的关键之关键。


                      IP属地:云南12楼2020-08-18 19:24
                      收起回复
                        相关讨论:
                        摸着老黄估计Navi新卡的性能【amd吧】_百度贴吧 https://tieba.baidu.com/p/6886027992?pid=134149611628&cid=0&red_tag=1481387980#134149611628


                        IP属地:云南13楼2020-08-18 19:25
                        回复