高通吧 关注:173,591贴子:4,228,598
  • 9回复贴,共1

拿Mali GPU跑Stable diffusion AI画图 速度8分钟一张

只看楼主收藏回复

SoC是瑞芯微的RK3588,Mali-G610 MC4 1GHz,理论性能差不多是天玑8100的85%
部署使用TVM Unity框架,Linux下走OpenCL调用GPU(理论上安卓也可以用)
Stable Diffusion 1.5 生成一张512x512图片,20步用时差不多550秒(包含着色器编译用时,实际用时会短一些),U-Net速度22s/it



IP属地:黑龙江1楼2024-02-20 01:14回复
    目前是fp32精度运行的,换成fp16速度应该能快很多,但是我不知道怎么做
    另外这个GPU理论fp32算力差不多0.45T,但是跑SD实际算力大概只能跑到不到0.1T,可能是TVM的优化能力还不够好或者有内存瓶颈?


    IP属地:黑龙江2楼2024-02-20 01:18
    回复

      已开源,8u🚪可以自己跑着玩


      IP属地:黑龙江3楼2024-02-20 01:20
      收起回复
        mark


        IP属地:广东来自Android客户端4楼2024-02-20 01:41
        回复
          a14 512x512 20步 68秒,a17Pro 36秒,m1 17秒,m2 10秒。


          IP属地:四川来自iPhone客户端5楼2024-02-20 01:43
          收起回复
            左下角生成时间


            IP属地:四川来自iPhone客户端6楼2024-02-20 01:55
            回复
              可以跑一个显存内存杀手的SDXL看看,DT内存优化太神了


              IP属地:四川来自iPhone客户端7楼2024-02-20 01:57
              收起回复