围棋吧 关注:337,955贴子:10,219,034
  • 43回复贴,共1

master和zero的区别

只看楼主收藏回复

看很多人怀念大师的无敌,和台湾解说小哥一样不愿意接受master世界第一的位置不取代,
我也来说说他们之间的区别吧。。。。。。。。。


1楼2017-10-29 19:38回复
    简单的说就和这位网友说的一样


    2楼2017-10-29 19:39
    回复
      有些网友可能说master如果也采用80层网络是否可以打败zero,这个问题官方貌似没说,但是我们基本可以推测出来。以下推论基于大家相信谷歌是一个靠谱的公司,这么一个前提。
      谷歌首先在探索算法的优劣和极限,如果master需要使用80层,且可以进一步,我想谷歌一定会使用的。
      master训练了很长时间谷歌应该是看到了极限,而且master的细节算法不需要使用80层网络,他们才不使用的。
      而zero使用了两个版本,一个和master一样的40层,估计效果不佳,并没有超过master多少。所以改用80层。关键是这80层和抛弃人类算法的zero效率非常高,仅仅40天就把训练了半年以上的master吊打。而且40天的时候进步曲线依旧有上爬趋势,考虑到20天的时候zero也有过一段时间的平行线,我想如果zero继续进化半年,效果一定非常惊人。。。。。。。。


      4楼2017-10-29 19:49
      收起回复
        大师发现的新定式多得去了 就说一句 哪个的棋好看?肯定是大师的。大师要80层神经网络不把0狗虐得妥妥的?谷歌这次真是醉了 拿40层的对12层的李世石版 拿80层的对40层的master。好吧,我看不出这能说明什么?只能说明纯自我对弈的能下得不错而已。


        IP属地:广东来自iPhone客户端7楼2017-10-29 20:30
        收起回复
          要说人类棋谱造成这么大的差距明显不现实,就算再臭也比狗蛋一开始乱下好多了,大师版是人为设计了气征子的概念,狗蛋是靠自己发现。。论文中也从来没说过人类棋谱拖后腿,说到底就这点棋谱想拖后腿也不容易


          IP属地:广西来自Android客户端10楼2017-10-29 20:46
          回复
            @harry8985 知乎上截的图,你那个截图并没说是20block的,我认为就算是也说明不了问题
            ,大约在70小时的时候zero已经开始master,你说曲线趋向平,你可以看40block的在20天左右达到master的时候后面有10天左右也是平的。。。。。
            所以请相信谷歌,zero版本绝对是迄今为止算法最高效,棋力最高的版本。


            11楼2017-10-29 20:49
            收起回复
              2.0的V6发动机好像没必要特地调到1.8排量只为了和老版的发动机比功率吧


              IP属地:浙江来自iPhone客户端12楼2017-10-29 21:30
              回复
                和楼上的几位朋友看法不同,我认为MASTER的神经网络优于40block的zero的神经网络。理由如下:
                论文原文已经说明,zero纯神经网络(raw)ELO分值为3055,完全体Zero分值为5185,MASTER为4858,LEE为3739,FAN为3144。
                根据AlphaGo的上篇论文,单机版AlphaFAN的神经网络的ELO分值为2177。
                论文里也说明了,AlphaLEE和FAN结构相同。最乐观的估计,LEE的提升完全是基于人类特征的走子策略(rollouts),神经网络完全没有改进,那么此策略的提高分数至多为为3739-2177=1562分
                论文中明确,MASTER与ZERO在结构上的不同之处,就是MASTER使用和LEE相同的走子策略。最乐观的估计,这一策略使棋力更强的MASTER也能提高相同的分数,那么MASTER纯神经网络ELO分数不会低于4858-1562=3296分,明显强于Zero的3055分
                也就是说,拖MASTER后腿的不是人类的训练数据——这些数据有可能训练出了更好的结果,而是从AlphaGO Lee时代带来的“基于人类特征的走子策略”(same handcrafted features and rollouts as AlphaGo Lee


                IP属地:北京来自Android客户端14楼2017-10-29 22:15
                收起回复
                  如果MASTER完全使用Zero不受人类局限的MCTS算法,确实有可能反超Zero。可以看到,Zero的算法在神经网络的基础上足足提高了5185-3055=2130分
                  下图分别为:AlphaGo各版ELO分数、Zero与Master的不同、上篇论文中的走子策略描述






                  IP属地:北京来自Android客户端15楼2017-10-29 22:17
                  回复
                    我觉得不应该看层数,应该看功耗。
                    正如军队,如果一个营有两连,一个连有两个排,同样人数两两制就能弄出比三三制更多的层。


                    IP属地:广东16楼2017-10-29 23:17
                    回复