龚翔宇吧 关注:5,476贴子:1,258,601

谈谈近两年来FIVB官网的数据问题

只看楼主收藏回复

最近有人不断地拿一些不完整的数据出来说事儿,那我干脆也发表一下我的意见,谈谈近两年来FIVB官网的数据问题。帖子长了一些,爱看就看,不爱看可以忽略。另外,这篇文章是可以转载的,如果有人要贴到别处去,我并不反对。
原来FIVB官网和中国排协官网都是用P2、P3统计的,虽不先进,却也自成体系。但是从2018年国际排联联赛开始到现在FIVB官网再也不给P3了,这就导致了所谓的赛后数据不完整。从中国排协官网的数据统计改进进程看,由P3统计到DataProject统计是需要花费时间去培养统计员的,经过16-17和17-18两个赛季的努力,中国排协自18-19联赛开始已经使用DataProject统计了。而国际排联的摊子要更大一些,可能需要更多的时间。


1楼2020-05-18 10:55回复
    作为过度性办法,FIVB在每场比赛之后只提供P2统计、赛后得分表以及每轮比赛后的单项排名统计数据。这样一来,诸如扣球失误,发球失误以及防守、传球和一传之类的数据就都缺失了。用不完整的数据去分析比赛结果和队员表现肯定不是什么好办法,那么有什么办法可以把丢失的数据找回来吗?其实是有的。
    虽然FIVB官网不直接给P3统计了,但是诸如扣球失误,接发球失误以及防守、传球和一传之类的数据在官网的单项排名数据中还都是有的,而且是每一轮比赛都在更新的。官网单项排名数据是累计数据,每次更新主要是在做矩阵累加,即:
    第N轮后的单项排名数据=第N-1轮后的单项排名数据+第N轮的比赛数据
    而第N轮的比赛数据其实就是原来的P3。这样,就算官网上没给P3也可得到:
    第N轮的比赛数据=第N轮后的单项排名数据-第N-1轮后的单项排名数据
    所以,不管你用什么办法,只要你在每轮比赛后都及时复制并保存官网的单项排名数据,就能计算出已经打过的、任何一场比赛的比赛数据。然而这样做的工作量是不小的。在16-17和17-18联赛,我采用了屏幕复制的办法。为了减少工作量,我只复制江苏队队员的联赛单项排名的数据。18年国际排联联赛进入总决赛以后,我发现等P3是等不到了,于是也采用了同样的方法来复制和保存中国女排队员在各项比赛中每场比赛后官网单项排名的数据,
    举个例子,18年世锦赛6强赛结束后中国队主要队员的扣球和一传数据是这样的:


    半决赛打完意大利后就成了:


    两者之差就是打意大利这场中国队主要队员的扣球数据和一传数据。一些看官们最近回看世锦赛半决赛后都有这场比赛中国队的一传好于意大利的感觉。那么,这是为什么,两轮比赛的一传之差会告诉你这是为什么。


    2楼2020-05-18 11:01
    回复
      直接用屏幕复制并保存单项排名数据的方法有个缺陷是,在做统计图时,自己还要自己再敲一遍数据,很麻烦。另外,费了不少力气,整出来的数也有些四不像,不如干错自己做P3算了。所以,自19年U18世锦赛后,我开始采用了新的办法。即,每轮比赛结束后右键并复制所有官网单项排名的数据,并且用“选择性粘贴→文本”将数据复制到我笔记本电脑的Excel文件中,然后通过国家名字排序,把中国队队员的数据存下来,之后再与上一轮的单项排名数据相减。这样我就得到了中国队队员每一轮比赛的得分,扣球、拦网、发球、防守和一传。其实,我最初是连传球数据也做了的,但日本统计对传球这项改动太大而且太频繁,我也只好作罢了。这样我用官网单项排名数据做出的P3在一些场次就没有传球数据。
      如果有人想要19年世界杯某场比赛后的中国队队员的P3数据,我是随时可以提供的。当然,在宇吧找数据也是可以的。我觉得,不管是哪位中国队队员,在四年一次的三大赛丢数据都怪可惜的,而我这个老统计员有责任尽量帮她们找回这些数据。
      我希望明年奥运会时FIVB的统计可以过度到DataProject统计或者回到P3统计,这样我就比较省劲了。但如果仍然像现在这样,我也希望有人和我一起为中国女排队员整理数据。


      3楼2020-05-18 11:02
      回复
        复制官网单项排名数据也有个时机问题。到17年大冠军杯比赛为止,国际排联网站的软件设计有两个特点:
        1、在比赛进行的时候和赛后数据会商结束之前,单项排名数据是随着得分表的数据变化而变化的。这种变化是一一对应的,如队员A在比赛中扣球得分,在比赛的得分表上马上就有显示,而单项排名的扣球数据上马上就自动将这个队员的口气总数和扣去得分各自+1,最多会有一点时间延迟。
        2、在赛后对比赛后经过统计组的数据会商,有些数据会调整。在调整之后,官网后台会启动程序,自动将比赛数据按照P2和P3的格式以Adobe pdf 文件的格式贴在官网上。由于FIVB官网的后台软件只有Adobe writer 没用Adobe Editor,P2和P3一旦发出就不可修改。
        由于后台软件是这样设计的,在17年大冠军杯结束之前,也没用发现FIVB网站出现过赛后得分表、单项排名和P2及P3互相矛盾。因此,在此过度阶段下载并保存每场比赛后单项排名数据的时机是在P2发出之后。


        4楼2020-05-18 11:03
        回复
          不过,在整个排坛从P2、P3统计向DataProject发展已经是明显的趋势,包括中国在内的世界各排球协会都已经基本采用DataProject统计了。相比于P2、P3统计,DataProject统计更细致。比如,增加了Vote计算,保发得分(BP)计算,净胜分(W-P)计算。又比如,扣球失误和扣球被拦成了两个单独的项,等等。总体来讲,细化是一件好事。但是,已经早就在使用DataProject软件的日本排协在局半18年世锦赛和19年世界杯时,至少也让FIVB官网统计出现了两次一模一样的错误。即,在18年世锦赛的小组赛阶段,和19年世界杯的第二站第二场比赛之前,均为将队员的扣球被拦计入扣球失误。18年世锦赛数据后来也没有再修改,19年世界杯的第一站和第二站第一场的扣球被拦数据倒是补上了,但是具体是在那一场前4场比赛的哪一场比赛被拦的也说不清楚了。
          可能是发现数据能改,日本统计员就改数据上瘾了,之后在评最佳之前疯狂地修改了很多数据。有些数据,比如有效防守的数量,再加再减,看官们也看不出来。反正P2中没有这种数据,赛后得分表上也没有这项数据。当然,也不会出现改动后官网数据自相矛盾。但是,诸如拦网统计之类的数据在P2中是有的。由于P2用的是pdf格式,不可修改,那利用赛后得分表去改动数据就会和P2产生矛盾,比如,在对日本、荷兰和塞尔维亚的比赛中,小宇的拦网得分和赛后得分表的拦网得分差了4个。由于得分表和单项排名数据的变更是同步的,她的拦网得分总数也从22分被改成了18分,真不知为啥日本那边为啥这么恨小宇的拦网。而FIVB官网,作为权威性网站却出现自家数据互相打脸,至少也不好吧。


          5楼2020-05-18 11:05
          收起回复
            既然DataProject统计已经是个大的趋势,郎平和中国女排教练组也早就在使用DataProject统计了,那我们是不是也该与时俱进,用DataProject统计来分析世界杯的比赛结果。由于现在FIVB的统计用的还是从前做P3统计的后台程序,计算Vote和保发(BP)比较难了。但是,计算净胜分W-P是可能的。事实上,中国排协在联赛计算净胜分已经有两个赛季了。计算W-P的公式列出来,即:
            净胜分(W-P)=扣球净胜分+拦网得分+发球净胜分-接发球失误
            注意,这是DataProject统计中的一个标准公式,你可以不喜欢这个公式,但你不可以说这是闽江为了粉小宇造出来的公式,因为这种乱怼实在是一种不学无术的表现,到头来在大庭广众之下丢脸的肯定不是闽江而一定是你自己。数据就是数据,是运动员在比赛中打出来的,不粉谁,也不黑谁。
            下面用从国际排联官网单项排名数据来计算一下中国女排主要队员在19年世界杯的W-P(净胜分)数据。注意,官网根据P2数据,小宇的拦网得分是22而不是18。

            队员在一项统计中数据好,而在另一项统计中数据不好是正常的。不好正好说明队员在某个方面有技术缺陷。这不是数据出了什么错,也不是标准的统计公式出了什么错。如果你看到W-P数据认为是在黑谁,那一定是你自己不上路子。


            6楼2020-05-18 11:55
            回复
              未完待续--------------------


              7楼2020-05-18 11:56
              回复
                一支球队在排球比赛中战胜另一支球队至少要赢2个或者2个以上的净胜分,而球队的净胜分是由各个参赛队员的净胜分组成的。因此,谁都不能不把净胜分当回事。我个人认为,W-P之所以能够在当下流行的DataProject统计中占有地位还是有些道理的。一个队员的网上实力体现在进攻和拦网这两项上,在进攻净胜分一定要多,在拦网上得分也要多。一个队员的发球要能赚分,不能赔分。对于接发球球的队员,一传失误是要避免的,因为这就是在给对方送分。故,以W-P作为评价一个队员的表现还是比较全面的。


                8楼2020-05-18 12:09
                回复
                  真不知为啥日本那边为啥这么恨小宇的拦网——主要是小宇将日本队主攻拦惨了。


                  IP属地:湖南9楼2020-05-18 12:11
                  收起回复
                    中国女排在19年世界杯上取得的巨大的胜利,大部分球队都被中国队打了3:0。非要说这些被剃光头的球队谁更水,实在没用什么意义。比如,日本队在和中国队的比赛中仅仅拿了44分,其中有一分好像还有朱婷让她们1分让她们别太丢脸的意味。但是,阿根廷打中国队也拿了43分。所以,她们在中国队面前都很水,要搞所谓的脱水就应当把她们都应当请出去。而真正对中国形成了一定威胁的球队倒是巴西队和荷兰队。中国在打巴西时输了两局,在打荷兰时输了一局,并且在第4局15分左右还被荷兰仅仅咬住比分。所以,我也把从官网单项排名数据中整理出来的P3和W-P贴在此,供大家参考。


                    10楼2020-05-18 12:11
                    回复



                      11楼2020-05-18 12:13
                      回复



                        12楼2020-05-18 12:14
                        回复
                          从上面的数据看,中国队的问题依然是当朱婷对角主攻的进攻受到对手限制的时候就有可能丢局。另外,替补接应太弱,换下小宇后谁上去都打不开局面。奥运会推迟一年,国家队仍在集训,郎导也没有放送,相信,经过努力这样的问题是可以解决的。
                          忙着,本文暂时告一段落。但不排除有时间还会续写。


                          13楼2020-05-18 12:20
                          回复
                            正文写完,但有些意犹未尽。想想自小宇出山以来的那些非议,数据打脸还是要打的。
                            标题一,关于16年奥运会上小宇表现的那些胡说八道。
                            1)小宇在接应位置打不下去了,所以宝宝就来打接应了。

                            张常宁打接应是从小组赛第4场开始的,应当是和杨方旭受伤有关。但是,非要说小宇打不下去了,那是不是也该看看上面的数据。净胜分多且扣球效率高的倒打不下去了,什么话?如果此逻辑成立,那净胜分少,是不是在自己原来的位置也真的打不下去了。干嘛不把话说完整。而且,一直到奥运会小组赛结束这种局面都没用什么改变,干嘛要来个
                            2)宝宝打接应是终极手段,只要她打上这个位置,别人就别想把她踢下去。
                            真的吗?别说比赛不是这样的,就连数据也不支持这种说法。其实到最后,打完整个奥运会比赛,宝宇的净胜分和扣球效率也就是下面这个样子。

                            事实求是一点儿多好。其实就是姐俩差不多,都有好是时候,也有不好的时候。


                            14楼2020-05-18 12:50
                            收起回复


                              IP属地:四川15楼2020-05-18 12:54
                              回复