真球迷:英超比赛更激烈我用统计数据来聊聊

  

真球迷:英超比赛更激烈我用统计数据来聊聊

   如下图所示,北美的四大联赛(Big 4:棒球MLB,篮球NBA,橄榄球NFL,冰球NHL)球队胜率的频率峰值(也就是胜率的中位数)都集中在了直线右侧的部分,这就是标准的negative skew。 在文山去年7月份发表的一篇文章中,我已经把英超的收入分配制度(revenue distribution)介绍过了。这里稍微提一下:根据球队排名,转播次数决定各球队分得多少,除此之外每只球队还能拿到相同的,固定量的一笔收入。英超联赛的确在很努力缩小差距,保持各球队的竞技性。除了进一步完善收入分配制度,这几年英超也逐渐开始化财力优势为青训优势,帮助球队进入一个良性循环(参见去年8月22日的“真球迷”专栏),保障球队有稳定征战英超的后备力量,而且效果也挺不错(本届欧洲杯英格兰人才辈出,霍太公深陷甜蜜的烦恼)。 这是一个令我耳目一新的统计,原文作者在这里强调了统计学中一个重要的概念:positive or negative skew(积极或消极的斜率)。 如图所示(away/same表示远离50%或保持上一年的胜率不变;towards表示胜率趋近于50%),09-01 2019 期待新电影上映! #郑雨盛 #郭度沅 #柳演锡 #铁雨 #铁雨2 #首脑会谈由杨宇硕导演执导,郑雨盛、郭度沅主演电影《铁雨》,... 文儿称在线下见众主播,称自己住的100多平的房子,遭到 英超直播_360英超直播吧_360绿色_转播权 期待新电影上映! #郑雨盛 #郭度沅 #柳演锡 #铁雨 #铁雨2 #首脑会谈由杨宇硕导演执导,郑雨盛、郭度沅主演电影《铁雨》,... 文儿称在线下见众主播,称自己住的100多平的房子,遭到 查看详情美国的四大联赛胜率的同比变化中,胜率不变或远离50%的球队占了30%多。 如图所示,用饼图(pie chart)来表示胜率的分布也是不错的选择。胜率为0.3-0.5的球队占了53%,胜率大于0.5小于0.7的占了31%,胜率大于0.7的占了12%,胜率低于0.3的占了4%。以上的四个数据间接地反映了这几条信息:踢得非常糟糕的球队少于有着极强实力的球队;联赛在不失去其公平性的情况下显得十分有趣;大部分球队的胜率趋近于平均值;但也有少数球队表现很突出,能够赢得较多的比赛。 当然了以上的内容只是在文字方面介绍英超的激烈,文山偶然看到了一位美国作者和英国网站Statsbomb小编合写的一篇文章,上面从数学角度简短的谈了谈英超为什么会好看。 (注:本文只引用了Statsbomb网站的数据,并不是翻译,楼主观点和原文作者观点出入很大,只有部分相同。原文网址:。) 论比赛感受,本赛季埃弗顿与斯托克城的3-3,曼联与纽卡斯尔的3-3,切尔西与埃弗顿的3-3令人难忘,还有红军球迷忘不了的那一场考验心脏的5-4,精彩的比赛,令人叹为观止的神仙球,数不胜数; 论经济贡献,13-14赛季,英超球队创造了33.6亿英镑的总增加值,英国每在体育方面创造10英镑的GDP,英超联赛直接参与了1英镑; 论竞技水平,尽管这几年有所下滑,但英超球队的欧战积分在08/09赛季与12/13赛季之间,都是领跑欧洲的。 论经济价值,英超在13-14赛季的球队总净利润达到了33亿英镑,仅次于美职棒(46亿英镑,30支球队)和超级碗(62亿英镑,32支球队),是世界上经济规模第三大的体育联赛; 升降级制度是足球联赛固有的一种模式,区别于美国的四大联赛。根据作者的统计发现,即使假设每年降级的3支球队有很好的发挥(也就是说都按照趋近胜率50%来计算),那么整体上胜率趋近50%的球队也只占了将近52%。升降级制度保证了这个联赛中总是有水平比较低的球队,也就是说保级球队和部分升班马影响了这个数据。如果联赛长期只有20支球队,并且不做球队的调整,可能球队间的差距会进一步缩小,在这个数据方面也能有很大进步。但现实不可能发生这种情况-更何况这里是英国,有着几十级联赛的足球大国。同时,英超球队的收入那是相当的多,没有升降级制度的刺激,球迷哪里会有更多的观赛乐趣,俱乐部哪里会有更多的上进心? 论联赛球迷数量,每年有6亿4千5百万户家庭收看英超联赛,有175个国家转播英超联赛; 首先阐述这个概念,的确很不好理解。为了搞明白这个方法,我特地参考了那位美国作者的原文:胜率50%是大多数球队渴望的美好数据,同理,理想状态下的联赛球队的胜率中位数就是50%,如果胜率的方差过大,这个联赛球队的差距就很大。但由于联赛中各支球队的实力每年都相对有变化,胜率也在发生不同的变化。有些球队的胜率越来越靠近50%,也有一些球队胜率远离50%,当然了还有极个别球队的胜率奇葩地连续两年不变的。 如图所示,相比起上一统计数据,英超球队在这一数据上的表现令人不是很满意。胜率远离50%的球队占了57%,胜率不变或趋近于50%的球队占了43%。似乎不同球队间有了明显的差距,但事实真的如此么? 如上图所示,在平面直角坐标系中,x轴代表球队在联赛中的胜率,y轴代表这样的胜率出现的频率。所以,高胜率(x50%)出现的频率越高,就说明这个联赛不是很健康,存在着弱肉强食的情况,也间接反映了这个联赛并不是场场激烈好看;而低胜率(x50%)出现的频率越高,就说明这个联赛肯定很有意思,而且竞争非常激烈。 为了便于统计,原网站的小编把英超联赛的平局算作每队半场胜利计算,统计数据起于2000-2001赛季。如图所示,英超球队胜率的频率峰值出现在直线与直线之间的部分(胜率的中位数准确值是x=0.4605, Xmin=0.1316,Xmax=0.8684,四分之一分位数是x=0.4079, 四分之三分位数是x=0.5921),正好契合positive skew。这也就是说明:英超球队的战绩很平均,强队可以横扫相对较弱队(利物浦6-0维拉,其他例子也有很多),弱队也可以撂倒相对较强队(西汉姆联2-0阿森纳,伯恩茅斯1-0切尔西),整个联赛之间不存在一支球队一骑绝尘的情况,也不存在第一集团统治天下的情况。这样的发展状况使得英超激烈无比,精彩纷呈。 【结语】 球迷们最乐意看到的事情是球队天天向上,在自己投入精力产出优秀青训球员的同时,也有计划地购买合理的球员。英超正在为了这一美好的竞技环境而努力,正如本赛季的宣传语所说:We all play. We all share. We all inspire. 但总之,英超的竞争环境相对公平,并且随着联赛的发展,会显得更加公平,更加有趣。 为了反映这个变化趋势,就有了Year on year reversion to the mean(year on year 指同比,意思就是今年第n月与去年第n月比;reversion指恢复,反转,这里意思是靠近或远离50%的不同趋势;mean,统计学中特指平均数,连在一起就是“胜率相比起平均值(50%)的同比变化”)。 通过以上的叙述,就不难发现英超球队在“胜率相比起平均值(50%)的同比变化”数据上为什么会落后于美洲的大型体育联赛了。