XG、XT、XA……这些足球流行术语你都懂吗

text

预判威胁、宽度序列,这样的术语,你觉得应该属于哪个行业?当“预期进球”(expected Goals,简称XG)还属于媒体传播相对较新足球专业词汇时,XT(预判威胁,或者预期威胁)等,早已经是欧洲职业俱乐部的数据分析师们,日常使用的专业数据。

界外球也要量化分析

进行数据化分析的,不仅是那些欧冠常客的豪门俱乐部,哪怕是一些二三级联赛俱乐部,像英冠布伦特福德这种,都特别善于借助现代科技手段维持俱乐部运营。

他们早就进入了职业体育数据化分析和数据化管理的Moneyball时代——通过大数据采集,深度分析,得出来的从数字角度解析足球的新方式。

每个职业俱乐部,都会竭尽全力取得竞争方面的些许优势。在欧洲一度所向披靡的利物浦,就是这当中的一个杰出代表。就在界外球这一个细节上,利物浦从上季开始,就请到了一位叫托马斯·格罗内马克的专家来,在每一个细节上加深积累和优化,提高球队的竞争优势。

就界外球这一项指标的提升,让利物浦从上赛季在英超界外球抛出之后的控球成功率的联赛倒数第3位,上升到了全欧洲的第2位。

而过去3个赛季有一项数据指标,从最开始被怀疑甚至被嘲笑,而变得越来越被人所接受,那就是XG(expected goals),“预期进球”,或者“期待进球”。 这项数据刚出现时,经验主义的传统足球人士不屑一顾,认为进球能否产生,如何可能通过数据量化来“期待”?

但这一项数据,如今在衡量球队进攻机会方面,已经成为了高识别性术语,不光是媒体专家和评论员,球迷也开始越来越多地使用类似数据。

XG的运用,最早出现在2017-2018赛季英国BBC的《当日比赛》(MOTD)节目当中,用来衡量特定区域的射门得分可能。

这项数据背后,其实有着海量数据,对于不同球员不同球队不同场上位置,都有着精细分析。之所以迅速被广泛接纳,是因为XG确实对球队和球员射门得分可能,有了更量化的分析。

球员的每一组数据都将建模。

控球压力,清晰指导

XG只是职业足球数据的冰山一角,一些更深入、看似却更模糊的足球数据度量早已存在,例如防守压力。

压力这个概念,在竞赛过程中,很难用来被量化,而防守的很多数据,过往很容易被忽视,除了拦截和铲球。但这项“对于控球的压力”(pressures on the ball),能让观察者对球队的防守能力有了更好的认知。

所谓控球压力,度量的产生,是一个球员控球状态下,防守方队员逼近到2米范围内的状态,来进行部分衡量。根据英超本季前25轮的数据分析,曼城和利物浦是在对方半场施加防守压力最强的球队。

而在另一端,阿斯顿维拉和诺维奇,则是在本方禁区附近、遭受最大控球压力的球队。

个体球员的防守能力同样也可以用这项数据来分析。足球数据公司statsbomb,就提供个体球员施加“控球压力”的评估,像切尔西后腰坎特,平均每场比赛他能有3.2次成功的铲球和2次成功的断球,这是简单防守数据。

在“控球压力”这一项,坎特每场比赛能够给对手施加22次有效压力。这对于了解一个球员的活跃性、防守能力的特点,便具备了更深入一层的数据挖掘。

哪怕逐渐司空见惯的XG,也能在数据挖掘和提炼上,得出一些经验主义无法分析出来的内容:通过VR技术实现的一些球场位置和人体移动识别,能对防守队员站位,具备更清晰的区分,这样就能更明确地分析出,防守方是如何来应对所期待进球的。

这项数据的合理运用,能帮助进攻球员更科学地寻找防守方的弱点,也能帮助防守方通过对进攻方组合以及个体特点的分析,来实现更好的拦截防守。

许多俱乐部早已开始使用这样的深度数据知识,像曼城俱乐部在曼奇尼时代,就对防守球员有着清晰的数据使用指导。

前曼城右后卫理查兹,在曼奇尼麾下,每场比赛开始前,都会有俱乐部分析师拿着ipad,向他仔细讲述对方进攻队员的移动特点——数据经过量化归纳后,给球员传递的,是相对简单的应对方案建议。

精细化大数据,早已是现代足球的基本配置。

预判威胁,期待助攻

期待助攻(XA,expected assist),这项数据也在广泛扩散中。

助攻跟进球直接相关,通过计算,得出一名球员创造机会的能力、创造出来机会的优劣等级,能分析出球员在进攻中扮演的组织者角色。

数据分析公司Understat,在XA这一项上有经年积累。他们对英超本季的分析显示,截止到1月初,曼城的斯特林在XA数量上领先,但质量上相对落后——他能创造很多机会,不过最终形成助攻的比例——“期待助攻”和实际助攻的比例,是6比1。

这说明斯特林在最后一传的精度、与队友配合纯度上,还有很大的提高空间。

这项数据对于那些有创造性、场上使命更是助攻的球员来说,是非常直观的一种衡量标尺,因此以实际助攻数和“期待助攻数”两项相加,你会发现德布劳内仍然是英超最有创造力、最能够为队友创造得分机会的球员。排名第二的,是利物浦的阿诺德。

还有不少球员XA指数很高,但最终实际助攻数不是特别出色,这当中隐藏的因素,是队友得到高质量“期待助攻”后,在“期待进球”这一项上完成得不够理想。

这样的数据,属于更深一层的数据挖掘。“预判威胁”、“期待威胁”,这一项上数据的提炼难度非常高,因为这需要掌握更全面的数据和整体分析能力。

国际象棋比赛,只有最后将军那一步,才被认为是决定性的,但之前的优势累积,如足球比赛中的传球盘带、射门等“预判威胁”(expected threat),提炼出来后,对深入理解足球比赛的整体性,战术执行效果,乃至每一次球的移动、以及每一个不同球员操作的质量,都有了更精准的把控。

“预判威胁”的排名里,上季最有威胁的几位,分别是阿扎尔、德布劳内和马赫雷斯,此外也能找到伊沃比、特里皮尔的名字。

还有宽度序列(Width per sequence),如果大家观察瓜迪奥拉麾下的曼城,经常能看到在进攻当中,曼城会充分利用两条边路来拉松对手防线,边路下底之后,有很多和中路的衔接,最终进球往往能在小禁区射门完成。

Opta提炼的一项数据领域,就是宽度序列,来衡量一支球队平均进攻当中所使用的球场宽度,分析出球队两边路进攻的能力。这项指数,曼城当然领先,此外还有切尔西和布莱顿;纽卡斯尔、伯恩利和沃特福德,则是进攻最为狭窄的球队。

足球不是数字游戏,但是在科技加成之后,用数据深度、再深度地挖掘足球和各种职业体育竞技,对从业者提供的科学助力,史无前例。

(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)