2023-5-8 18:16
如何给球员评级?基于有球非传统算法的实践(1)
系列介绍球员的评级从来没有标准答案,传统指标在解决这个问题时有各种问题,因为它们要么只关注罕见的行为,如射门和进球,要么忽略了行为发生的背景,如传球前是来自其他传球还是抢断。这里,我开始一个系列的文章,主要讲解一些论文里提出的思路和对比,并对他们的算法进行实现,基于 2022/23 赛季的数据,进行排名和拆解分析,并对比评级的算法结果和球迷/大V视角评价的区别。第一篇我会尝试解释论文:Actions Speak Louder than Goals: Valuing Player Actions in Soccer,下一篇会根据实际的数据结果,来讨论算法的应用Actions Speak Louder than Goals: Valuing Player Actions in Soccer概括大多数现有的评估足球行动的方法存在三个重要的局限性。很大程度上忽略了除进球和射门之外的其他动作,因为到目前为止,大多数工作都集中在进球预期价值的概念上。其次,现有的方法倾向于给每个动作分配一个固定的值,而不管该动作是在什么情况下完成的。例如,许多基于传球的指标对防守方在没有任何压力的情况下的传球和进攻方在对手重压下的传球进行类似处理。第三,大多数方法只考虑即时效果,而没有考虑到一个动作在稍后的时间内的效果。为了帮助填补客观量化球员表现的空白,本文提出了一个新的数据驱动的框架,以评估足球比赛中的行动。与大多数现有的工作不同,它包含了所有类型的动作(例如,传球、过人、运球、接球和射门),并考虑了这些动作发生的环境以及它们可能的长期影响。直观地说,一个行动的价值反映了该行动对比赛结果的预期影响。也就是说,一个价值为+0.05的行动预计将为实施该行动的球队带来0.05个进球,而一个价值为-0.05的行动预计将为他们的对手带来0.05个进球。这个框架就是 VAEP(Valuing Actions by Estimating Probabilities)框架。算法拆解VAEP(Valuing Actions by Estimating Probabilities)是一种数据驱动的框架,用于评估足球比赛中的行动。它考虑所有类型的行动(例如传球、过人、射门等),并考虑每个行动发生的环境以及可能的长期效果。行动的价值反映了该行动对比分的预期影响。VAEP的核心思想是,大多数足球比赛中的行动都是为了(1)增加进球的机会,或者(2)减少失球的机会。因此,评估一个行动的效果的一种方式是计算它在近期内如何改变进球和失球的机会。VAEP将行动的影响分为进攻价值和防守价值两部分,这两部分可能是不对称的,并且取决于上下文。具体来说,假设我们有每个比赛状态Si = [a1, ..., ai]的进球和失球的概率,其中h代表主队,v代表客队。Pscores(Si,h)和Pconcedes(Si,h)分别表示主队h在近期内进球和失球的概率。同样,Pscores(Si,v)和Pconcedes(Si,v)表示客队v在近期内进球和失球的概率。对于一个队伍来说,评估一个行动的价值需要评估行动ai将比赛从状态Si-1变为状态Si后,进球和失球概率的变化。队伍x(可以是主队h或客队v)进球概率的变化可以计算为:∆Pscores(ai,x) = Pscores(Si,x) - Pscores(Si-1,x)这个变化如果为正,表示该行动增加了队伍x进球的概率。我们称这个变化∆Pscores(ai,x)为行动ai对队伍x的进攻价值。同样,队伍x失球概率的变化可以计算为:∆Pconcedes(ai,x) = Pconcedes(Si,x) - Pconcedes(Si-1,x)这个变化如果为正,表示该行动增加了队伍x失球的概率。然而,所有的行动都应该旨在减少失球的概率。这就是为什么我们称这个变化的相反数-∆Pconcedes(ai,x)为行动ai对队伍x的防守价值。我们将公式1和公式2结合起来,得到一个行动的总VAEP值。行动的总VAEP值是该行动的进攻价值和防守价值的和:V(ai,x) = ∆Pscores(ai,x) + (-∆Pconcedes(ai,x))如何给球员评级?VAEP框架为每个行动分配一个值,我们可以将这些单个行动的值聚合成球员的评级。这个评级可以在多个时间粒度以及多个不同的维度上进行。球员的评级可以针对任何给定的时间框架进行,最自然的包括比赛中的一个时间窗口、一场完整的比赛或者一个完整的赛季。无论时间框架如何,我们都以相同的方式计算球员的评级。由于在场上的时间越长,有机会贡献的机会就越多,我们按每90分钟的比赛时间计算球员的评级。给定时间框架T和球员p,我们计算球员的评级为:ratinд(p) = 90/m * ∑ai ∈ATp V (ai)其中,ATp是球员p在时间框架T内执行的行动集,V (ai)根据定义1计算,m是球员在T期间比赛的分钟数。这个球员评级捕捉到了球员每90分钟对球队平均净进球差的贡献。此外,除了对所有行动进行求和,还可以按行动类型计算球员的评级。这允许构建一个球员的个人资料,可能有助于识别不同的比赛风格。总的来说,球员的评级可以根据使用情况沿着不同的维度进行计算。