篮球胜负概率如何计算?
这是一个值得让我吹一辈子的公式,这也是我在数学建模上最有成就感的时刻之一! 这个公式是我大学参加美赛(数学建模竞赛)时得到的,当时我和我队友花了四天时间终于弄出来这个公式,结果出来后我们队获得了二等奖(8%的获奖比例),也是当时我参加美赛的所有队伍里唯一一个做B题(数据挖掘)拿到名的。这个公式的核心就是利用贝叶斯定理来计算的。 首先我们来认识一下什么是贝叶斯定理 所谓贝叶斯定理简单来说就是在给定条件下,事件A发生的可能性大小。在统计学中经常用P(A|B)来表示,其中A称为随机变量,B为条件。 根据贝叶斯定理我们可以得到以下等式: P(A)=\int_a^b{f(x)}dx (1) 其中 f(x)=\frac{dP(x)}{d x} 为概率密度函数。 如果我们已经知道某件事情发生的可能性,也就是已知P(A),那么我们就可以利用贝叶斯定理反过来求条件B的概率,也就是 P(B\vert A)= \frac{P(A\vert B)P(B)}{P(A)} 上面等式(2)叫做贝叶斯公式。 接下来引入一个概念——后验概率。 后验概率是指在一个样本可能取自的总体中,对每个总体都赋予一个概率,并且这个概率与样本的大小成正比。记作 P(B\vert A)= \frac{P(A\vert B)P(B)}{\int^{a}_b {f(x) dx}} 由定义可以得到: P(B\vert A )\geqslant P(B) 等号当且仅当对任意一个总体,其所有子样都取自该总体且各个子样的概率分布完全相同的时候取到。 从定义可以看出,后验概率 P(B\vert A) 大于等于条件概率 P(B\vert A) 。如果两个概率相等,那么条件概率一定是后验概率。因此可以通过比较不同条件的概率的大小来得到哪个条件最有可能成立。
以上就是贝叶斯定理和后验概率的基本原理,接下来就可以用到这个定理来计算篮球比赛胜率的问题了。
假设两队打满四节,每节比分各20次,每球计一分,比赛共80分。那么整个比赛的随机变量可以描述为每一个可能的比分序列,即共有 C_{80}^{\sum_{i=1}^{4}{N_i}} 种结果,其中的 N_i 代表每一节的比分, C_{80} 表示80个球排列组合。而我们的目标是由最终的结果预测开始时两队的比分,即给定最终比分求起始比分。 首先我们考虑简单的情况,例如一场足球比赛,90分钟内两队进一球。这时整个比赛的随机变量可以描述为每一节各进球一次的所有可能情况,于是共有 C_{90}^{5} 种情况,其中 C_{90} 表示90分钟比赛进行顺序所有的可能。根据贝叶斯定理和概率的性质可以得到 最后一分钟进球率 和 整场比赛进球率的计算方法。 接着我们考虑更一般的情况,一场篮球比赛可能有好几分,每一分又有好几个回合,每个回合至少有两次投篮机会,每投不进加罚一次,每次发球加罚机会只有一次。现在问题的难度增加了,因为每一分每一回合对于总体而言都是独立的事件。为了简化模型我们先假设每一节只有第一次进攻有效,且只考虑加罚情况。此时整场篮球比赛可以看成是 80个独立的随机变量,每个变量代表一个三分球或者两分球。假设每节进一球,共有 C_{80}^{4} 种情况。
基于上述分析,最后比分结果的计算就转化为求解 4 阶矩的问题。通过矩阵计算可得: P(X) = \begin{pmatrix} 3/7 & -6/7 \\ -6/7 & 5/7\\ \end{pmatrix} \cdot X+\begin{pmatrix} 0\\0 \end{pmatrix} \quad (X\in R^{80}) 其中 X 表示以最后一分钟作为起点至终点的得分, P(X) 表示从初始状态到达终点 X 的可能路径个数。 最后我们可以通过求解矩阵方程的方法求出 P(X) 的数值解。
这里需要提醒的是由于矩阵方程的解存在多个,因此需要事先确定哪一个解才是正确的。一般来说可以采用试错的方法,也可以由数学期望、方差等性质判断哪一个是合理的。一旦找到正确的数值解我们就得到了开始时的比分。